大数据是一系列技术的统称,经过多年的发展,大数据已经形成了从数据采集、整理、传输、存储、安全、分析、呈现和应用等一系列环节,这些环节涉及到诸多大数据工作岗位,这些工作岗位与物联网、云计算也都有密切的联系。Hadoop是一个由Apache基金会所开发的分布式系统基础架构,是用Java语言开发的一个开源分布式计算平台,适合大数据的分布式存储和计算平台。广义上讲,大数据是时代发展和技术进步的产物。Had
分类:
其他好文 时间:
2019-06-27 12:17:57
阅读次数:
107
选择用于桥接模式下的虚拟交换机,并且要选择对应的有线或者无线的网卡,如果主机是插网线联网的,那就选择有线网卡,如果主机是连无线网络的就选择无线网卡。 什么是桥接模式?桥接模式就是将主机网卡与虚拟机虚拟的网卡利用虚拟网桥进行通信。在桥接的作用下,类似于把物理主机虚拟为一个交换机,所有桥接设置的虚拟机连... ...
分类:
其他好文 时间:
2019-06-21 13:05:56
阅读次数:
112
大数 据 主要 具有 四方 面的 典型 特征—— 规模 性( Volume)、 多样性( Variety)、 高速 性( Velocity) 和 价值 性( Value), 即 所谓 的" 4V"。 大数据时代的关键技术:(1) 大数 据 采集 技术(2) 大 数据 预处理 技术(3) 大数 据 存... ...
分类:
其他好文 时间:
2019-05-03 18:46:39
阅读次数:
288
J 为了满足日益增长的业务变化,京东的京麦团队在京东大数据平台的基础上,采用了hadoop等热门的开源大数据计算引擎,打造了一款为京东运营和产品提供决策性的数据类产品-北斗平台。 一、Hadoop的应用业务分析 大数据是不能用传统的计算技术处理的大型数据集的集合。它不是一个单一的技术或工具,而是涉及 ...
分类:
其他好文 时间:
2019-04-23 15:43:25
阅读次数:
177
【目的】:学习大数据 在此记录搭建大数据的过程。 【系统环境】 宿主机操作系统:Win7 64位 虚拟机软件:Vmware workstation 12 虚拟机:Ubuntu 16 64位桌面版 【搭建过程】 一、准备 1、安装文件准备 Hadoop软件: JDK: Ubuntu 16的安装软件 2 ...
分类:
系统相关 时间:
2019-01-17 15:12:57
阅读次数:
220
一、Hadoop的应用业务分析大数据是不能用传统的计算技术处理的大型数据集的集合。它不是一个单一的技术或工具,而是涉及的业务和技术的许多领域。目前主流的三大分布式计算系统分别为:Hadoop、Spark和Strom:Hadoop当前大数据管理标准之一,运用在当前很多商业应用系统。可以轻松地集成结构化、半结构化甚至非结构化数据集。Spark采用了内存计算。从多迭代批处理出发,允许将数据载入内存作反复
分类:
其他好文 时间:
2018-12-30 12:51:29
阅读次数:
204
一、概述 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。是一个能够对大量数据进行分布式处理的软件框架。由Java开发,但开发其应用可以使用多种语言,C,C++,跨平台性非常好。 两大核心:解决了分布式存储和分布式处理两大问题 Hadoop 2.0 (Apache免费开源,企业版可 ...
分类:
其他好文 时间:
2018-12-26 00:29:57
阅读次数:
232
大数据概念 大数据(big data,mega data),或称巨量资料。比如TB、PB级别的数据。 5V volume 大量 velocity 高速 variet 多样 value 价值密度低 veracity 真实 大数据价值 数据量达到一定程度,数据本身也可以说话,数据被誉为新的生产力 当数据 ...
分类:
其他好文 时间:
2018-12-20 14:25:43
阅读次数:
161
1.简介Hadoop是一款开源的大数据通用处理平台,其提供了分布式存储和分布式离线计算,适合大规模数据、流式数据(写一次,读多次),不适合低延时的访问、大量的小文件以及频繁修改的文件。*Hadoop由HDFS、YARN、MapReduce组成。Hadoop的特点:1.高扩展(动态扩容):能够存储和处理千兆字节数据(PB),能够动态的增加和卸载节点,提升存储能力(能够达到上千个节点)2.低成本:只需
分类:
其他好文 时间:
2018-11-26 20:01:57
阅读次数:
198