原文地址:https://blog.csdn.net/np4rHI455vg29y2/article/details/78954866 大数据平台是为了计算,现今社会所产生的越来越大的数据量,以存储、运算、展现作为目的的平台。大数据技术是指从各种各样类型的数据中,快速获得有价值信息的能力。适用于大数 ...
分类:
其他好文 时间:
2018-05-09 14:35:41
阅读次数:
165
项目实战案例:搜狗日志查询分析数据:一、电商大数据平台整体架构1、大数据(Hadoop、Spark、Hive)都是一种数据仓库的实现方式核心问题:数据存储、数据计算什么是数据仓库?传统的解决大数据的方式,就是一个数据库一般只做查询2、大数据平台整体的架构部署:Apache、Ambari(HDP)、CDH二、在项目中使用使用瀑布模型(软件工程:方法论)1、瀑布模型几个阶段?2、每个阶段完成的任务三、
分类:
其他好文 时间:
2018-05-06 16:22:50
阅读次数:
160
HDFS只是Hadoop最基本的一个服务,很多其他服务,都是基于HDFS展开的。所以部署一个HDFS集群,是很核心的一个动作,也是大数据平台的开始。 安装Hadoop集群,首先需要有Zookeeper才可以完成安装。如果没有Zookeeper,请先部署一套Zookeeper。另外,JDK以及物理主机 ...
分类:
其他好文 时间:
2018-04-30 13:32:41
阅读次数:
291
我这里搭建的是3节点,centos6.5的静态ip ,ssh免密码登录,防火墙关闭,时钟同步等等一些准备工作我这里就不多说了 我们可以进官网看看 https://www.cloudera.com/ 我们进来看看 https://www.cloudera.com/documentation.html ...
分类:
其他好文 时间:
2018-04-13 22:37:47
阅读次数:
1581
大数据平台粗略架构 数据仓库设计步骤 1、确定主题 主题与业务密切相关,所以设计数仓之前应当充分了解业务有哪些方面的需求,据此确定主题 2、确定量度 在确定了主题以后,我们将考虑要分析的技术指标,诸如年销售额之类。量度是要统计的指标,必须事先选 择恰当,基于不同的量度将直接产生不同的决策结果。 3、 ...
分类:
其他好文 时间:
2018-04-13 11:32:08
阅读次数:
1879