Apache Kylin 概述 https://www.cnblogs.com/xiaodf/p/11671095.html 1 Kylin是什么 今天,随着移动互联网、物联网、AI等技术的快速兴起,数据成为了所有这些技术背后最重要,也是最有价值的“资产”。如何从数据中获得有价值的信息?这个问题驱动 ...
分类:
Web程序 时间:
2019-10-20 21:35:59
阅读次数:
121
一:什么是ApacheHadoop呢? 首先来说Hadoop是一种分析和处理大数据的软件平台。是Apache的一个用Java语言所实现的开源软件的框架。 在大量计算机组成的集群当中实现了对于海量的数据行 的分布式计算。下面呢给大家用一句话描述一下。 二:文件存储 1、HDFS(Hadoop分布式文件 ...
分类:
其他好文 时间:
2018-11-16 23:36:01
阅读次数:
260
环境搭建 Hadoop集群搭建 写在前面,前面我们快速搭建好了centos的集群环境,接下来,我们就来开始hadoop的集群的搭建工作 实验环境 Hadoop版本:CDH 5.7.0 这里,我想说一下,我们我没有选择官方版本,是因为,cdh版本已经解决好了各个组件之间的依赖。因为,后面,我们还会使用 ...
分类:
其他好文 时间:
2018-10-31 15:37:14
阅读次数:
250
大数据这个词也许几年前你听着还会觉得陌生,但我相信你现在听到hadoop这个词的时候你应该都会觉得“熟悉”!越来越发现身边从事hadoop开发或者是正在学习hadoop的人变多了。作为一个hadoop入门级的新手,你会觉得哪些地方很难呢?运行环境的搭建恐怕就已经足够让新手头疼。如果每一个发行版hadoop都可以做到像大快DKHadoop那样把各种环境搭建集成到一起,一次安装搞定所有,那对于新手来说
分类:
其他好文 时间:
2018-10-25 22:12:57
阅读次数:
180
大数据hadoop入门之hadoop家族详解 大数据这个词也许几年前你听着还会觉得陌生,但我相信你现在听到hadoop这个词的时候你应该都会觉得“熟悉”!越来越发现身边从事hadoop开发或者是正在学习hadoop的人变多了。作为一个hadoop入门级的新手,你会觉得哪些地方很难呢?运行环境的搭建恐 ...
分类:
其他好文 时间:
2018-10-23 12:08:40
阅读次数:
242
按照时间的早晚从大数据出现之前的时代讲到现在。暂时按一个城市来比喻吧,反正Landscape的意思也大概是”风景“的意思。早在大数据概念出现以前就存在了各种各样的关于数学、统计学、算法、编程语言的研究、讨论和实践。这个时代,算法以及各种数学知识作为建筑的原料(比如钢筋、砖块),编程语言作为粘合剂(比 ...
分类:
其他好文 时间:
2018-09-27 17:05:00
阅读次数:
219
大数据这个词也许几年前你听着还会觉得陌生,但我相信你现在听到hadoop这个词的时候你应该都会觉得“熟悉”!越来越发现身边从事hadoop开发或者是正在学习hadoop的人变多了。作为一个hadoop入门级的新手,你会觉得哪些地方很难呢?运行环境的搭建恐怕就已经足够让新手头疼。如果每一个发行版hadoop都可以做到像大快DKHadoop那样把各种环境搭建集成到一起,一次安装搞定所有,那对于新手来说将是件多么美妙的事情!
分类:
其他好文 时间:
2018-07-17 16:25:56
阅读次数:
213
Hadoop家族的技术,网上资料多如牛毛,但是还是那句老话——好脑瓜不如烂笔头,看的再多也不如自己动手写一写。 Hadoop是一个分布式系统,有两个关键组件——HDFS和MapReduce,HDFS负责分布式文件存储,MapReduce是执行分布式任务的算法。 MapReduce只是一个分布式数据处 ...
分类:
其他好文 时间:
2018-07-02 19:28:10
阅读次数:
164
目录:.1.Hadoop家族产品2.Hadoop家族学习路线图Hadoop家族产品截止到2013年,根据cloudera的统计,Hadoop家族产品已经达到20个!接下来,我把这20个产品,分成了2类。?第一类,是我已经掌握的?第二类,是TODO准备继续学习的一句话产品介绍:?Apache?Hadoop:是Apache开源组织的一个分布式计算开源框架,提供了一个分布式文件系统子项目(HDFS)和支
分类:
其他好文 时间:
2018-05-06 17:04:27
阅读次数:
128
目录:.1.Hadoop家族产品2.Hadoop家族学习路线图Hadoop家族产品截止到2013年,根据cloudera的统计,Hadoop家族产品已经达到20个!接下来,我把这20个产品,分成了2类。?第一类,是我已经掌握的?第二类,是TODO准备继续学习的一句话产品介绍:?Apache?Hadoop:是Apache开源组织的一个分布式计算开源框架,提供了一个分布式文件系统子项目(HDFS)和支
分类:
其他好文 时间:
2018-05-06 17:03:49
阅读次数:
230