码迷,mamicode.com
首页 >  
搜索关键字:大数据基础    ( 95个结果
【原创】大数据基础之Impala(1)简介、安装、使用
impala2.12 官方:http://impala.apache.org/ 一 简介 Apache Impala is the open source, native analytic database for Apache Hadoop. Impala is shipped by Cloude ...
分类:其他好文   时间:2019-01-21 15:59:03    阅读次数:147
【原创】大数据基础之Kudu(1)简介、安装
kudu 1.7 官方:https://kudu.apache.org/ 一 简介 kudu有很多概念,有分布式文件系统(HDFS),有一致性算法(Zookeeper),有Table(Hive Table),有Tablet(Hive Table Partition),有列式存储(Parquet),有 ...
分类:其他好文   时间:2019-01-21 13:46:36    阅读次数:110
【原创】大数据基础之Ambari(3)通过Ambari部署Airflow
ambari2.7.3(hdp3.1) 安装 airflow1.10 ambari的hdp中原生不支持airflow安装,下面介绍如何通过mpack方式使ambari支持airflow安装: 1 下载 # wget https://github.com/miho120/ambari-airflow- ...
分类:其他好文   时间:2019-01-17 22:42:51    阅读次数:334
【原创】大数据基础之Ambari(2)通过Ambari部署ElasticSearch
ambari的hdp中原生不支持elasticsearch安装,下面介绍如何通过mpack方式使ambari支持elasticsearch安装 安装过程 1 下载 Mpack include version 6.3.2 of ElasticSearch, Logstash, Kibana, File ...
分类:其他好文   时间:2019-01-17 14:00:01    阅读次数:769
【原创】大数据基础之Ambari(1)简介、安装、使用
官方:http://ambari.apache.org/ The Apache Ambari project is aimed at making Hadoop management simpler by developing software for provisioning, managing, ...
分类:其他好文   时间:2019-01-15 14:26:50    阅读次数:421
大数据学习路线及各阶段学习书籍推荐
大数据学习路线及各阶段学习书籍推荐!废话不多说,直接切入主题,有需要的小伙伴可以参考学习! 阶段一、大数据基础——java语言基础方面 (1)Java语言基础 Java开发介绍、熟悉Eclipse开发工具、Java语言基础、Java流程控制、Java字符串、Java数组与类和对象、数字处理类与核心技 ...
分类:其他好文   时间:2019-01-08 17:48:54    阅读次数:118
【原创】大数据基础之Spark(7)spark读取文件split过程(即RDD分区数量)
spark 2.1.1 spark初始化rdd的时候,需要读取文件,通常是hdfs文件,在读文件的时候可以指定最小partition数量,这里只是建议的数量,实际可能比这个要大(比如文件特别多或者特别大时),也可能比这个要小(比如文件只有一个而且很小时),如果没有指定最小partition数量,初始 ...
分类:其他好文   时间:2018-12-28 21:13:37    阅读次数:214
中国电子信息产业发展研究院主办的2018中国软件大会上大快搜索“又双叒叕”获奖了
大快搜索自荣获“2018中国大数据企业50强”殊荣,12月20日在由工信部指导,中国电子信息产业化发展研究院主办的2018中国软件大会上,大快搜索获评“2018中国大数据基础软件领域领军企业”称号,入选中国数字化转型TOP100服务商,《城市数据运河》获评优秀政务大数据解决方案。图:工业和信息化部信息化和软件服务业司司长在会上致辞图:大快搜索获评“2018中国大数据基础软件领域领军企业”在本届20
分类:其他好文   时间:2018-12-24 11:17:46    阅读次数:143
大数据产业发展创新技术新书《数据之翼》收录自然语言处理工具HanLP
在12月20日由中国电子信息产业发展研究院主办的2018中国软件大会上,大快搜索获评“2018中国大数据基础软件领域领军企业”,并成功入选中国数字化转型TOP100服务商。图:大快搜索获评“2018中国大数据基础软件领域领军企业”在本届2018中国软件大会上,不仅宣传并成立了数字转型促进会,还发布了由中国大数据产业生态联盟副秘书长、《软件和集成电路》杂志社总编辑郭嘉凯编辑的新书——《数据之翼-引领
分类:编程语言   时间:2018-12-24 11:16:09    阅读次数:188
【原创】大数据基础之Spark(4)RDD原理及代码解析
一 简介 spark核心是RDD,官方文档地址:https://spark.apache.org/docs/latest/rdd-programming-guide.html#resilient-distributed-datasets-rdds官方描述如下:重点是可容错,可并行处理 Spark r ...
分类:其他好文   时间:2018-12-20 21:35:21    阅读次数:159
95条   上一页 1 2 3 4 5 6 ... 10 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!