随着物联网技术和应用的普及,以运营商、互联网以及实体经济行业为代表的企业产生了越来越多的数据,大数据的发展越来越蓬勃。 从2007年开始,大数据应用成为很多企业的需求,2012年兴起并产生了大数据平台,使用者主要是程序员;2013年到2017年间,数据逐渐增多,大数据平台变成了融合大数据平台,使用者 ...
分类:
其他好文 时间:
2019-07-08 13:29:41
阅读次数:
161
1. 数据的采集 智能安全帽,流数据,鉴于数据量大,应该是采集到云平台上,然后在云平台上对数据处理,是一种典型的物联网+大数据应用场景,考虑使用AWS或者阿里云,然后搭建Hadoop/Spark 环境,数据流可以用Kafka 来采集,也可以研究云提供商是否提供了类似的现成的环境 2. 数据的预处理 ...
分类:
其他好文 时间:
2019-06-19 23:16:36
阅读次数:
149
常用语言概述 PHP:中小型后台 scala:大数据 C++:应用软件 Java:大数据,后台(大型),Andriod Python:AI Java语言概述 Java基础是学习JavaEE、大数据、Android开发的基础 Java取消了强大又危险的指针 Java提供了自动内存管理机制,由垃圾回收器 ...
分类:
编程语言 时间:
2019-06-15 09:56:35
阅读次数:
113
随着饿了么在大数据应用的不断深入,需要解决任务数量增长快、任务多样化、任务关系复杂、任务执行效率低及任务失败不可控等问题。 饿了么大数据平台现状:每天完成大数据任务计算 54000+;节点集群 85 台。 开源解决方案 Ooize Ooize 基于工作流调度引擎,是雅虎的开源项目,属于 Java W ...
分类:
其他好文 时间:
2019-05-20 17:16:43
阅读次数:
109
hadoop的基本概念伪分布式hadoop集群安装hdfs、MapReduce演示互联网正在从IT走向DT时代。大数据应用分析1、统计类的分析2、推荐类的分析3、机器学习(分类,聚类)4、人工智能、预测(算法)一、什么是hadoop官网:http://hadoop.apache.orghadoop是apache旗下的一套开源软件平台。是一个可靠的、可扩展的、可分布式计算的开源软件。apacheha
分类:
其他好文 时间:
2019-04-19 12:11:49
阅读次数:
176
想飞就飞: 未来的软件开发不再是需求-分析-设计-实现的确定性过程,而是定义问题和目标,收集数据,提供数据,再由神经网络不断探索最优解的非确定性过程。 ...
分类:
其他好文 时间:
2019-03-27 12:50:46
阅读次数:
143
大数据落地必要可视化作者:未知 “在互联网+的大配景下,新奥能源正在思索将来经管的模式以及公司战略进级的偏向。我们必要打造出基于大数据驱动的智能运营系统,议决持续的大数据办理和大数据应用迭代,推动公司经管的厘革升迁和交易的立异成长。同时,针对付燃气财产的特点,我们但愿议决交易数据的深度发掘来保险公司 ...
分类:
其他好文 时间:
2019-03-21 19:59:41
阅读次数:
165
大数据应用中如何进行技术选型?影响选型有两个主要指标:性能,容量1.能够支持高并发下的请求的快速响应能力2.能够支持大存储和大检索3.要能够保证服务和存储的高可用 初期会进行多个同类型的技术进行对比和调研 Q::如何进行最终的定型?A:分析当前的业务,结合压测(而不是空洞的去想和纠结)来决定定型; ...
分类:
其他好文 时间:
2019-03-16 12:24:10
阅读次数:
144
分布式存储已经研究很多年,但直到近年来,伴随着谷歌、亚马逊和阿里等互联网公司云计算和大数据应用的兴起,它才大规模应用到工程实践中。如谷歌的分布式文件系统GFS、分布式表格系统googleBigtable,亚马逊的对象存储AWS,阿里的TFS等都是很好的代表,同时也催生了一大批优秀的开源分布式存储系统,包括ceph、swift、Lustre和glusterfs等。分布式存储系统分布式存储按其存储接口
分类:
其他好文 时间:
2019-02-27 20:41:33
阅读次数:
235
大数据现在是越来越火了,很多人都热衷于大数据的学习,也是因为当前大数据的应用领域有很多,那么大数据应用领域都有哪些呢?我们在这篇文章中给大家介绍一下这些内容。 ...
分类:
其他好文 时间:
2019-02-21 15:52:03
阅读次数:
207