选择一个好的数据分析工具,就要明白分析什么数据,大数据要分析的数据类型主要有四大类: 1、交易数据(TRANSACTION DATA) 大数据平台能够获取时间跨度更大、更海量的结构化交易数据,这样就可以对更广泛的交易数据类型进行分析,不仅仅包括POS或电子商务购物数据,还包括行为交易数据,例如Web ...
分类:
其他好文 时间:
2016-11-10 14:03:26
阅读次数:
220
目录: 什么是大数据 Hadoop介绍-HDFS、MR、Hbase 大数据平台应用举例-腾讯 公司的大数据平台架构 “就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式……”。 大数据的4V特征-来源 公司的“大数据” 随着公司业务的增长,大量和 ...
分类:
其他好文 时间:
2016-11-06 19:53:35
阅读次数:
218
网易大数据平台的Spark技术实践 网易大数据平台的Spark技术实践 作者 王健宗 网易的实时计算需求 对于大多数的大数据而言,实时性是其所应具备的重要属性,信息的到达和获取应满足实时性的要求,而信息的价值需在其到达那刻展现才能利益最大化,例如电商网站,网站推荐系统期望能实时根据顾客的点击行为分析 ...
分类:
其他好文 时间:
2016-11-06 07:48:55
阅读次数:
317
Mlib机器学习库
1.1机器学习概念
机器学习有很多定义,倾向于下面这个定义。机器学习是对能通过经验自动改进的计算机算法的研究。机器学习依赖数据经验并评估和优化算法所运行出的模型。机器学习算法尝...
分类:
其他好文 时间:
2016-10-28 20:51:09
阅读次数:
268
今年9月份,数据秀(dataxiu.com)团队参与阿里和国家公共气象服务中心主办,浙江大学和阿里云承办的“公益云图数据可视化创新大赛”。 “公益云图数据可视化创新大赛”将融合开放气象、空气质量监测、企业排放和公共环境等领域的数据的,基于阿里云天池大数据平台开发一批关注环境公益的可视化技术,借助阿里 ...
分类:
其他好文 时间:
2016-10-23 18:12:23
阅读次数:
314
摘要:本文则主要介绍TalkingData在大数据平台建设过程中,逐渐引入Spark,并且以Hadoop YARN和Spark为基础来构建移动大数据平台的过程。 当下,Spark已经在国内得到了广泛的认可和支持:2014年,Spark Summit China在北京召开,场面火爆;同年,Spark ...
分类:
其他好文 时间:
2016-09-08 23:11:40
阅读次数:
214
在某大型公司做大数据四年多,一直在大数据门口转悠,感觉自己从未迈进去过这个大门。 数据清洗,降低二次开发成本,将传输的速度达到极致,同时做到不丢数据。说起来简单,但是放在四年前,从0做到1还是很不简单的。java、javascipt,tomcat,SSH,Hadoop,Mapreduce,spark ...
分类:
其他好文 时间:
2016-08-30 01:50:56
阅读次数:
226
先声明一点,本人写此文章初衷只为对前段时间的工作做些总结,并做个记录,以备日后查用,此外也顺便与他人分享一下。当然间接上也为阿里云的大数据平台做了个免费广告。以下开始正文。 首先进入数加服务的控制面板,在左侧的面板上点击“BI报表” 进入报表页后,在左侧面板上会有“数据源”和“数据集”。 目前支持的 ...
分类:
其他好文 时间:
2016-08-17 12:09:43
阅读次数:
2224
http://www.csdn.net/article/2015-09-21/2825759 李智慧(微博、LinkedIn),目前任职宅米网CTO,曾供职阿里巴巴与英特尔亚太研发中心,从事大型网站、分布式系统、大数据平台方面的研发工作。著有《大型网站技术架构 核心原理与案例分析》一书。 CSDN: ...
分类:
其他好文 时间:
2016-07-28 15:45:41
阅读次数:
159
原文地址:https://yq.aliyun.com/articles/57901?spm=5176.100239.blogcont57826.25.oaM83B
摘要: 在阿里巴巴在线在线技术峰会上的第三天,来自阿里云高级技术专家李金波为大家题为《企业大数据平台仓库架构建设思路》。本次分享中,李金波主要从总体思路、模型设计、数加架构、数据治理四个方面介绍了如何利用大数据平台的特性,...
分类:
其他好文 时间:
2016-07-22 19:18:18
阅读次数:
232