解码阿里数据:对外数据产品也浮出水面 2014-05-21 大数据时代,阿里巴巴[微博]集团是最有资本进行烂漫遥想的公司之一,阿里数据平台事业部的服务器上,攒下了超过100PB已“清洗”的数据。 马云[微博]曾在2012年公开宣称,“平台、数据、金融”是阿里集团和阿里小微集团未来的指导路线。在此前后 ...
分类:
其他好文 时间:
2016-11-28 00:15:57
阅读次数:
235
分布式系统实践 1. 大数据时代快速SQL引擎-Impala http://dwz.cn/4G9mvt 摘要: 在Dremel论文发表之后,开源社区涌现出了一批基于MPP架构的SQL-on-Hadoop(HDFS)查询引擎,典型代表有Apache Impala、Presto、Apache Drill ...
分类:
其他好文 时间:
2016-11-26 11:23:53
阅读次数:
245
核心提示:互联网和大数据结合,对金融的帮助是,第一是掌握现金流,第二是掌握物流,第三则是可掌握信息流 阿里的马云曾表示,在大家还没搞清楚PC时代的时候,移动互联网就来了,而在大家还没搞清楚移动互联网的时候,大数据时代又来了。随着近日国内移动数据服务平台TalkingData宣布其已获得来自北极光创投 ...
分类:
其他好文 时间:
2016-11-24 15:57:35
阅读次数:
225
今天我们来聊一聊关于 聚簇索引和非聚簇索引的问题; 刚开始学数据库SQL的时候,就知道有主键啊(Primary-key),外键啊(Foreign-key)啥的,连个表查询就已经不清楚是要on 那几个字段了,在数据量不太大的情况下,根本不会考虑索引的问题了,然后,随着大数据时代的到来,数据量大了,没有 ...
分类:
其他好文 时间:
2016-11-19 15:40:14
阅读次数:
216
一、前言 上一篇博文讲解了Zookeeper的典型应用场景,在大数据时代,各种分布式系统层出不穷,其中,有很多系统都直接或间接使用了Zookeeper,用来解决诸如配置管理、分布式通知/协调、集群管理和Master选举等一系列分布式问题。 二、 Hadoop Hadoop的核心是HDFS(Hadoo ...
分类:
其他好文 时间:
2016-11-17 00:36:10
阅读次数:
178
前言 本篇文章继续我们的微软挖掘系列算法总结,前几篇文章已经将相关的主要算法做了详细的介绍,我为了展示方便,特地的整理了一个目录提纲篇:大数据时代:深入浅出微软数据挖掘算法总结连载,有兴趣的童鞋可以点击查阅,本篇我们将要总结的算法为:Microsoft顺序分析和聚类分析算法,此算法为上一篇中的关联规 ...
分类:
编程语言 时间:
2016-11-14 09:53:02
阅读次数:
279
前言 本篇文章继续我们的微软挖掘系列算法总结,前几篇文章已经将相关的主要算法做了详细的介绍,我为了展示方便,特地的整理了一个目录提纲篇:大数据时代:深入浅出微软数据挖掘算法总结连载,有兴趣的童鞋可以点击查阅,在开始Microsoft 神经网络分析算法之前,本篇我们先将神经网络分析算法做一个简单介绍, ...
分类:
编程语言 时间:
2016-11-14 09:49:01
阅读次数:
275
前言 有段时间没有进行我们的微软数据挖掘算法系列了,最近手头有点忙,鉴于上一篇的神经网络分析算法原理篇后,本篇将是一个实操篇,当然前面我们总结了其它的微软一系列算法,为了方便大家阅读,我特地整理了一篇目录提纲篇:大数据时代:深入浅出微软数据挖掘算法总结连载,我打算将微软商业智能中在DM这块所用到的算 ...
分类:
编程语言 时间:
2016-11-14 09:48:10
阅读次数:
324
本文原文地址:(原创)大数据时代:基于微软案例数据库数据挖掘知识点总结(结果预测篇) 前言 本篇文章主要是继续前几篇微软数据挖掘算法:Microsoft 决策树分析算法(1)、微软数据挖掘算法:Microsoft 聚类分析算法(2)、微软数据挖掘算法:Microsoft Naive Bayes 算法 ...
分类:
编程语言 时间:
2016-11-12 09:33:06
阅读次数:
304
大数据行业人士必知10大数据思维原理 大数据思维原理是什么?简单概括为10项原理,当样本数量足够大时,你会发现其实每个人都是一模一样的。 一、数据核心原理 从“流程”核心转变为“数据”核心 大数据时代,计算模式也发生了转变,从“流程”核心转变为“数据”核心。Hadoop体系的分布式计算框架已经是“数 ...
分类:
其他好文 时间:
2016-11-11 11:44:51
阅读次数:
139