编者按:本文是松子(李博源)的大数据平台发展史系列文章的第二篇(共四篇),本系列以独特的视角,比较了非互联网和互联网两个时代以及传统与非传统两个行业。是对数据平台发展的一个回忆,对非互联网、互联网,从数据平台的用户角度、数据架构演进、模型等进行了阐述。 前言,本篇幅将进入大家熟知的互联网时代,数据平 ...
分类:
其他好文 时间:
2019-04-11 14:32:55
阅读次数:
129
编者按:本文是松子(李博源)的大数据平台发展史系列文章的第四篇(共四篇),本系列以独特的视角,比较了非互联网和互联网两个时代以及传统行业与非传统行业。是对数据平台发展的一个回忆,对非互联网、互联网,从数据平台的用户角度、数据架构演进、模型等进行了阐述。 在互联网时代被弱化的数据模型 谈起数据模型就不 ...
分类:
其他好文 时间:
2019-04-11 14:28:53
阅读次数:
133
淘宝网拥有国内最具商业价值的海量数据,而帮助消费者进行理性的购物决策,是淘宝数据平台与产品部的使命。为此,我们进行了一系列数据产品的研发,比如为大家所熟知的量子统计、数据魔方和淘宝指数等。本文将以数据魔方为例,向大家介绍淘宝在海量数据产品技术架构方面的探索。 按照数据的流向来划分,我们把淘宝数据产品 ...
分类:
其他好文 时间:
2019-04-07 10:07:16
阅读次数:
189
电竞出现在人们视野中的频率越来越高了,此次选取FunData作为电竞数据平台,v1.0 beta版本主要提供由Valve公司出品的顶级MOBA类游戏DOTA2相关数据接口(详情:open.varena.com)。 本文将介绍FunData的架构演进中的设计思路及其涉及的相关技术,包括大数据流处理方案 ...
分类:
其他好文 时间:
2019-04-07 09:56:32
阅读次数:
153
![](https://s1.51cto.com/images/blog/201903/17/d45f585c1db1764443f01a719bc27f48.png?x-oss-process=image/watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3p
分类:
其他好文 时间:
2019-03-17 23:02:09
阅读次数:
187
淘宝网拥有国内最具商业价值的海量数据。截至当前,每天有超过30亿的店铺、商品浏览记录,10亿在线商品数,上千万的成交、收藏和评价数据。如何从这些数据中挖掘出真正的商业价值,进而帮助淘宝、商家进行企业的数据化运营,帮助消费者进行理性的购物决策,是淘宝数据平台与产品部的使命。 数据产品的一个最大特点是数 ...
分类:
其他好文 时间:
2019-03-16 23:19:06
阅读次数:
234
1. 环境准备 01, 安装包准备: Greenplum : >>>>链接地址 Pgadmin客户端 : >>>链接地址 greenplum-cc-web监控: >>>>链接地址 02,节点说明 03,host文件配置(All) 04,创建用户(ALL) 05,内核参数修改(ALL) 06.打开数限 ...
分类:
其他好文 时间:
2019-03-13 12:21:29
阅读次数:
461
立的大数据实验室中,绝大多数采用产学研结合模式——高校与企业共建,在此浪潮中高校成为了国家大数据实验室的重要参与者,同时很多高校开设了大数据专业,大数据平台成为高校教育和科研的重要手段。那么,什么样的大数据平台能够满足高校建立大数据实验室,满足专业师生的教学、科研、实验等相关需求?具备快速交付大数据基础硬件环境的能力;面对教学实战中的多种大数据环境要求,具备按需部署、构建交付组合多样的大数据软件环
分类:
其他好文 时间:
2019-02-21 20:17:59
阅读次数:
224
阅读本文大概需要 2.8 分钟。 阅读本文大概需要 2.8 分钟。 阅读本文大概需要 2.8 分钟。 阅读本文大概需要 2.8 分钟。 来源:http://t.cn/E2TbCg5 一、需求 一个朋友接到一个需求,从大数据平台收到一个数据写入在20亿+,需要快速地加载到MySQL中,供第二天业务展示 ...
分类:
数据库 时间:
2019-02-17 00:40:54
阅读次数:
205
大数据平台CDH6.1.0安装配置标签(空格分隔):大数据平台构建一:关于CDH6.1.0的介绍二:系统环境初始化三:安装CDH6.1.0所需环境四:配置CDH6.1.0的cloudera-manager安装一:关于CDH6.1.0的介绍Cloudera在前天12月19日,对外宣布正式发布ClouderaEnterprise6.1包含大数据生态版本如下:1.组件版本:Kafka2.0,Spark2
分类:
其他好文 时间:
2019-02-16 17:07:41
阅读次数:
2028