spark笔记big dataspark 比较Hadoop生态圈:MapReduce Hive Storm Yarn Sqoop Flume HDFSSpark它会代替Hadoop:不能,可能会替代MR炒作 社区比较完善hadoop3.0作者:Doug cutting(hadoop以后也要走内存)S... ...
分类:
其他好文 时间:
2017-04-27 17:48:36
阅读次数:
242
摘要: Hive灵活易用且易于维护,十分适合数据仓库的统计分析,什么样的结构让它具备这些特性?我们如何才能灵活操作hive呢? 博主福利 给大家推荐一套hadoop视频课程 [百度hadoop核心架构师,首次内部分享的企业级项目视频,价值3980元] 免费赠送100份,先到先得。联系老师微信gans ...
分类:
其他好文 时间:
2017-04-25 14:59:50
阅读次数:
216
基数排序 一、 什么叫基数 在数学上,基数(cardinal number)是集合论中刻画任意集合大小的一个概念。两个能够建立元素间一一对应的集合称为互相对等集合。根据对等这种关系对集合进行分类,凡是互相对等的集合就划入同一类。这样,每一个集合都被划入了某一类。任意一个集合A所属的类就称为集合A的基 ...
分类:
编程语言 时间:
2017-04-24 12:26:13
阅读次数:
195
一.UDID(Unique Device Identifier) UDID是Unique Device Identifier的缩写,中文意思是设备唯一标识. 在很多需要限制一台设备一个账号的应用中经常会用到,在Symbian时代,我们是使用IMEI作为设备的唯一标识的,可惜的是Apple官方不允许开 ...
分类:
移动开发 时间:
2017-04-20 09:59:59
阅读次数:
345
Centos共享文件夹操作流程 一、 安装VMware Tools VMwareTools的安装脚本是要使用到perl的,而CentOS 6自身不带perl,所以需要自己安装。可以自己下载源代码编译,也可以直接用yum来安装。 yum install perl 2、虚拟机工具栏-》虚拟机-》安装VM ...
分类:
其他好文 时间:
2017-04-18 15:10:26
阅读次数:
189
$ git init // 初始化一个Git仓库$ git status // 查看仓库的状态$ git add . // 将所有修改添加到暂存区$ git add * // Ant风格添加修改$ git add *Controller // 将以Controller结尾的文件的所有修改添加到暂存区 ...
分类:
其他好文 时间:
2017-04-16 15:11:26
阅读次数:
159
转载请注明出处http://blog.csdn.net/zhonghuan1992 pip介绍与使用 By 钟桓 10月 1 2014 更新日期:10月 1 2014 文章文件夹 1. 介绍2. 安装pip3. 升级pip4. 安装包5. 參考资料 介绍 pip 是一个安装和管理 Python 包的 ...
分类:
其他好文 时间:
2017-04-15 21:47:49
阅读次数:
223
spark shuffle流程分析 回到ShuffleMapTask.runTask函数 如今回到ShuffleMapTask.runTask函数中: overridedef runTask(context:TaskContext): MapStatus = { 首先得到要reduce的task的个 ...
分类:
其他好文 时间:
2017-04-14 09:31:34
阅读次数:
332
假设X服从标准正态分布N(0,1),Y服从χ2(n)分布,那么Z=X/sqrt(Y/n)的分布称为自由度为n的t分布,记为 Z~t(n)。 1.以0为中心,左右对称的单峰分布; 2.t分布是一簇曲线,其形态变化与n(确切地说与自由度df)大小有关。 自由度df越小,t分布曲线越低平;自由度df越大, ...
分类:
其他好文 时间:
2017-04-14 00:10:49
阅读次数:
328
HDU 1043 Eight(八数码) Time Limit: 10000/5000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) Problem Description - 题目描述 HDU 1043 Eight(八数码) T ...
分类:
其他好文 时间:
2017-04-12 20:49:31
阅读次数:
236