将Spark on Kubernetes与阿里云深度整合,设计一个开箱即用的Spark on Kubernetes镜像。 ...
分类:
Web程序 时间:
2020-02-22 13:53:07
阅读次数:
74
引自[https://www.iteye.com/blog/langyu 992916] shuffle的意义有三点: 1.把map task端的数据完整传输到reduce task端 2.减少不必要的宽带消耗 3.减少磁盘IO消耗 首先把Shuffle理解为map的shuffle和reduce的s ...
分类:
其他好文 时间:
2020-02-20 13:13:52
阅读次数:
65
RDD 的操作函数(operation)主要分为2种类型 Transformation 和 Action. 在这里只读表示当你对一个 RDD 进行了操作,那么结果将会是一个新的 RDD, 这种情况放在代码里,假设变换前后都是使用同一个变量表示这一 RDD, RDD 里面的数据并不是真实的数据,而是一 ...
分类:
其他好文 时间:
2020-02-20 10:08:53
阅读次数:
70
昨天看个帖子微软市值超过1万亿美刀,凭什么?我们可以找出很多理由,但是我认为和阿三CEO的开源战略关系很大。从开源.net到WSL到微软云微软从昔日的开源死敌,到今天的怀抱开源。日前在Spark + AI峰会上,微软发布了开源的.NET for Apache Spark,从而在大数据领域又添加了一枝 ...
分类:
Web程序 时间:
2020-02-18 09:15:05
阅读次数:
238
说起国际的Hadoop认证必须提Hadoop商业化的三家马车:Hortonwork、Cloudera和MapR。Hortonwork、Cloudera合并之后由于版本的不同目前的考试认证还是分离的,如果你目前需要一个大数据方面的认证,那真的可以了解一下Cloudera。Cloudera总共4门认证,三门CCA,分别为CCA131、CCA159、CCA175;一门CCPDE。这四门认证是没有等级关系
分类:
其他好文 时间:
2020-02-17 17:56:00
阅读次数:
103
一、大数据spark 补写实验报告 学习 python 二、《一线架构师实践指南》阅读 阅读了最后一章 ...
分类:
其他好文 时间:
2020-02-15 23:20:51
阅读次数:
77
IPv6应用实验平台(以下简称“6Plat”)是由下一代互联网国家工程中心(CFIEC)发起的实验性的IPv6过渡技术测试平台。目的是为了推动IPv6应用落地,充实IPv6资源,加快IPv6过渡步伐。同时也为需要进行IPv6测试的企业和个人提供一个优质和开放的测试环境。 ◆“6Plat”集成了以下I ...
分类:
其他好文 时间:
2020-02-14 16:39:54
阅读次数:
565
今天准备安装了pyecharts,官网下载速度太慢了,下了半天还没有下载完成,简单了解了一下用pyecharts库画图的方法,继续配置eclipse的环境,因为停电的原因进度太慢了,明天继续努力。 ...
分类:
其他好文 时间:
2020-02-10 00:03:45
阅读次数:
69
今天弄了一下实验四shell的基础题 请到本教程官网的“下载专区”的“数据集”中下载 chapter5-data1.txt,该数据集包含 了某大学计算机系的成绩,数据格式如下所示: Tom,DataBase,80 Tom,Algorithm,50 Tom,DataStructure,60 Jim,D ...
分类:
其他好文 时间:
2020-02-09 16:11:23
阅读次数:
122
其实,一开始我应聘的是Spark,Hadoop这样的,然后后面呢,发现只有Java的业务给我写了,再后面我发现,公司招不到前端,所以前端要由后端来写,刺激!!!数据驱动首先要明白一个概念,那就是DOM其实是数据的一种映射,在之前jQuery的时代,当数据发生改变时,我们需要手动改变DOM,而Vue的... ...
分类:
其他好文 时间:
2020-02-04 11:01:46
阅读次数:
90