微软在Ignite2019大会上正式发布了新一代数据库产品SQLServer2019。使用统一的数据平台实现业务转型SQLServer2019附带ApacheSpark和HadoopDistributedFileSystem(HDFS),可实现所有数据的智能化。SQLServer2019的亮点SQLServer是数据集成的中心。通过SQLserver和Spark为结构化和非结构化数据提供转型洞察力
分类:
数据库 时间:
2020-03-26 10:48:50
阅读次数:
131
https://blog.csdn.net/meihao5/article/details/81084876?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task ...
分类:
其他好文 时间:
2020-03-25 01:44:18
阅读次数:
49
真/假主语(形式主语/真正主语) (1)to 不定式或动名词可以在主语的位置上,但一般用it代替它作形式主语,这种情况it叫形式主语,也就是假主语。为什么使用假主语呢,通常是因为真主语实在太长,不适合在句子中都使用,所以使用假主语(形式主语)代替。 1)It‘s a great honor to b ...
分类:
其他好文 时间:
2020-03-25 01:00:55
阅读次数:
58
找出java进程id ps aux|grep xxxxxx 使用jstack命令打印线程堆栈信息 jstack 7363 java线程数统计 jstack 7363|grep java.lang.Thread.State: -c 线程各种状态统计 jstack 7363|grep java.lang ...
分类:
编程语言 时间:
2020-03-13 01:38:52
阅读次数:
87
把RDD写入到文本文件中 分布式文件系统HDFS的数据读写 JSON文件数据读写 (注scala 2.11.8运行不了) ...
分类:
其他好文 时间:
2020-03-10 21:53:58
阅读次数:
76
combineByKey(createCombiner, mergeValue, mergeCombiners, numPartitions=None, partitionFunc=<function portable_hash at 0x7f1ac7340578>) 它是一个泛型函数,主要完成聚合 ...
分类:
其他好文 时间:
2020-03-03 12:45:59
阅读次数:
89
https://www.cs.cornell.edu/~srm/publications/EGSR07-btdf.pdf http://jbit.net/~sparky/academic/mm_brdf.pdf https://digibug.ugr.es/bitstream/handle/1048 ...
分类:
其他好文 时间:
2020-03-02 22:51:12
阅读次数:
102
Spark 是基于内存的计算, 低延迟. Apache 基金会3大分布式系统开源项目 Hadoop, Spark, Storm (数据流) Spark 特点: 处理快, 容易使用(Java,Python,Scala,R). 通用性(包括SQL,机器学习, 流失计算), 运行模式多样 Spark生态系 ...
分类:
其他好文 时间:
2020-02-29 17:28:30
阅读次数:
94
这里所有算子均只适用于pairRDD。pairRDD的数据类型是(k,v)形式的键值对; PartitionBy(Partitioner) 对pairRDD进行分区操作,如果原有的partioner和现有的partioer是一致的话就不进行分区, 否则会生成ShuffleRDD,即会产生shuffl ...
分类:
其他好文 时间:
2020-02-24 19:02:26
阅读次数:
96