码迷,mamicode.com
首页 >  
搜索关键字:大数据 spark 数据分析 数据画像    ( 23297个结果
Spark RDD编程
1. 准备文本文件从文件创建RDD lines=sc.textFile()筛选出含某个单词的行 lines.filter()lambda 参数:条件表达式 2. 生成单词的列表从列表创建RDD words=sc.parallelize()筛选出长度大于2 的单词 words.filter() 3. ...
分类:其他好文   时间:2021-03-30 12:53:01    阅读次数:0
Spark RDD编程
1. 准备文本文件: 从文件创建RDD lines=sc.textFile(): 筛选出含某个单词的行 lines.filter(),lambda 参数:条件表达式: 2. 生成单词的列表: 从列表创建RDD words=sc.parallelize(): 筛选出长度大于2 的单词 words.fi ...
分类:其他好文   时间:2021-03-29 12:46:01    阅读次数:0
03 Spark RDD基础编程
1. 准备文本文件从文件创建RDD lines=sc.textFile()筛选出含某个单词的行 lines.filter()lambda 参数:条件表达式 2. 生成单词的列表从列表创建RDD words=sc.parallelize()筛选出长度大于2 的单词 words.filter() ...
分类:其他好文   时间:2021-03-29 12:45:18    阅读次数:0
Spark RDD编程
1.准备文本文件,从文件创建RDD lines=sc.textFile(),筛选出含某个单词的行 lines.filter(),lambda 参数:条件表达式 2.生成单词的列表,从列表创建RDD words=sc.parallelize(),筛选出长度大于2 的单词 words.filter() ...
分类:其他好文   时间:2021-03-29 12:44:51    阅读次数:0
02 Spark RDD编程
1.准备文本文件,从文件创建RDD lines=sc.textFile(),筛选出含某个单词的行 lines.filter(),lambda 参数:条件表达式 2.生成单词的列表,从列表创建RDD words=sc.parallelize(),筛选出长度大于2 的单词 words.filter() ...
分类:其他好文   时间:2021-03-29 12:30:29    阅读次数:0
03 Spark RDD编程基础
1. 准备文本文件从文件创建RDD lines=sc.textFile()筛选出含某个单词的行 lines.filter()lambda 参数:条件表达式 2. 生成单词的列表从列表创建RDD words=sc.parallelize()筛选出长度大于2 的单词 words.filter() ...
分类:其他好文   时间:2021-03-29 12:04:28    阅读次数:0
awk 经典案例
1. awk命令解析: awk是一个强大的文本分析工具,相对于grep的查找,sed编辑,awk在其对数据分析并生成报告时,显得尤为强大;简单来说,awk就是把文件逐行的读入,(空格,制表符)为默认分隔符将每行切片,切开的部分再进行各种分析处理。 2.用法总览: 3.实例展示: (1) (2) (3 ...
分类:其他好文   时间:2021-03-18 14:38:55    阅读次数:0
火焰图的使用和分析
一、火焰图的生成。 1、采集原始CPU消耗数据:perf record -e cpu-clodk -g -p 3578 -o perf.data, 统计大概1-2分钟,ctrl+c中断即可。 2、使用perf script工具分析perf.data文件:perf script -i perf.dat ...
分类:其他好文   时间:2021-03-17 15:10:21    阅读次数:0
有必要了解的大数据知识(二) Hadoop
前言 接上文,复习整理大数据相关知识点,这章节从MapReduce开始... MapReduce介绍 MapReduce思想在生活中处处可见。或多或少都曾接触过这种思想。MapReduce的思想核心是“分而治之”,适用于大量复杂的任务处理场景(大规模数据处理场景)。 Map负责“分”,即把复杂的任务 ...
分类:其他好文   时间:2021-03-17 15:09:28    阅读次数:0
中国DLP获Gartner认可!关于DLP应用,技术大咖齐成岳这样说
处在数字化时代的浪潮中,相信大家对于“数据”都不会陌生。无论对于企业还是个人,数据已经成为了数字化时代的“石油”。早在几年前马云就曾提出过一个观点——未来将会实现从IT时代向DT时代的变革。而在几年后的今天,我们切实感受到了大数据所带来的滚滚红利。 ? 在享受大数据红利的同时,也同样要注意数据的安全 ...
分类:其他好文   时间:2021-03-17 14:23:44    阅读次数:0
23297条   上一页 1 ... 20 21 22 23 24 ... 2330 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!