搜索关键字：大数据 spark 数据分析数据画像，搜索到23297个结果！码迷,mamicode.com！

Spark RDD编程

1. 准备文本文件从文件创建RDD lines=sc.textFile()筛选出含某个单词的行 lines.filter()lambda 参数：条件表达式 2. 生成单词的列表从列表创建RDD words=sc.parallelize()筛选出长度大于2 的单词 words.filter() 3. ...

分类：其他好文时间：2021-03-30 12:53:01 阅读次数：0

Spark RDD编程

1. 准备文本文件：从文件创建RDD lines=sc.textFile()：筛选出含某个单词的行 lines.filter()，lambda 参数：条件表达式： 2. 生成单词的列表：从列表创建RDD words=sc.parallelize()：筛选出长度大于2 的单词 words.fi ...

分类：其他好文时间：2021-03-29 12:46:01 阅读次数：0

03 Spark RDD基础编程

1. 准备文本文件从文件创建RDD lines=sc.textFile()筛选出含某个单词的行 lines.filter()lambda 参数：条件表达式 2. 生成单词的列表从列表创建RDD words=sc.parallelize()筛选出长度大于2 的单词 words.filter() ...

分类：其他好文时间：2021-03-29 12:45:18 阅读次数：0

Spark RDD编程

1.准备文本文件，从文件创建RDD lines=sc.textFile()，筛选出含某个单词的行 lines.filter()，lambda 参数：条件表达式 2.生成单词的列表，从列表创建RDD words=sc.parallelize()，筛选出长度大于2 的单词 words.filter() ...

分类：其他好文时间：2021-03-29 12:44:51 阅读次数：0

02 Spark RDD编程

1.准备文本文件,从文件创建RDD lines=sc.textFile(),筛选出含某个单词的行 lines.filter(),lambda 参数：条件表达式 2.生成单词的列表,从列表创建RDD words=sc.parallelize(),筛选出长度大于2 的单词 words.filter() ...

分类：其他好文时间：2021-03-29 12:30:29 阅读次数：0

03 Spark RDD编程基础

1. 准备文本文件从文件创建RDD lines=sc.textFile()筛选出含某个单词的行 lines.filter()lambda 参数：条件表达式 2. 生成单词的列表从列表创建RDD words=sc.parallelize()筛选出长度大于2 的单词 words.filter() ...

分类：其他好文时间：2021-03-29 12:04:28 阅读次数：0

awk 经典案例

1. awk命令解析： awk是一个强大的文本分析工具，相对于grep的查找，sed编辑，awk在其对数据分析并生成报告时，显得尤为强大；简单来说，awk就是把文件逐行的读入，（空格，制表符）为默认分隔符将每行切片，切开的部分再进行各种分析处理。 2.用法总览： 3.实例展示：（1）（2）（3 ...

分类：其他好文时间：2021-03-18 14:38:55 阅读次数：0

火焰图的使用和分析

一、火焰图的生成。 1、采集原始CPU消耗数据：perf record -e cpu-clodk -g -p 3578 -o perf.data，统计大概1-2分钟，ctrl+c中断即可。 2、使用perf script工具分析perf.data文件：perf script -i perf.dat ...

分类：其他好文时间：2021-03-17 15:10:21 阅读次数：0

有必要了解的大数据知识(二) Hadoop

前言接上文，复习整理大数据相关知识点，这章节从MapReduce开始... MapReduce介绍 MapReduce思想在生活中处处可见。或多或少都曾接触过这种思想。MapReduce的思想核心是“分而治之”，适用于大量复杂的任务处理场景（大规模数据处理场景）。 Map负责“分”，即把复杂的任务 ...

分类：其他好文时间：2021-03-17 15:09:28 阅读次数：0

中国DLP获Gartner认可！关于DLP应用，技术大咖齐成岳这样说

处在数字化时代的浪潮中，相信大家对于“数据”都不会陌生。无论对于企业还是个人，数据已经成为了数字化时代的“石油”。早在几年前马云就曾提出过一个观点——未来将会实现从IT时代向DT时代的变革。而在几年后的今天，我们切实感受到了大数据所带来的滚滚红利。 ? 在享受大数据红利的同时，也同样要注意数据的安全 ...

分类：其他好文时间：2021-03-17 14:23:44 阅读次数：0