一、filter,map,flatmap练习: 1.读文本文件生成RDD lines lines = sc.textFile('file:///home/hadoop/word.txt') lines.collect() 2.将一行一行的文本分割成单词 words words=lines.flatM ...
分类:
其他好文 时间:
2021-04-01 13:07:18
阅读次数:
0
一、filter,map,flatmap练习: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words 3.全部转换为小写 4.去掉长度小于3的单词 5.去掉停用词 二、groupByKey练习 6.练习一的生成单词键值对 7.对单词进行分组 8.查看分组结果 学生科目成绩 ...
分类:
其他好文 时间:
2021-03-31 12:33:25
阅读次数:
0
一、filter,map,flatmap练习: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words 3.全部转换为小写 4.去掉长度小于3的单词 5.去掉停用词 6.练习一的生成单词键值对 ...
分类:
其他好文 时间:
2021-03-31 12:22:01
阅读次数:
0
一、filter,map,flatmap练习: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words 3.全部转换为小写 4.去掉长度小于3的单词 5.去掉停用词 6.练习一的生成单词键值对 最后相关文件已经保存。 ...
分类:
其他好文 时间:
2021-03-31 11:54:45
阅读次数:
0
1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words(map,flatmap) 3.全部转换为小写(lower()) 4.去掉长度小于3的单词(filter) 6.练习一的生成单词键值对(map) ...
分类:
其他好文 时间:
2021-03-31 11:48:28
阅读次数:
0
一、filter,map,flatmap练习: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words 3.全部转换为小写 4.去掉长度小于3的单词 5.去掉停用词 6.练习一的生成单词键值对 ...
分类:
其他好文 时间:
2021-03-31 11:44:46
阅读次数:
0
判断一个字符串是否包含重复字符。例如:“hello”就包含重复字符‘l’,而“world”就不包含重复字符有重复打印True ,没重复打印False 知识点: set ,len (1)set() 函数创建一个无序不重复元素集,可进行关系测试,删除重复数据,还可以计算交集、差集、并集等。 (2)len ...
分类:
编程语言 时间:
2021-03-30 13:32:53
阅读次数:
0
编写应用程序 EcmDef.java,接收命令行的两个参数, 要求不能输入负数,计算两数相除。对数据类型不一致(NumberFormatException)、缺少命令行参数(ArrayIndexoutOfBoundsException.除0(ArithmeticException)及输入负数(EcD ...
分类:
编程语言 时间:
2021-03-29 11:35:07
阅读次数:
0
前提 我是参考 Github Python 100 天的文章写的,再结合自己的小练习,总结 最近在面大厂,发现许多大厂都会问 Python 的多线程、多进程,所以我觉得很有必要总结学习下 什么是进程 操作系统中执行的一个程序,类似微信、QQ,每个程序都是一个进程 概念 它是 CPU 最小资源分配单元 ...
分类:
编程语言 时间:
2021-03-26 15:17:14
阅读次数:
0
do..while循环语句格式: 初始化语句; do{ 循环体语句; 控制条件语句: }whil(判断条件语句); 注意事项 while小括号的分号不可省略 do...while循环的循环体语句至少执行一遍。 /* 需求:用do...while循环模拟 联系知识点的过程 要求: 至少练习一次,并且练 ...
分类:
编程语言 时间:
2021-03-18 14:44:25
阅读次数:
0