一、词频统计: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words flatmap() 3.全部转换为小写 lower() 4.去掉长度小于3的单词 filter() 5.去掉停用词 6.转换成键值对 map() 7.统计词频 reduceByKey() 二、学生课程分 ...
分类:
其他好文 时间:
2021-04-07 10:40:25
阅读次数:
0
1. 2.十进制转换二进制:除二取余 二进制转换十进制:乘二取整 3. 255-0xff 127-0x7f 4. 整型 5.内存是由一个个存储单元构成, 6.sizeof 关键字 计算变量或数据类型所占的字节个数 7.const int max=10; 全局常变量,具有类型 会开辟空间 #defin ...
分类:
编程语言 时间:
2021-04-07 10:32:01
阅读次数:
0
一、词频统计: 1.读文本文件生成RDD 2.将文本分割成单词 words 3.全部转换为小写 4.去掉长度小于3的单词 5.去掉停用词 6.转换成键值对 map() 7.统计词频 reduceByKey() 二、学生课程分数 groupByKey() -- 按课程汇总全总学生和分数 1. 分解出字 ...
分类:
其他好文 时间:
2021-04-06 15:20:05
阅读次数:
0
开机时默认会显示锁屏,需要动一下键盘才能切到输入密码界面,感觉比较繁琐,那么如何直接进入输入密码界面? win+R,输入: gpedit.msc 设置步骤: ...
一、词频统计: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words flatmap() 3.全部转换为小写 lower() 4.去掉长度小于3的单词 filter() 5.去掉停用词 6.转换成键值对 map() 7.统计词频 reduceByKey() 二、学生课程分 ...
分类:
其他好文 时间:
2021-04-06 15:15:03
阅读次数:
0
1. 使用“WIN+R”打开运行对话框,输入“gpedit.msc”按下回车键打开本地组策略编辑器 2. 3. 设置完成,可以感觉到网速变快了。 ...
一、词频统计: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words flatmap() lines=sc.textFile("file:///usr/local/spark/mycode/wordcount/word.txt") words = lines.flatMa ...
分类:
其他好文 时间:
2021-04-06 15:08:22
阅读次数:
0
(1)前言:总结三次题目集的知识点、题量、难度等情况 第一次题目集 1,计算两个数的和 数据的输入及运算 2,电话键盘字母数字转换 数字与字符的相互转化,以及数据合法性检验 3,成绩分级管理 java中选择语句的运用 4,计算税率 java中选择语句的运用 5,计算钱币 数据运算 6,使用一维数组求 ...
分类:
其他好文 时间:
2021-04-06 15:05:32
阅读次数:
0
redis简介(nosql) 安装win:https://github.com/microsoftarchive/redis/releases/tag/win-3.2.100 redis是一个高性能的键值对key-value数据库 特征: 数据间没有必然的关联关系 内部采用单线程机制进行工作 高性能 ...
分类:
其他好文 时间:
2021-04-06 15:05:17
阅读次数:
0
一、filter,map,flatmap练习: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words 3.全部转换为小写 4.去掉长度小于3的单词 5.去掉停用词 二、groupByKey练习 6.练习一的生成单词键值对 7.对单词进行分组 8.查看分组结果 学生科目成绩 ...
分类:
其他好文 时间:
2021-04-06 15:04:43
阅读次数:
0