1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words flatmap() 3.全部转换为小写 lower() 4.去掉长度小于3的单词 filter() 5.去掉停用词 6.转换成键值对 map() 7.统计词频 reduceByKey() 8.按字母顺序排序 sortB ...
分类:
其他好文 时间:
2021-04-20 15:17:39
阅读次数:
0
方法 含义 备注 查询 select distinct name, id from table 对name一列去重 ...
分类:
数据库 时间:
2021-04-14 12:10:14
阅读次数:
0
二、学生课程分数案例 总共有多少学生?map(), distinct(), count() 开设了多少门课程? 每个学生选修了多少门课?map(), countByKey() 每门课程有多少个学生选?map(), countByValue() Tom选修了几门课?每门课多少分?filter(), m ...
分类:
其他好文 时间:
2021-04-13 12:24:49
阅读次数:
0
题目描述 A group of people are standing in a line. Each person has a distinct height. You would like to count the number of unordered pairs of people in t ...
分类:
其他好文 时间:
2021-04-13 12:06:43
阅读次数:
0
思路: 首先是子序列,所以说并不一定要求是连续的序列满足摆动序列。同时题目要求的是最长摆动子序列的长度。 动态规划 那么我们可以考虑通过记录摆动的长度得到,什么是摆动的长度呢?我们可以用up和down两个变量来记录摆动的次数,如果前一个差为正数,当前差为负,那么就是遇到了一个down,模拟往下摆动。 ...
分类:
其他好文 时间:
2021-04-10 13:10:26
阅读次数:
0
如果一个数组$[a_1,a_2,a_3,...,a_n]a_1=n-1$并且$a1>0$,这个数组就被叫为好数组,如果一个序列能正好分为多个好数组,ta就被叫为好序列,现在给定一个序列,求这个序列有多少好子序列,答案对$998244353$取模 ...
分类:
其他好文 时间:
2021-03-05 13:10:49
阅读次数:
0
MySql_176. 第二高的薪水 LeetCode_MySql_176 题目描述 题解分析 代码实现 # Write your MySQL query statement below select( select distinct Salary from Employee order by Sal ...
分类:
数据库 时间:
2021-03-02 12:23:52
阅读次数:
0
一.对两张表的结果进行合并起来,会有临时 union: 对两个结果集进行并集操作, 不包括重复行,相当于distinct, 同时进行默认规则的排序; (会去重,而去重所需要的开销很高,) union all: 对两个结果集进行并集操作, 包括重复行, 即所有的结果全部显示, 不管是不是重复;(不会去 ...
分类:
数据库 时间:
2021-03-02 11:44:24
阅读次数:
0
问题: 给定编号为0~numCourses-1 的课程,以及课程的依赖关系prerequisites 其中prerequisites[i] = [ai, bi],ai之前必须先上了bi的课程。 bi->ai 若能够上完所有的课程,给出一个上课顺序。 否则,返回空数组。 Example 1: Inpu ...
分类:
其他好文 时间:
2021-03-01 13:28:27
阅读次数:
0
组合求和( Combination Sum) 1. 题目描述 Given an array of distinct integers candidates and a target integer target, return a list of all unique combinations of ...
分类:
编程语言 时间:
2021-02-18 13:37:18
阅读次数:
0