1. 用Pyspark自主实现词频统计过程。 >>> s = txt.lower().split()>>> dd = {}>>> for word in s:... if word not in dd:... dd[word] = 1... else:... dd[word] = dic[word] ...
分类:
其他好文 时间:
2021-04-23 12:19:08
阅读次数:
0
>>> s = txt.lower().split()>>> dd = {}>>> for word in s:... if word not in dd:... dd[word] = 1... else:... dd[word] = dic[word] + 1...>>> ss = sorted( ...
分类:
其他好文 时间:
2021-04-23 12:18:32
阅读次数:
0
1. 用Pyspark自主实现词频统计过程。 >>> s = txt.lower().split()>>> dd = {}>>> for word in s:... if word not in dd:... dd[word] = 1... else:... dd[word] = dic[word] ...
分类:
其他好文 时间:
2021-04-23 12:10:50
阅读次数:
0
笔试算法题中,有时候是要自己处理输入,比如从键盘中接收一个数,整理了一些常用的,真正笔试之前可以看一看。 输入 循环输入: Scanner sc = new Scanner(System.in); while (sc.hasNextLine()){ String s = sc.nextLine(); ...
分类:
编程语言 时间:
2021-04-23 12:06:51
阅读次数:
0
今天参加美团面试,讲了半个多小时的面经题目后面试官出了一道手写算法题。 题目很简单,给一个字符串,形如“3.1.0.1”的版本号,再给一个格式正确的版本号,然后判断两个字符串的大小。 我一看非常简单啊,啪的一下就写完了,其中用了split函数切割字符串,但没想到运行结果不对。 | ^ $ * . ( ...
分类:
其他好文 时间:
2021-04-21 12:18:45
阅读次数:
0
下午闲着无聊 用python写了个字典转MD5字典的脚本 import requestsimport hashlibdef baopo(script): print(u" 转化开始:") str=open(script).read() str_list=str.split('\n') print(s ...
分类:
编程语言 时间:
2021-04-20 15:25:35
阅读次数:
0
一、词频统计: 1.读文本文件生成RDD lines lines = sc.textFile('file:///home/hadoop/word.txt') 2.将一行一行的文本分割成单词 words flatmap() words=lines.flatMap(lambda line:line.sp ...
分类:
其他好文 时间:
2021-04-20 15:02:06
阅读次数:
0
切割字符串 分隔字符串是java中常用的操作,String的split方法可以进行字符串切割操作,然而日常使用却仅仅限于str.split("-"),其中“-”为分隔符。其实split方法很强大,有更优雅的方式去切割字符串 使用方法 public String[] split(String rege ...
分类:
编程语言 时间:
2021-04-16 11:39:48
阅读次数:
0
变量1,变量2,变量3=input("提示语句").split("分隔符",分隔次数) 这里input用split返回的值是列表,如果想对他进行强制类型转换请用map函数 ...
分类:
编程语言 时间:
2021-04-13 12:29:48
阅读次数:
0
P5350&P5586 序列 P5350&P5586 序列 区间覆盖,区间求和,交换两个区间,区间复制后覆盖,区间加,区间翻转。 可以使用 \(FHQ Treap\) 来解决。 区间翻转,区间加,区间覆盖,区间求和常规操作,标记维护一下就行了,然后区间交换就是相当于 split 两个区间出来再合并就 ...
分类:
其他好文 时间:
2021-04-13 12:10:40
阅读次数:
0