# 目标
统计三国演义中出现次数前100,并绘制云图
# 准备
分析工具:jieba,pandas,matplotlib,wordcloud
数据文档:三国演义.txt(原著),三国人物.txt(三国人名,大约1000多个),三国字.txt(一些常见人名及字,约800)
这些文档,放到了后面
## ... ...
分类:
其他好文 时间:
2020-01-12 13:24:11
阅读次数:
95
实现删除字符串中出现次数最少的字符,若多个字符出现次数一样,则都删除。输出删除这些单词后的字符串,字符串中其它字符保持原来的顺序。 输入描述: 字符串只包含小写英文字母, 不考虑非法输入,输入的字符串长度小于等于20个字节。 输出描述: 删除字符串中出现次数最少的字符后的字符串。 #!/usr/bi ...
分类:
编程语言 时间:
2020-01-12 00:20:31
阅读次数:
136
defaultdict(工厂函数) 如果访问的字典键不存在,就会初始化一个工厂函数的实例来代替 #统计列表单词出现次数 from collections import defaultdict strings = ['adad','dasdas','sadsa',"sdada",'dasdas'] c ...
分类:
编程语言 时间:
2020-01-08 14:18:27
阅读次数:
109
截取字符串统计字符串出现次数 通过替换字符串,统计字符串出现次数 通过正则表达式,统计字符串出现次数 原文链接 Java 自学经历 Java 面试题 H5 Java 面试题小程序 ...
分类:
其他好文 时间:
2020-01-08 10:58:48
阅读次数:
91
aa = pd.DataFrame({'id':['xx','yy','zz','mm'], 'a':['10','10','11',np.nan],'b':['11','12','11',np.nan],'c':['10','12','',np.nan],'d':['10','10 ...
分类:
其他好文 时间:
2020-01-07 20:13:27
阅读次数:
548
直方图概念: 在直方图中,所有空间信息全部丢失,每一灰度值对应的像素个数可直接得到,一幅图各个子区的直方图之和等于改图全图的直方图。假设有图像数据8x8,像素值范围0~14共15个灰度等级,统计得到各个等级出现次数及直方图如右侧所示,每个紫色的长条叫BIN。 图像直方图,是指整个图像在灰度范围内的像 ...
分类:
其他好文 时间:
2020-01-05 15:32:05
阅读次数:
96
一、读取文本中英文字母出现的次数并降序输出英文字母的百分比 源码; package total; import java.io.BufferedReader; import java.io.FileReader; import java.io.IOException; import java.uti ...
分类:
编程语言 时间:
2020-01-05 12:05:04
阅读次数:
109
使用awk统计列出现次数 # 统计以"."分割第二列数据的数量。可以统计数量比较多,而grep命令无法处理的情况。ls | awk -F '.' '{sum[$2]++} END{for (i in sum) print i ": " sum[i]}' ...
分类:
其他好文 时间:
2020-01-04 20:45:24
阅读次数:
102
在剑指offer第2版"面试题39:数组中出现次数超过一半的数字"的题解中,有这么一句话: "我们有成熟的时间复杂度为O(n)的算法得到数组中任意第k大的数字", 我觉得这句话有点不妥,至少让我产生过误解。 go代码如下: func partition(nums []int, l, r int) i ...
分类:
编程语言 时间:
2020-01-04 14:36:08
阅读次数:
91
对前k+1个数询问k+1次即可,询问结果只会有两个数:第m个和第m+1个,较大的数出现次数就是m次 #include<bits/stdc++.h> using namespace std; #define N 505 map<int,int>mp; int a[N],n,k,m; void ask( ...
分类:
其他好文 时间:
2020-01-02 00:05:00
阅读次数:
114