1. 数据采集:Python爬取淘宝网商品数据 2. 对数据进行清洗和处理 3. 文本分析:jieba分词、wordcloud可视化 4. 数据柱形图可视化 barh 5. 数据直方图可视化 hist 6. 数据散点图可视化 scatter 7. 数据回归分析可视化 regplot ...
分类:
编程语言 时间:
2018-03-09 13:18:55
阅读次数:
290
阅读目录 1.统计命令——wc 2.切分命令——cut 3.排序命令——sort 4.去重命令——uniq 5.查找命令——grep 6.替换/查找/删除命令——sed 7.强大的文本分析命令——awk 简单的总结一下常用的一些实用的Linux文本操作命令,包括wc(统计)、cut(切分)、sort ...
分类:
系统相关 时间:
2018-03-06 19:09:27
阅读次数:
479
Usage:awk [option] 'program' file ... awk [option] -f progfile file ... [optin]: -F fs 指定输入分隔符,fs可是字符串或者正则表达式; -v var=value 赋值给var,将外部变量传给awk; -f scri ...
分类:
其他好文 时间:
2018-03-05 18:17:08
阅读次数:
149
支持三种分词模式: ? 精确模式,试图将句子最精确地切开,适合文本分析; ? 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; ? 搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。 http://www.cnblogs.com/to ...
分类:
其他好文 时间:
2018-02-26 13:28:43
阅读次数:
181
简介awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。awk有3个不同版本: awk、nawk和gawk,未作特别说明,一般指gawk,gawk 是 AWK 的 GNU 版本。awk其名称得自于它的创始人 Alfred Aho 、Pete
分类:
系统相关 时间:
2018-01-30 12:35:19
阅读次数:
224
简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。 awk有3个不同版本: awk、nawk和gawk,未作特别说明,一般指gawk ...
分类:
系统相关 时间:
2018-01-21 11:02:21
阅读次数:
228
六周第三次课(1月17日)9.6/9.7 awkawk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。awk有3个不同版本: awk、nawk和gawk,未作特别说明,一般指gawk,gawk 是 AWK 的 GNU 版本。awk其
分类:
其他好文 时间:
2018-01-18 00:49:29
阅读次数:
163
支持三种分词模式:精确模式,试图将句子最精确地切开,适合文本分析;全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义;搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。关键词:HMM 隐马尔可夫模型 三种分词模式: 结果:中华人民共和国 ...
分类:
编程语言 时间:
2018-01-13 00:14:15
阅读次数:
437
awk是一个强大的文本分析工具语法:awk[选项参数]‘script‘var=valuefile(s)或awk[选项参数]-fscriptfilevar=valuefile(s)参数说明:-Ffsor--filed-separatorfs:指定输入文件分隔符,fs是一个字符串或者是一个正则表达式,如-F-vvar=valueor--asignvar=value:赋值一个用户定义变量
分类:
系统相关 时间:
2018-01-12 17:14:13
阅读次数:
230
awk是一种处理文本文件的语言,是一个强大的文本分析工具,awk是三位创始人的首字母的缩写。 语法: awk [选项参数] ‘script’ var=value file(s)或 awk [选项参数] -f scriptfile var=value file(
分类:
系统相关 时间:
2018-01-02 23:13:28
阅读次数:
153