码迷,mamicode.com
首页 >  
搜索关键字:文本分析    ( 342个结果
linux awk命令详解
简介awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。awk有3个不同版本: awk、nawk和gawk,未作特别说明,一般指gawk,g...
分类:系统相关   时间:2015-10-14 15:53:59    阅读次数:273
awk
简介awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。awk有3个不同版本: awk、nawk和gawk,未作特别说明,一般指gawk,g...
分类:其他好文   时间:2015-10-02 21:15:40    阅读次数:217
互联网数据的挖掘和分析
基本上使用python语言完成一、抓取列表页详细页授权(API)&未授权(爬虫)普通抓取&需登录二、html解析1. BeautifulSoup2. 正则三、文本分析&自然语言处理四、性能优化1. 反抓取屏蔽 http代理2. 性能优化多线程抓取
分类:其他好文   时间:2015-09-30 12:45:34    阅读次数:175
基于文本分析的参数估计
目录0基于文本分析的参数估计... 11 参数估计方法... 11.1最大似然估计MLE. 21.2最大后验概率... 31.3贝叶斯推理... 42 共轭分布... 72.1 随机生成过程及共轭分布... 72.2 Multinomial分布和 Dirichlet分布... 83 unigram ...
分类:其他好文   时间:2015-09-29 13:06:39    阅读次数:1471
Linux命令:awk简介
awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。备注:awk有3个不同版本:awk、nawk和gawk,未作特别说明,一般指g..
分类:系统相关   时间:2015-09-25 18:44:41    阅读次数:291
Perl 调用R分词进行文本数据分析
最近有一个文本分析的需求,因分析系统用的是Perl,而Perl下优秀的中文文本分析包又少,所以调用R处理文本数据。为什么不用Python尽管Python拥有完备的NLP开源包支持,但是理由也很简单——因为Python目前接触不多,不敢班门弄斧,Python以后再说。目前,也只是需要的是一个快速原型,...
分类:其他好文   时间:2015-09-20 10:33:22    阅读次数:250
awk 基础入门
简介awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。awk有3个不同版本: awk、nawk和gawk,未作特别说明,一般指gawk,g...
分类:其他好文   时间:2015-09-13 11:55:05    阅读次数:213
.net 的一个分词系统(jieba中文分词的.NET版本:jieba.NET)
简介平时经常用Python写些小程序。在做文本分析相关的事情时免不了进行中文分词,于是就遇到了用Python实现的结巴中文分词。jieba使用起来非常简单,同时分词的结果也令人印象深刻,有兴趣的可以到它的在线演示站点体验下(注意第三行文字)。.NET平台上常见的分词组件是盘古分词,但是已经好久没有更...
分类:Web程序   时间:2015-09-11 00:13:39    阅读次数:546
(转)jieba中文分词的.NET版本:jieba.NET
简介平时经常用Python写些小程序。在做文本分析相关的事情时免不了进行中文分词,于是就遇到了用Python实现的结巴中文分词。jieba使用起来非常简单,同时分词的结果也令人印象深刻,有兴趣的可以到它的在线演示站点体验下(注意第三行文字)。.NET平台上常见的分词组件是盘古分词,但是已经好久没有更...
分类:Web程序   时间:2015-09-09 09:47:17    阅读次数:256
中文分词
jieba中文分词的.NET版本:jieba.NET2015-09-08 20:05 by Anders Cui,191阅读,3评论,收藏,编辑简介平时经常用Python写些小程序。在做文本分析相关的事情时免不了进行中文分词,于是就遇到了用Python实现的结巴中文分词。jieba使用起来非常简单,...
分类:其他好文   时间:2015-09-09 01:04:41    阅读次数:507
342条   上一页 1 ... 25 26 27 28 29 ... 35 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!