码迷,mamicode.com
首页 >  
搜索关键字:词频统计    ( 846个结果
krypton系列4-7
level4:VigenereCipher加密,可以对抗词频统计,需要知道密码,此题知道密钥长度6。http://www.simonsingh.net/The_Black_Chamber/crackingprinciple.html这个网站解释了如何破解VigenereCipher加密。http://smurfoncrack.com/pygenere/pygenere.php直接把密文拷贝到上面那个..
分类:其他好文   时间:2014-12-02 17:31:33    阅读次数:219
《BI那点儿事》数据流转换——字词查找转换
原文:《BI那点儿事》数据流转换——字词查找转换字词查找转换将从转换输入列的文本中提取的字词与引用表中的字词进行匹配,然后计算出查找表中的字词在输入数据集中出现的次数,并将计数与引用表中的此字词一并写入转换输出的列中。此转换对于创建基于输入文本并带有词频统计信息的自定义词列表很有用。 本章功能:取出...
分类:其他好文   时间:2014-12-02 10:15:48    阅读次数:185
树学习 ---------字典树(Trie Tree)
字典树,又称为字母数,前缀树等等,不仅可以存储字符,还可以存储数字等, 又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来节约存储空间,最大限度地减少无谓的字符串比较,查询效率比哈希表高。      字典树与字典很相似,当你...
分类:其他好文   时间:2014-11-27 01:39:23    阅读次数:202
trie数的实现
Trie树又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希表高。 ...
分类:其他好文   时间:2014-10-27 21:08:03    阅读次数:205
代码复审
对于结队编程抱到黎柱金同学的大腿让我轻松许多,结对伙伴的词频统计程序写的很好,现在我对大神代码做些个人意见的评价。 伙伴的代码整体都很好,代码简洁,没冗余代码,而且用C#语言实现面向对象,层次化抽象清晰,任务非配合理,没有过多的类冗余属性,而且代码重用也应用很好,进一步使得代码简洁明了。 1 ...
分类:其他好文   时间:2014-10-24 01:35:59    阅读次数:310
Scrutiny of Partner's individual project Code
因为队友的代码并没有完整的实现个人项目的完整功能。已实现功能:1.对单个单词进行词频统计2.能够按照老师的要求的格式对制定的有效字符串进行匹配,并且输出至指定文件。未实现:1.对连续多个单词进行匹配以及计数2.对已存储的单词进行排序输出。代码优点:1.逻辑严谨2.格式规范优美代码缺点:1.注释较少,...
分类:其他好文   时间:2014-10-23 14:14:02    阅读次数:180
代码互审
当初自己写第一个个人项目——词频统计的时候,就由于自己能力和时间等原因,连老师的要求都没能全部完成。这次要复审同伴的这个作业,有些惭愧啊。看完同伴的这个作业,感觉有很多值得我学习的地方。1 代码格式清晰,各部分函数分工明确,让人很容易读懂代码的内容,了解程序的运行过程;2 用了树的数据结构来存储单词...
分类:其他好文   时间:2014-10-22 20:15:01    阅读次数:215
软件工程第一次作业
作业一:文章词频统计思路设计与分析:采用最简单的数组作为存储结构,每次读到一个单词就在已经保存的数组中遍历,如果没有找到则加入这一元素,否则增加词的出现频率。最后对词出现的频率进行排序取出前10名输出。代码如下: 1 #include 2 #include 3 #include 4 #in...
分类:其他好文   时间:2014-10-22 00:59:06    阅读次数:234
java实现的Trie树数据结构
最近在学习的时候,经常看到使用Trie树数据结构来解决问题,比如“ 有一个1G大小的一个文件,里面每一行是一个词,词的大小不超过16字节,内存限制大小是1M。返回频数最高的100个词。” 该如何解决? 有一种方案就是使用Trie树加 排序实现 。 什么是Trie 树呢?也就是常说的字典树,网上对此讲得也很多,简单补充一下个人理解: 它实际上相当于把单词的公共部分给拎出来,这样一层一层往上拎直...
分类:编程语言   时间:2014-10-15 22:19:34    阅读次数:281
个人项目滴总结
一.计划用时 对于完成这个项目,由于作业要求用C#或者C++写,而这两个以前几乎没有接触过,所以我计划阅读题目之后,对题目大概有了自己的想法之后,先是学习一下C#语言,大概一天的时间,方便写程序时好上手,然后,在计划完成项目时,计划把较大的时间用在写收集单词和词频统计方面,大概3-4个小时,在文件....
分类:其他好文   时间:2014-09-27 18:52:10    阅读次数:185
846条   上一页 1 ... 80 81 82 83 84 85 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!