据我了解中,给我映像最深的抄袭事件“百度输入法陷入抄袭事件遭搜狗索赔8千万”。 搜狗所提起的这一系列诉讼中,主张遭到侵权的专利不仅涉及诸如超级词库、智能组 词、云输入等核心输入功能,更涵盖了智能删除、候选展现等对用户输入行为有着重 要影响的周边服务。 我个人认为,之所以出现所谓的抄袭事件: 1国内盗 ...
分类:
其他好文 时间:
2016-03-24 16:13:39
阅读次数:
156
软件评价:搜狗输入法 搜狗输入法是一款适合中国人使用的输入法软件,其简洁的界面,强大的词库系统,词汇量大,及时更新,常用的词都在前面,用起来方便,网络热词也及时加到里面。电脑上面的搜狗输入法还可以换皮肤,每次打字的时候那个框框就会跳出来,很可爱很人性化,心情都会变好呢!真心的点32个赞!
分类:
其他好文 时间:
2016-03-13 12:44:20
阅读次数:
149
LSA latent semantic analysis 映射词-文档到一个低维隐语义空间 比较词和文档在低纬空间的相似性 topic 是 Vocab 上的概率分布(符合多项式分布) 文档到主题的一个分布,主题到词库的分布,通过训练得到这两个分布模型 plsa 模型 LDA模型 大规模LDA系统 s
分类:
其他好文 时间:
2016-02-29 18:07:56
阅读次数:
233
本篇blog是利用Python进行文章特征提取的续篇,主要介绍构建带TF-IDF权重的文章特征向量。 In [1]: # 带TF-IDF权重的扩展词库 # 在第一篇文档里 主要是利用词库模型简单判断单词是否在文档中出现。然而与单词的顺序、频率无关。然后词的频率对文档更有意义。因此本文将词频加入特征向
分类:
编程语言 时间:
2016-02-27 19:22:40
阅读次数:
252
介绍使用ftserver全文搜索服务器,使用英文规则处理英文,使用中文规则处理中文,不需要切割中文为单词,可以支持中文字的任意排列,轻松处理古文古诗词,写意句子不影响搜索,不依赖词库,搜索中文不漏词。
分类:
其他好文 时间:
2016-02-22 13:34:10
阅读次数:
705
记下来 不然以后又忘记了。 AnalysisEntry:总体调动,调类的顺序;WordFrequenceInDoc:提取中文,分词,去停词,统计词频;在去停词时,要做一个词库,my.dic或者stopword.dicWordCountsInDoc:统计每个文档的单词数目;WordsInCorpusT
分类:
其他好文 时间:
2016-02-20 01:50:52
阅读次数:
195
Atitit. Ati IDE 开发平台的第一版规划 1. 增加业务类型复杂类型内置1 1.1. 简单类型string int float自动类型转换以及2 1.2. $变量str连接2 2. Dsl2 3. 类库2 3.1. 输入法工具箱,词库clr工具 and 垃圾词库2 3.2. 翻译lib
分类:
其他好文 时间:
2016-02-13 23:06:44
阅读次数:
186
PHPAnalysis源程序下载与演示: PHP分词系统 V2.0 版下载 | PHP分词系统演示 | PHPAnalysis类API文档 原文连接地址:http://www.phpbone.com/phpanalysis/ 分词系统简介:PHPAnalysis分词程序使用居于unicode的词库,
分类:
Web程序 时间:
2016-02-09 15:02:54
阅读次数:
336
参考文章《用QQ拼音打五笔》中提供的信息而制作的小工具,功能是将QQ五笔导出词库文件转换为QQ拼音自定义短语使用的.ini格式文件,这样就可以使用QQ拼音进行五笔拼音混输了。 混输效果不错(设置方法见上述参考文章): 关键代码: void Button1Click(object sender, Ev
分类:
其他好文 时间:
2016-02-01 01:51:18
阅读次数:
235
圣诞快乐!merry xms!身为程序猿和研究僧,英文文献是经常接触的,所以在ubuntu下当然需要一款英汉词典啦查了下推荐stardict的比较多,于是学着安装了下,感觉还不错,但是只有词典功能(可以下载本地词库,后面将),全文翻译的功能必须要联网,而且可选的服务器都被墙了...所以如果要全文翻译...
分类:
系统相关 时间:
2015-12-25 19:18:28
阅读次数:
231