码迷,mamicode.com
首页 >  
搜索关键字:切分    ( 1250个结果
MFC DAY06 07 08 09
一 切分窗口 1 类型 动态切分-程序在运行时,由用户拖动分隔条动态的切分窗口。 每一个视图窗口使用的是相同的视图类。 静态切分-在编码创建时已经完成窗口切分。每一个视图窗口 可以使用不同的视图类。 2 相关类 CSplitterWnd...
分类:其他好文   时间:2014-07-24 00:49:17    阅读次数:361
luke 操作记录
精确查询(不需要切分词):得使用KeywordAnalyzer而不是StandardAnalyzer,原因如下:StandardAnalyzer:KeywordAnalyzer:
分类:其他好文   时间:2014-07-23 12:41:36    阅读次数:246
怎样使用 iOS 7 的 AVSpeechSynthesizer 制作有声书(2)
切分语句软件project的一条定律是数据和代码分离。这样做会使代码更易于測试,即使输入的数据发生改变,你的代码也能够同意。甚至于,程序能在执行中实时下载新的数据。假设程序能在执行中下载新书岂不是更好?你如今用的书是用 Book.testBook 方法中的代码创建的。接下来我们将书改为以文件形式存储...
分类:移动开发   时间:2014-07-23 12:26:46    阅读次数:329
中文分词技术(中文分词原理)
一、为什么要进行中文分词?词是最小的能够独立活动的有意义的语言成分,英文单词之间是以空格作为自然分界符的,而汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。Lucene中对中文的处理是基于自动切分的单字切分,或者二元切分。除此之外,还有最大切分(...
分类:其他好文   时间:2014-07-23 12:20:06    阅读次数:263
IKAnalyzer 分词
IK Analyzer 3.0特性采用了特有的"正向迭代最细粒度切分算法",具有80万字/秒的高速处理能力采用了多子处理器分析模式,支持:英文字母(IP地址、Email、URL)、数字(日期,常用中文数量词,罗马数字,科学计数法),中文词汇(姓名、地名处理)等分词处理。优化的词典存储,更小的内存占用...
分类:其他好文   时间:2014-07-16 00:54:37    阅读次数:800
NLP: 中文分词---正向匹配 (Forward Matching)
在采用FMM (正向最大匹配) 进行中文分词的时候, 可能会存在比较多的交集歧义, 这个时候为了解决交集歧义的问题, 可以采用 FM (Forwar Matching, 正向匹配) 进行中文分词, 正向匹配会在最大匹配的路径上查找所有可能成词的term(这里所有可能成词的term的意思是在构建索引的时候所有切分出来的词, 因为不是路径上的所有节点都会是切分成的词)。 http://blo...
分类:其他好文   时间:2014-07-12 22:23:26    阅读次数:383
如何使用 iOS 7 的 AVSpeechSynthesizer 制作有声书(2)
切分语句软件工程的一条定律是数据和代码分离。这样做会使代码更易于测试,即使输入的数据发生改变,你的代码也能够允许。甚至于,程序能在运行中实时下载新的数据。如果程序能在运行中下载新书岂不是更好?你现在用的书是用 Book.testBook 方法中的代码创建的。接下来我们将书改为以文件形式存储,读取的时候则通过Plist 文件来读取。打开 SupportingFiles\WhirlySquirrell...
分类:移动开发   时间:2014-07-12 21:35:53    阅读次数:395
NLP: 中文分词算法---交集歧义检测 (cross ambiguity detect)
中文分词中存在交集歧义检测问题, 例如“互联网金宝” 可以切分为“互联网” 和“金宝”, 也可以切分为“互联”和“网金宝”, 如何在切分过程中检测是否有交集歧义发生, 以及如果存在交集歧义的话怎么处理切分问题, 是非常重要的话题。 这里, 可以采用FMM算法进行切分, 首先切分出最大的正向匹配, 然后进行交集歧义检测, 如果检测到存在交集歧义, 那么对可能存在歧义的一段文字进行FM切分, 获取所有的可能切分结果; 然后对剩下的query子句重复进行FMM切分, 直到query == null...
分类:其他好文   时间:2014-07-12 18:26:14    阅读次数:264
MapReduce中TextInputFormat分片和读取分片数据源码级分析
InputFormat主要用于描述输入数据的格式(我们只分析新API,即org.apache.hadoop.mapreduce.lib.input.InputFormat),提供以下两个功能: (1)数据切分:按照某个策略将输入数据切分成若干个split,以便确定MapTask个数以及对应的s...
分类:其他好文   时间:2014-07-09 23:49:37    阅读次数:487
几种开源分词工具的比較
搜集了一些资料,与同学一起进行了简单的測试,总结例如以下。分词工具特点支持语言原理词典及扩展性StandardAnalyzer中文、英文(unicode)中文:单字符切分英文:依据空格切分ChineseAnalyzer中文,不支持中文和英文及数字混合的文本分词按字分词,与StandardAnalyz...
分类:其他好文   时间:2014-07-08 23:15:59    阅读次数:231
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!