生成式句法分析指的是,生成一系列依存句法树,从它们中用特定算法挑出概率最大那一棵。句法分析中,生成模型的构建主要使用三类信息:词性信息、词汇信息和结构信息。前二类很好理解,而结构信息需要特殊语法标记,不做考虑。本文主要利用了词汇+词性生成联合概率模型,使用最大生成树Prim算法搜索最终结果,得到了一...
分类:
其他好文 时间:
2014-11-21 01:30:25
阅读次数:
214
本文旨在介绍CoNLL格式的中文依存语料库(汉语依存树库)、CoNLL格式相关工具,以及提供两个公开的中文依存语料库下载。最近做完了分词、词性标注、命名实体识别、关键词提取、自动摘要、拼音、简繁转换、文本推荐,感觉HanLP初具雏形。现在希望拿下依存句法分析,这样我就做出了史上第一个(?)民间句法分...
分类:
其他好文 时间:
2014-11-19 21:59:55
阅读次数:
256
一个c程序的生成要经历以下步骤:1.编写文本代码,生成c或cpp文件,这时候它还是文本的;2.编译,就是compile,由c编译程序对你写的代码进行词法和句法分析,发现并报告错误,有错时编译不能通过。如若无错,则生成中间代码,扩展名为obj,此时它便是二进制的了;3.连接,在汇编里称link,在c里...
分类:
其他好文 时间:
2014-09-29 04:09:06
阅读次数:
264
Stanford CoreNLP Stanford
CoreNLP提供一组自然语言处理的工具。这些工具可以把原始英语文本作为输入,输出词的基本形式,词的词性标记,判断词是否是公司名、人名等,规格化日期、时间、数字量,剖析句子的句法分析树和词依存,指示那些名词短语指代相同的实体。Stanford
Co...
分类:
其他好文 时间:
2014-05-04 19:56:22
阅读次数:
1769