1.自底向上 要写:驱动程序 2 自底向上 关键:寻找句柄 3.产生正规语言的文法为 3型 4.与(a|b)* 等价的正规式为 (a*b*)* 5.消除左递归:要引进非终结符,提取左因子 S-> SaA|Se|B -> S(aA|e)|B 引进非终结符S“(,) 非终结符要放在最后。 ->BS‘ S ...
分类:
其他好文 时间:
2020-07-04 15:06:58
阅读次数:
62
最少切分分词算法 该分词算法依据最少切分原则,从几种分词算法切分结果中取切分词数最少一种的。 比如,从正向最大匹配和逆向最大匹配两者中选择词数较少的方案,当词数相同时,采取某种策略,选择其中一个。 https://blog.csdn.net/cuixianpeng/article/details/4 ...
分类:
编程语言 时间:
2020-07-04 13:07:34
阅读次数:
71
1.1解释器和编译器的区别? 答:编译器高级程序语言翻译成机器语言程序,然后由虚拟机(或硬件)执行编译的结果。只需要一次词法分析,语法分析和语义分析,代码生成和代码优化需要时间。 解释器是把高级程序语言的源程序翻译成一种中间语言程序,然后对中间语言程序进行解释执行。执行到某行代码都要进行词法分析,语 ...
分类:
其他好文 时间:
2020-06-28 00:32:46
阅读次数:
94
何晗:HanLP:面向生产环境的自然语言处理工具包 清华:THULAC:一个高效的中文词法分析工具包 搜狗:搜狗实验室分词和词性标注 斯坦福:CORENLP 哈工大:LTP:语言技术平台(Language Technology Platform) NLPIR:NLPIR 中科大:科大讯飞 云孚科技 ...
分类:
其他好文 时间:
2020-06-26 22:09:35
阅读次数:
413
你不知道的JavaScript(上卷) 视频选集 1/4 P11.作用域是什么 P22.词法作用域 P33.函数作用域和块作用域 P44.提升 欺骗词法: 作用域恶魔 另外一个不推荐使用 eval(..) 和 with 的原因是会被严格模式所影响(限 制)。with 被完全禁止,而在保留核心功能的前 ...
分类:
编程语言 时间:
2020-06-26 10:36:48
阅读次数:
58
词法分析(lexical analysis):将字符序列转换为单词(Token)序列的过程 分词,命名实体识别,词性标注 并称 汉语词法分析“三姐妹”。 在线演示平台:http://ictclas.nlpir.org/nlpir/ 词性标注(Part-Of-Speech tagging, POS t ...
分类:
其他好文 时间:
2020-06-26 01:03:06
阅读次数:
93
中文词法分析 中文属于分析型语言,词基本上没有专门表示语法意义的附加成分,形态变化很少,语法关系靠词序和虚词来表示 中文词法分析难点 重叠词,离合词,词缀 中文词语的切分歧义 中文未定义词 词性标注 解决方法: 基于词典的机械切分算法 基于规则的切分算法 基于统计的切分算法 对于未登录词的处理。未登 ...
分类:
其他好文 时间:
2020-06-25 19:54:40
阅读次数:
51
lua中的闭包 在lua语言中,函数是严格遵循词法定界(lexical scoping)的第一类值(first-class value)。 第一类值意味着lua语言中的函数与其它常见类型的值(例如数值和字符串)具有同等权限:一个程序可以将某个函数保存到变量、或表中,也可以将函数作为参数传递给另外一个 ...
分类:
编程语言 时间:
2020-06-25 19:39:27
阅读次数:
55
词法分析(lexical analysis):将字符序列转换为单词(Token)序列的过程 分词;词性标注;实体识别 这一部分是NLP的基础,应该是入门就要了解的内容。 所谓分词,就是断句,把一条句子断开;要求断的比较碎,每个词都断开;要断的正确,也就是每个词都是有意义的,符合逻辑。 有个注明分词工 ...
分类:
其他好文 时间:
2020-06-25 19:24:50
阅读次数:
59
词法分析的任务和功能 任务 功能 输出形式 词法分析器设计 超前搜索 状态转换图 正则文法与状态转换图 引例 构造状态转换图 应用状态转换图来识别句子 状态转换图与文法的转换 正则式&正则集 RE → NFA NFA → DFA LEX DFA的代码表示 ...
分类:
其他好文 时间:
2020-06-21 13:39:55
阅读次数:
45