标签:form rri src lex 映射 near 模型 构建 nat
1.思路
自然语言语义分析--->知识库看懂的语义表示/逻辑表示(Logic Form)--->推理(Inference)查询(Query)--->答案
如:自然语言”Number of dramas starring Tom Cruise“
逻辑形式: count(Genre.Drama ∩ Performance.Actor.TomCruise)
2. 框架
自底向上构造语法树的过程,树的根节点,就是逻辑形式表达
步骤:
词汇映射:构造树节点,将短语或单词映射到知识库实体或者关系所对应的逻辑形式。构造词汇表(Lexicon)
构建(Composition):对节点进行两两合并,最后生成根节点。连接 Join,交 Intersection,聚合 Aggregate,桥接 Bridging
3. 训练分类器
计算每一种语义结果d(Derivation)的概率
discriminative log-linear model
softmax进行概率归一化
x代表自然语言问题,
是一个从语义解析结果和中提取出来的特征向量(关联特征,词汇特征,文本相似度特征,桥接特征,组合特征)
是模型参数
训练数据问题-答案对,最大化log-likelihood损失函数,通过AdaGrad算法
4.构建词汇表
标签:form rri src lex 映射 near 模型 构建 nat
原文地址:https://www.cnblogs.com/hapyygril/p/12167977.html