标签:
拼写纠错,又叫拼写检查,在搜索引擎中很流行,如separate是一个正确的单词,但如果故意拼错,放到百度中也会帮你纠正。见图1。网上搜了一下,用的大都是贝叶斯定理。
记P(a|b)为:输入字符串b情况下,推断出字符串a的概率。
记c为正确的单词,w为错误的输入,那么对于例子中的纠错,要求的就是
(2)
对于同一个输入,式(2)中的分母不变,所以用于排序的话,只求分子就行。P(w|c)记为1,P(c)记为单词c在语料中的出现频率,所以得到
(3)
标签:
原文地址:http://blog.csdn.net/chuchus/article/details/47420613