标签:com path temp bubuko src -o 分词 install test
1.训练模型
install_path/bin/lmplz -o 3 -S 80% -T /temp <text >text.arpa
2.查询模型
为了更快的加载将 text.arpa 转换为 binary 文件
install_path/bin/build_binary text.arpa text.binary
测试
install_path/bin/query text.binary <test.txt >result.txt
结果如下图所示,输出每个句子的混淆度和未登录词,以及整个测试语料的混淆度和未登录词。
标签:com path temp bubuko src -o 分词 install test
原文地址:https://www.cnblogs.com/Climbing-Snail/p/9519079.html