码迷,mamicode.com
首页 > 其他好文 > 详细

词频统计英文和统计中文的区别

时间:2016-11-27 19:27:02      阅读:230      评论:0      收藏:0      [点我收藏+]

标签:英文   没有   等等   blog   image   span   alt   比较   汉字   

 通常我们做英文词频统计的时候,我们可能会采用单词树,或者map等等。

但是,在进行中文的词频统计的时候,中文之间没有空格和符号,不像在英

文词频统计一样,英文之间是有空格和符号的。所以,相对于英文来说,中

文词频统计比较难。主要是不好提取中文字通常我们在提取中文时候会进行

划分,通过汉字的关联等等来进行划分,提取。

 

    技术分享

词频统计英文和统计中文的区别

标签:英文   没有   等等   blog   image   span   alt   比较   汉字   

原文地址:http://www.cnblogs.com/handsomemanwhb/p/6106678.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!