码迷,mamicode.com
首页 > 编程语言 > 详细

python langid实现语种识别

时间:2017-05-18 13:58:41      阅读:896      评论:0      收藏:0      [点我收藏+]

标签:instr   ken   入库   这一   str   ann   span   esc   one   

2017-04-26

语料数据入库时有个小需求,需要用一个字段存储语料的语种,偶然发现langid可以实现这一功能,再次感叹python的好用!

#coding=utf-8
import langid                             #引入langid模块 

s1 = 你好
s2 = hello
s3 = Flüssigkeiten zum Nassbehandeln von W?schestücken werden vielfach mit Dampf aufgeheizt. Dazu wird der Dampf mit hoher Geschwindigkeit durch eine Düse (30) der aufzuheizenden Flüssigkeit direkt zugeführt. Aufgrund der hohen Geschwindigkeit, mit der der Dampf in die aufgeheizte Flüssigkeit einstr?mt, entstehen starke Ger?usche sowie Schwingungen und Vibrationen. Um mindestens die Ger?usche zu reduzieren, ist es bereits bekannt, zus?tzlich Druckluft zuzuführen. Das verschlechtert den W?rmeübergang. Die Erfindung sieht es vor, in die Düse (30) eine kleine Menge der aufzuheizenden Flüssigkeit einzusaugen und dadurch in der Düse (30) ein Kondensat-Dampfgemisch zu bilden. Alternativ oder zus?tzlich kann hinter der Düse (30) ein Str?mungsteiler vorgesehen sein, der die Str?mungsgeschwindigkeit des Dampfs bzw. Dampf-Kondensatgemisches erh?ht. Hierdurch und/oder durch die Bildung eines Dampf-Kondensatgemisches in der Düse (30) werden die Ger?uschentwicklung beim Einleiten des Dampfs in die aufzuheizende Flüssigkeit sowie Schwingungen und Vibrationen ohne die Zufuhr von Druckluft verringert

i = langid.classify(s1)
j = langid.classify(s2)
m = langid.classify(s3)

print m, m[0], type(m)

 

python langid实现语种识别

标签:instr   ken   入库   这一   str   ann   span   esc   one   

原文地址:http://www.cnblogs.com/zhangtianyuan/p/6872926.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!