码迷,mamicode.com
首页 > 其他好文 > 详细

NLP去特殊字符

时间:2019-02-28 16:45:49      阅读:199      评论:0      收藏:0      [点我收藏+]

标签:中国   中文   int   需要   中国人   特殊   特殊字符   文本   div   

在自然语言处理中,我们有时对文本进行处理,需要去除一些特殊符号,保留中文,这是在预处理过程中常用到的。分享给你,希望对你有帮助!

1 import re
2 def delete_sysbol(line):
3     cop = re.sub([^\u4e00-\u9fa5^], ‘‘, line)
4     print(cop)
5     return cop
6 
7 delete_sysbol(woa oi^*&%&(3 na我是中国人*(&*(美好)

 

NLP去特殊字符

标签:中国   中文   int   需要   中国人   特殊   特殊字符   文本   div   

原文地址:https://www.cnblogs.com/demo-deng/p/10451180.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!