码迷,mamicode.com
首页 > 其他好文 > 详细

取出csv文件中的中文评论数据

时间:2017-07-20 00:46:51      阅读:187      评论:0      收藏:0      [点我收藏+]

标签:http   coding   span   文字   写入   pos   ref   filter   att   

# -*- coding: utf-8 -*-

import csv
import re

csvfile = weibo.csv

def columns_data(path, column):
    columns_data = ‘‘
    csvfile = open(path, r, encoding=utf-8)
    DicReader = csv.DictReader(csvfile)
    for row in DicReader:
        columns_data = columns_data+row.get(column)
    return columns_data

comments = columns_data(csvfile, comment)
print(comments)

pattern = re.compile(r[\u4e00-\u9fa5]+)
filterdata = re.findall(pattern, comments)
print(filterdata)

cleaned_comments = ‘‘.join(filterdata)
print(cleaned_comments)

 

数据来源:Python爬取新浪微博评论数据,写入csv文件中

本文等同:筛选出一段文字中的中文

 

取出csv文件中的中文评论数据

标签:http   coding   span   文字   写入   pos   ref   filter   att   

原文地址:http://www.cnblogs.com/zhzhang/p/7208942.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!