码迷,mamicode.com
首页 > 其他好文 > 详细

统一TXT文件格式

时间:2019-09-04 09:36:11      阅读:80      评论:0      收藏:0      [点我收藏+]

标签:lis   data   dataset   end   app   sse   port   学校   flag   

from collections import Counter
import jieba
import jieba.posseg
from jieba import analyse
import sys
#jieba.suggest_freq(‘乡村小规模学校‘, True)
import re
import importlib
import linecache

f1 = open("C:\\Users\\zyl\\Desktop\\test.txt","r",encoding=‘utf-8‘)
buff = f1.readlines()
f2 = open("C:\\Users\\zyl\\Desktop\\printout.txt",‘w+‘,encoding=‘utf-8‘)
dataSet = []
flag = False
sentence = r‘(\s)‘
for line in buff:
  if line:
    for i in line:
      result = re.findall(sentence,i)
      if result:
        continue
      else:
        dataSet.append(i)
  else:
    continue
  dataSet.append("\n")
cache_str = "".join(dataSet)
cache_list = cache_str.split("\n")
for j in range(len(cache_list)):
  if cache_list[j]:
    f2.write(cache_list[j]+‘\n‘)
  else:
    continue
f2.close()
f3 = open("C:\\Users\\zyl\\Desktop\\printout.txt",‘r+‘,encoding=‘utf-8‘)
result = f3.read()
print(result)


统一TXT文件格式

标签:lis   data   dataset   end   app   sse   port   学校   flag   

原文地址:https://www.cnblogs.com/zyl-kx/p/11456914.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!