码迷,mamicode.com
首页 > 编程语言 > 详细

初心大陆-----python宝典之以外学习中。

时间:2016-06-22 17:22:12      阅读:192      评论:0      收藏:0      [点我收藏+]

标签:初心大陆-----python宝典之以外学习中。

群里同学的需求,刚学一段时间,到网上搜了下资料就开始操作了。

 2个文件排重,在第二个文件里把第一个文件里出现的行删除,第一个文件有8000行,第二个文件有2000万行 


环境1:

文件1

cat a.txt

aa

aaa

bb

cc

文件2

cat b.txt

aaa

ccc

vvv

cat c.py

python脚本

#!/usr/bin/env python


import difflib

import sys

a = open(‘a.txt‘, ‘U‘).readlines()

b = open(‘b.txt‘, ‘U‘).readlines()

diff = difflib.ndiff(a,b)


sys.stdout.writelines(diff)


python c.py > d.txt 输出脚本到d.txt

cat d.txt |awk -F ‘ ‘ ‘$1~/+/{print $2}‘

ccc

vvv

把开头为加号的选出即可。

初心大陆-----python宝典之以外学习中。

标签:初心大陆-----python宝典之以外学习中。

原文地址:http://bjzby.blog.51cto.com/4084070/1791759

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!