码迷,mamicode.com
首页 > 系统相关 > 详细

Linux 文本处理工具好强啊

时间:2019-01-07 21:26:12      阅读:201      评论:0      收藏:0      [点我收藏+]

标签:一个   linux   shu   cat   shuffle   文本文件   工具   content   完美   

Shuffle contents of multi files

现在有 1000 个文本文件(0.txt ~ 999.txt),每个文件大概 11M,总共 11G,我想把这 1000 个文本文件的内容随机组合成一个文件。

cat *.txt | shuf > random试了下,大概第 8 秒内存占用就达到 96%,然后就不再上涨了,最后大概用了 55 秒完成,要求也完美达成。


输出第n到m个词

一个文本文件,可能有多行,每行有多个单词,单词通过空格分隔,现希望输出第 100 到第 500 ([100,500],闭区间) 个词。

tr ‘\n‘ ‘ ‘ < inputfile | cut -d‘ ‘ -f 100-500 > outputfile

Linux 文本处理工具好强啊

标签:一个   linux   shu   cat   shuffle   文本文件   工具   content   完美   

原文地址:https://www.cnblogs.com/maxuewei2/p/10234648.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!