来谈谈关于Shell中效率的问题

时间：2016-03-26 08:58:46 阅读：218 评论：0 收藏：0 [点我收藏+]

今天没什么事就总结一下Shell中很多操作关于效率的问题
不说别的没有用的
就是来点干的
最开始那自然就是算数运算
这里我最推荐的就是用$(()) 这样的方法进行简单的运算
因为无论是expr 还是bc之类的计算器肯定都没有linux的内置的快
总结起来也就是一句话
那就是能用内置的变量就不要用外部命令
然后就是有关于变量截取的问题
比如一般的变量都可以用sed来搞定
但是的吧，sed说实话效率真不是很高，有时候等一个文件输出
要等很久
可以用 ${ }中的一些内置的变量截取
当然如果就几十个文件搞的话没那么费劲
随意、会用哪个用哪个。
但是当你处理好几千个好几万数据的话，那个时间就不是盖的了
也不用就完全的都整的特别明白
知道什么时候用得着可以查的到就可以了
比如百度什么关键词就能找到对应的解决办法
还有就是能用工具搞定的东西，不用非得自己写一个脚本去处理
毕竟工具经历了这么多年的洗礼
不好用的工具肯定就被淘汰了
还有挺重要的就是嵌套循环、我只想说
除非数据非常少
不然你就等吧
能处理数据就处理数据
一次只干成一件事
比如今天有人问一个问题
就是有一个200G的文本文件
想要打印出大概两千行的内容
两千行的行号在一个文本文件里
他给出的解法是用for循环那个行号文件，然后用sed来取
我就简单的估计了一下，这JB不扯淡呢吗
for循环的话、得循环2000多遍，然后sed是遍历那200G的文件
我给了一个解法、但是比较复杂，接下来我就说一下我的方法
仅仅提供参考，肯定有比我更好的解法

首先就是sed不能分行过滤，因为那2000行是不连续的，sed我搞不定
也许哪个sed大神说可以搞定，我办不到，我给出一个大众的解法
我用的就是awk，awk的话关键的用法就是这个
awk ‘/{if(NR==LINE)print}/’ file
就是用NR来判断行号，那么只需要遍历一遍文件就可以
重要的就是把NR==LINE的问题搞定就可以了
因为awk支持（NR==23||NR==25）
像这样的，它可以多选
那么把那个行号文件用tr和sed处理过后就能整出来（）中间的那种类型的一行文本
直接复制过去给awk就哦了
我做过实验，肯定搞得定，我已经搞定了
不过代码那阵关机以后就在历史记录里了
我也懒的翻了

就总结这么多了，不多说了，准备洗洗睡了

本文出自 “Dashazi's blog” 博客，请务必保留此出处http://dashazi.blog.51cto.com/10354524/1754976

来谈谈关于Shell中效率的问题

标签：百度计算器文本文件

原文地址：http://dashazi.blog.51cto.com/10354524/1754976

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行