标签:
1、使用 wget 抓取网站
比如,我想抓取 www.isi.edu/nsnam/ns/tutorial 里面的所有内容,那么输入
wget -r -p -np -k -E http://www.isi.edu/nsnam/ns/tutorial
那么 wget 会把 www.isi.edu/nsnam/ns/tutorial 里的所有内容抓取下来,按照网站的存储结构存储到当前的路径下。
2、使用 rename 批量修改文件后缀名(拓展名)
从 微软网站上下载的主题包(themepack格式)默认无法被“归档管理器”处理(但我在 Windows 下使用 7zip 就可以打开和解压缩),不 过把拓展名改为 zip 就可以打开和解压缩了。使用下列命令将本目录下所有 .themepack 压缩文件的拓展名修改为 .zip :
rename ‘s/.themepack/.zip/‘ ./*
3、使用 enca 将文件夹下所有的 srt 字幕文件都转成 UTF-8 编码:
enca -L zh_CN -x UTF-8 *.srt
另外补充enca的几个用法:
enca -L zh_CN filename 检查文件的编码
enca -L zh_CN -x UTF-8 filename 将文件编码转换为"UTF-8"编码
enca -L zh_CN -x UTF-8 filename1 filename2 如果不想覆盖原文件可以这样
批量转换当前目录下的所有txt文件:
find ./ -name ‘*.txt‘ -exec enca -L zh_CN -x UTF-8 {} \;
4、使用 pdftk 对 pdf 文件进行操作。
更多操作参见: http://www.pdflabs.com/docs/pdftk-man-page/
(1)a.pdf 为一本书的全部奇数页,b.pdf 为这本书的全部偶数页,下面的命令可以将两个 pdf 合并成页码正常的书 c.pdf :
pdftk shuffle a.pdf b.pdf output c.pdf
(2)合并 a.pdf 和 b.pdf 到 c.pdf 中:
pdftk a.pdf b.pdf cat output c.pdf
或(使用通配符,将合并目录下所有 pdf 文件):
pdftk *.pdf cat output c.pdf
(3)去除 a.pdf 中的 第 10 页,并创建 c.pdf:
pdftk a.pdf cat 1-9 11-end output c.pdf
(4)从 a.pdf 中扣出第 n 页到 c.pdf:
pdftk a.pdf cat n output c.pdf
(5)将 a.pdf 分割成一页一个文档:
pdftk a.pdf burst
将会在当前目录下把 a.pdf 分成从 pg_0001.pdf 到最后一页的一堆 pdf。
(6)将 a.pdf 第 5 页顺时针旋转90度,生成 c.pdf:
pdftk a.pdf cat 1-4 5east 6-end output c.pdf
(7)将整个 a.pdf 文档旋转180度,生成 c.pdf:
pdftk a.pdf cat 1-endsouth output c.pdf
5、使用 find 批量删除软链接
find -type l -delete [PATH]
如果要删除无效的软链接,则执行
find -L [PATH] -type l -delete
7、使用 find 批量修改目录下某种格式文件的权限
比如,我想把目录下所有的txt文件修改为不可执行,以免打开时总是有提示“xxxx是可执行的文本文件”:
find ./ -name ‘*.txt‘ -exec chmod 644 {} \;
7、使用 imagemagick 批量转换目录下的图片尺寸
首先需要安装有imagemagic:
sudo apt-get install imagemagick
然后,执行下列命令:
find <路径> -name ‘<文件名>‘ -exec convert -resize 长度像素x宽度像素 {} {} \;
8、使用 convmv 和 7z 解决Windows下压缩的文件在Linux下打开乱码
我们需要7zip和convmv。查看是否安装(debian系):
dpkg -l | grep p7zip
dpkg -l | grep convmv
如果未安装,debian系使用下列命令安装:
sudo apt-get install p7zip-full p7zip-rar convmv
假设zip文件名为abc.zip,那么,假设把它放到一个特定的目录~/abczip下,则分别执行
cd ~/abczip
LANG=C 7z x abc.zip
convmv -f cp936 -t utf8 -r --notest *
标签:
原文地址:http://www.cnblogs.com/suyangts/p/5490965.html