[root@www ~]# col [-xb]选项与参数:-x :将 tab
键转换成对等的空格键-b :过滤掉所有的控制字符,包括RLF(Reverse Line Feed)和HRF(Halt RLF)范例一:利用 cat -A
显示出所有特殊按键,最后以 col 将 [tab] 转成空白[r.....
分类:
系统相关 时间:
2014-05-16 19:12:22
阅读次数:
349
还记得以前在工作中,将爬来的其它网站的数据导到xml。但是会遇到一个问题:即网页会有ascII的控制字符。
一开始以为是别人为了防止采集而加入的,然后发现一个就往过滤表里加一个。直到慢慢发现,他们都是ascii表里的字符。
找到原因了,就好解决了。...
分类:
Web程序 时间:
2014-05-13 22:52:17
阅读次数:
403
第一部分:编码的种类编码规范用于规定可见字符和控制字符的二进制表示形式,它分为多种类型:下面详细说说编码的方式:1.1
ANSI编码这种编码方式规定了英文占用了一个字节,中文占用两个字节(这个是我们通常所说的编码方式)。因为汉字分为多个类型:有简体中文,有繁体中文,还有日语中的汉字。所以ANSI编码...
分类:
其他好文 时间:
2014-05-08 19:44:49
阅读次数:
346
Latin1Latin1是ISO-8859-1的别名,有些环境下写作Latin-1。ISO-8859-1编码是单字节编码,向下兼容ASCII,其编码范围是0x00-0xFF,0x00-0x7F之间完全和ASCII一致,0x80-0x9F之间是控制字符,0xA0-0xFF之间是文字符号。ISO-885...
分类:
其他好文 时间:
2014-05-07 02:29:01
阅读次数:
305
islower() 是否为小写字母isupper() 是否为大写字母isalpha()
是否为字母isalnum() 是否为字母或十进制数字iscntrl() 是否为控制字符isprint() ...
分类:
其他好文 时间:
2014-05-02 20:37:35
阅读次数:
420