书籍《fonts and encodings》只找到英文版 许令波的《深入分析Java Web技术内幕》3.3节文章字符编码笔记:ASCII,Unicode和UTF-8谈谈Unicode编码UNICODE,GBK,UTF-8区别Unicode字符集和多字节字符集关系谈谈Unicode编码,简要解释....
分类:
其他好文 时间:
2014-08-20 21:03:52
阅读次数:
268
存储肯定是二进制存储,同一个字符(汉子)在不同的字符集下有对应的值,一个字符集相当于一个密码表,键名为字符,键值为二进制数(可表示为十进制,十六进制)UTF8是一个unicode字符集的编码规则,也可以看做是根据unicode字符集根据一个规则计算出的另一个字符集。但是从字符集的原始含义区分来说,u...
分类:
其他好文 时间:
2014-08-20 17:55:32
阅读次数:
225
发现了一个很好的分词类库phpanalysis2.0。 原文连接地址:http://www.phpbone.com/phpanalysis/ 分 词系统简介:PHPAnalysis分词程序使用居于unicode的词库,使用反向匹配模式分词,理论上兼容编码更广泛,并且对utf-8编码尤为方 ...
分类:
Web程序 时间:
2014-08-19 18:49:15
阅读次数:
494
可以说新手使用P-INVOKE最开始的头疼就是C#和C++的字符串传递,因为这里涉及到两个问题。第一:C#的string和C++的字符串首指针如何对应。第二:字符串还有ANSI和UNICODE(宽字符串)之分。本文分三部分阐述:第一:字符串指针当输入参数,第二:字符串指针作为返回值,第三:字符串指针...
分类:
其他好文 时间:
2014-08-19 18:46:25
阅读次数:
274
因为时常用到json_encode去处理数据,json_encode在处理字符串遇上中文时,会把中文转换成\u5371这种格式的字符串,如果想让它能正常显示中文,则可以用pack打包函数进行处理.
分类:
Web程序 时间:
2014-08-19 16:21:34
阅读次数:
425
转义字符Unicode表示方式功能解释\b\u0008 退格符\n\u000a换行符\r\u000d回车符(可以换行)\t\u0009空格符\"\u0022双引号\' \u0027 单引号\\\u005c反斜线换行符在不同的系统下有不同的形式:\n: Mac os下的文本文件换行符\r: uni.....
分类:
编程语言 时间:
2014-08-18 23:33:23
阅读次数:
275
我的中文系统,把对应非unicode字符时的设置,改成了 日文, 结果控制台使用sqlplus时候,总是出现乱码。解决方法是,把NLS_LANG环境变量变成跟系统一样,就可以了。american_america.zhs16gbk =>JAPANESE_JAPAN.JA16SJIS(使用 JA16SJ...
分类:
数据库 时间:
2014-08-18 15:49:32
阅读次数:
355
json:如果是数组,则 {"下标":"值", "下标2":"值"[,...]}如;$arr = array('a'=>'aa', 'b'=>'bb');$str = json_encode($arr);print_r($str);{"a":"aa","b":bb}serialize:如果是数组,则...
分类:
Web程序 时间:
2014-08-18 14:23:22
阅读次数:
210
在抓取某网站数据,结果在数据包中发现了一串编码的数据:"......\u65b0\u6d6a\u5fae\u535a......", 这其实是中文被unicode编码后了的数据,想解码出中文来。解决方案:方案A(稳定版+推荐):function replace_unicode_escape_sequ...
分类:
Web程序 时间:
2014-08-18 10:38:03
阅读次数:
208
ASCII:用7位编码将英文字符和一些常用的符号存诸为从0到127的数值。Unicode:Unicode用一个2字节数字表示每个字符,从0到65535。每个 2 字节数字表示至少在一种世界语言中使用的一个唯一字符。(在多种语言中都使用的字符具有相同的数字码。)这样就确保每个字符一个数字,并且每个数字...
分类:
编程语言 时间:
2014-08-18 00:04:33
阅读次数:
201