爬取text 包含某个关键字时zhibo_unicode = unicode("直播","utf-8")sel.xpath('//a[contains(span/text(),"%s")]/@href' % zhibo_unicode) 只能用%s占位符这种类似的方式。 以下方式是不...
分类:
其他好文 时间:
2014-06-28 21:14:38
阅读次数:
232
基本语法 javascript大小写敏感,比如typeof 检测类型关键字,typeOf,typeoF等都是可以作为标示符的,但是不推荐这样做,会影响代码的可读性。 标示符的规则中,是字母、数字、$、_,第1个字符不能是数字。虽然Javascript支持用扩展的ASCII或者Unicode字符,但是...
分类:
其他好文 时间:
2014-06-28 14:29:47
阅读次数:
191
Unicode字符集和多字节字符集关系原文链接:http://blog.csdn.net/stephen1315/article/details/ 在计算机中字符通常并不是保存为图像,每个字符都是使用一个编码来表示的,而每个字符究竟使用哪个编码代表,要取决于使用哪个字符集(charset)。 在最初...
分类:
其他好文 时间:
2014-06-28 12:07:28
阅读次数:
178
vc字符串转换处理:(绝对精华,收集所有的例子)1.头文件中要定义宏; #define UNICODE #define _UNICODE////////////////////char buf[128]; memset(buf,0,128); strcpy(buf,"你好"); WCHAR ...
分类:
其他好文 时间:
2014-06-23 00:33:59
阅读次数:
300
这个方法是用windows的字符集转换的,跟sybase 的unicode码表可能在某些符号上有差别,对于大部分字符来说,尤其是 汉字,应该不会有问题的,如果要求比较高的话,可以买sybase的 unicode开发包,:P [code] #include #include #include #...
分类:
其他好文 时间:
2014-06-21 13:25:12
阅读次数:
254
1. codePointAT方法JavaScript内部,字符以UTF-16的格式储存,每个字符固定为2个字节。对于那些需要 4个字节储存的字符(Unicode编号大于0xFFFF的字符),JavaScript会认为它们是两个字符。ES6提供了codePointAt方 法,能够正确处理4个字节储存的...
分类:
其他好文 时间:
2014-06-21 12:09:17
阅读次数:
299
介绍在前端开发中,为了让中文在不同的环境下都能很好的显示,一般是将中文转化为unicode格式,即\u4f60,比如:”你好啊”的 unicode编码为”\u4f60\u597d\u554a”。JS里将中文转为unicode编码很简单。function convert2Unicode(str) { ...
分类:
Web程序 时间:
2014-06-20 22:48:12
阅读次数:
324
functionunescape($str) {$str= rawurldecode($str);preg_match_all("/(?:%u.{4})|&#x.{4};|&#\d+;|.+/U",$str,$r);$ar= $r[0];//print_r($ar);foreach($aras$k=...
分类:
Web程序 时间:
2014-06-20 22:45:44
阅读次数:
265
/** * $str 原始字符串 * $encoding 原始字符串的编码,默认GBK * $prefix 编码后的前缀,默认"&#" * $postfix 编码后的后缀,默认";" */function unicode_encode($str, $encoding = 'GBK', $prefix...
分类:
Web程序 时间:
2014-06-20 22:26:42
阅读次数:
286
http://blog.csdn.net/jiht594/article/details/7043520对比,本文使用了SetThreadLocale。越来越多的程序支持多语言切换,或者能自动适应当前系统语言,让自己开发的程序支持多语言不仅可以让自己的程序被国人使用,也能让外国程序爱好者使用。VC开...
分类:
其他好文 时间:
2014-06-20 19:54:32
阅读次数:
410