爬取text 包含某个关键字时zhibo_unicode = unicode("直播","utf-8")sel.xpath('//a[contains(span/text(),"%s")]/@href' % zhibo_unicode) 只能用%s占位符这种类似的方式。 以下方式是不...
分类:
其他好文 时间:
2014-06-28 21:14:38
阅读次数:
232
这个方法是用windows的字符集转换的,跟sybase 的unicode码表可能在某些符号上有差别,对于大部分字符来说,尤其是 汉字,应该不会有问题的,如果要求比较高的话,可以买sybase的 unicode开发包,:P [code] #include #include #include #...
分类:
其他好文 时间:
2014-06-21 13:25:12
阅读次数:
254
1. codePointAT方法JavaScript内部,字符以UTF-16的格式储存,每个字符固定为2个字节。对于那些需要 4个字节储存的字符(Unicode编号大于0xFFFF的字符),JavaScript会认为它们是两个字符。ES6提供了codePointAt方 法,能够正确处理4个字节储存的...
分类:
其他好文 时间:
2014-06-21 12:09:17
阅读次数:
299
介绍在前端开发中,为了让中文在不同的环境下都能很好的显示,一般是将中文转化为unicode格式,即\u4f60,比如:”你好啊”的 unicode编码为”\u4f60\u597d\u554a”。JS里将中文转为unicode编码很简单。function convert2Unicode(str) { ...
分类:
Web程序 时间:
2014-06-20 22:48:12
阅读次数:
324
functionunescape($str) {$str= rawurldecode($str);preg_match_all("/(?:%u.{4})|&#x.{4};|&#\d+;|.+/U",$str,$r);$ar= $r[0];//print_r($ar);foreach($aras$k=...
分类:
Web程序 时间:
2014-06-20 22:45:44
阅读次数:
265
/** * $str 原始字符串 * $encoding 原始字符串的编码,默认GBK * $prefix 编码后的前缀,默认"&#" * $postfix 编码后的后缀,默认";" */function unicode_encode($str, $encoding = 'GBK', $prefix...
分类:
Web程序 时间:
2014-06-20 22:26:42
阅读次数:
286
为了程序编写方便,根除乱码问题等等需求,很多新项目都采用了Unicode编码。同时,不少使用MBCS多字节编码的旧项目为了升级,也有了转向Unicode编码的意向。不过,从MBCS升级到Unicode并不是无缝的,该问题的复杂程度,取决于代码总量和代码的编写质量。本文是作者在一个C/C++项目中的一...
分类:
其他好文 时间:
2014-06-18 14:16:01
阅读次数:
147
搜集了一些资料,与同学一起进行了简单的測试,总结例如以下。分词工具特点支持语言原理词典及扩展性StandardAnalyzer中文、英文(unicode)中文:单字符切分英文:依据空格切分ChineseAnalyzer中文,不支持中文和英文及数字混合的文本分词按字分词,与StandardAnalyz...
分类:
其他好文 时间:
2014-06-18 14:09:29
阅读次数:
162
1 string类型是密封(sealed)类型,即从object对象中继承而来。
2 string实例实际就是一个Unicode字符串
3 string类型的值可以是字符串文字
4 string关键字是预定义类System.String的别名,所以我们可以这样写:
string name = "Fred"; or String name = "Fred"
5 同样的...
分类:
其他好文 时间:
2014-06-18 11:46:23
阅读次数:
184
一、NMAKE 和 Makefile
1.1 NMAKE - 命令解释器, 根据Makefile文件中定义的脚本,完成项目的编译等操作
1.2 Makefile - 定义编译、连接等脚本语言
1.3 Makefile 文件的使用
1.3.1 基本语法规则
window.exe:window.obj //依赖行
cl.exe window.c /c...