码迷,mamicode.com
首页 >  
搜索关键字:unicode    ( 5622个结果
编码-1
检测攻击,用的 都是ASCII可表示的可见字符,所以unicode对这些字符编码都是一样的,不同的是各个语言,所以我们解码就简单了:只是针对%uxxxx (%u00xx 和 %uFFxx)全角数字(0-9) uFF10 - uFF19全角大文字(A-Z): uFF21 - uFF3A全角小文字(a-...
分类:其他好文   时间:2014-07-16 22:57:37    阅读次数:300
Ansi,UTF8,Unicode,ASCII编码的差别
近日须要不同的编码,关于上述编码,一直迷迷糊糊,查了些资料,总算大致了解了,以下全是从网上搜来的:1.ASCII和Ansi编码 字符内码(charcter code)指的是用来代表字符的内码.读者在输入和存储文档时都要使用内码,内码分为 单字节内码 -- Single-Byte charact...
分类:其他好文   时间:2014-07-16 22:50:28    阅读次数:215
C#字符ASCII码学习经验
很多时候我们需要得到一个英文字符的 ASCII 码,或者一个汉字字符的 Unicode 码,或者从相关的编码查询它是哪一个字符的编码。很多人,尤其是从 VB 程序序转过来学 C# 的人,会报怨 C# 里为什么没有提供现成的函数来做这个事情——因为在 VB 中有 Asc() 函数和 Chr() 函数用...
分类:其他好文   时间:2014-07-09 14:28:58    阅读次数:253
Python中字符串的有趣玩法
反转一个字符串 >>> S = 'abcdefghijklmnop' >>> S[::-1] 'ponmlkjihgfedcba' 这种用法叫做three-limit slices 除此之外,还可以使用slice对象,例如 >>> 'spam'[slice(None, None, -1)] >>> unicode码与字符(single-character strings)之间...
分类:编程语言   时间:2014-07-09 13:08:50    阅读次数:212
Qt中用正则表达式来判断Text的语种,主要通过判断unicode的编码范围
QString MainWindow::ParseLanguage(QString Text) {     if(Text.length()<=0)     {         return "";     }     QString sRegNum = "[0-9]+";     QString sRegEn = "[a-zA-Z]+";     QString sRegCn =...
分类:其他好文   时间:2014-07-09 10:14:38    阅读次数:301
几种开源分词工具的比較
搜集了一些资料,与同学一起进行了简单的測试,总结例如以下。分词工具特点支持语言原理词典及扩展性StandardAnalyzer中文、英文(unicode)中文:单字符切分英文:依据空格切分ChineseAnalyzer中文,不支持中文和英文及数字混合的文本分词按字分词,与StandardAnalyz...
分类:其他好文   时间:2014-07-08 23:15:59    阅读次数:231
python 乱码处理总结
python乱码处理是一个比较头的话题。。。过程大概是这样子的。。。。字符串在python的内部表示为unicode,因此,在做编码转换的时,通常需要一unicode作为中间编码,即先把其他编码转换通过decode成unicode,再从unicode编码转化成另一种编码所以在编码转换的时候一定要先搞...
分类:编程语言   时间:2014-07-08 23:12:01    阅读次数:267
【剑指offer】第一个只出现一次的数
def FirstNotRepeatingChar(string): hashStr = [0] * 256 for c in string: hashStr[ord(c)] += 1 for c in string: if hashStr[ord(c)] == 1: return c 这里说下ord, 可以作为atoi来用,功能是若给定的参数是一个长度为1的字符串,那么若...
分类:其他好文   时间:2014-07-08 16:15:10    阅读次数:183
【考据】“烫烫烫”与“锟斤拷”的原理
在程序员网站上经常看到一个段子(满满的都是泪啊) 手持两把锟斤拷,口中疾呼烫烫烫。 解释一下为什么会是这两个东西不是别的= =: 棍斤拷乱码: 源于GBK字符集和Unicode字符集之间的转换问题。Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHAR...
分类:其他好文   时间:2014-07-08 13:25:05    阅读次数:196
java读取.properties文件乱码
1.config.properties文件写不进中文,写进去都变成了unicode,解决办法是右键该文件——Properties——Resource——Text file encoding ,选other,我将other改为了UTF-8,这样可以写进去中文,但是读取时又变成乱码了。 2,解决读取乱码: String content = new String(PropertiesConfig.getProperty("mail.content").getBytes("ISO8859-1"), "utf-8"...
分类:编程语言   时间:2014-07-08 13:23:03    阅读次数:160
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!