几天前偶尔看到有人发帖子问“如何自动识别判断url中的中文参数是GB2312还是Utf-8编码” 也拜读了wcwtitxu使用巨牛的正则表达式检测UTF8编码的算法。 使用无数或条件的正则表达式用起来却是性能不高。 刚好曾经在项目中有类似的需求,这里把处理思路和整理后的源代码贴出来供大家参考 先聊聊 ...
分类:
其他好文 时间:
2017-04-04 00:00:53
阅读次数:
283
UnicodeEncodeError、UnicodeDecodeError 错误 字符 字符一个信息单位,它是各种文字和符号的统称,比如一个英文字母是一个字符,一个汉字是一个字符,一个标点符号也是一个字符。 字节 字节(Byte)是计算机中存储数据的单元,一个字节等于一个8位的比特,计算机中的所有数 ...
分类:
编程语言 时间:
2017-04-02 10:30:09
阅读次数:
153
今天在设计表的时候,遇到个小问题,由于不知道未来将要存储的数据有多长(数据是通过第三方http接口提供的,根据sample显示,数据大概是如下:) 也就是6个字符。 我在设计表的时候,有点犹豫,本来准备设计为varchar(6),但担心是按字节计算的,会导致存不下。(数据库采用utf8编码) 于是自 ...
分类:
数据库 时间:
2017-03-23 12:27:59
阅读次数:
248
问题详情: 无法插入中文? 解决办法: 需要修改编码格式,由默认的latin1改为utf8。 改成, 成功! ...
分类:
数据库 时间:
2017-03-17 19:01:08
阅读次数:
351
在mysql中存在着各种utf8编码格式,如下表:1)utf8_bin2)utf8_general_ci utf8_bin将字符串中的每一个字符用二进制数据存储,区分大小写。utf8_genera_ci不区分大小写,ci为case insensitive的缩写,即大小写不敏感。 现在假设执行如下命令 ...
分类:
数据库 时间:
2017-03-14 18:41:37
阅读次数:
250
文章来源: https://www.zhihu.com/question/20523036 今天邮件中收到了一个压缩文件,解压后却是乱码,从网上也找了几个方法,目前这个方法还是比较可靠的,如下所示: 7z方案 需要安装p7zip和convmv,在Fedora下的命令是 su -c 'yum inst ...
分类:
系统相关 时间:
2017-03-08 18:43:16
阅读次数:
174
public static string get_uft8(string unicodeString) { UTF8Encoding utf8 = new UTF8Encoding(); Byte[] encodedBytes = utf8.GetBytes(unicodeString); Stri... ...
多字节版 trim 函数,支持移除首尾 空格(全角、半角)、制表符、换行符 提取内容中的中文: utf8编码内容提取: gb2312编码内容提取: ...
分类:
其他好文 时间:
2017-02-07 16:14:22
阅读次数:
167
Delphi7 调用VS.NET 2005开发的基于.NET 2.0的WebService时发生了错误。查阅资料 http://www.community.borland.com/article/borcon/files/4132/paper/4132.html 发现原来Delphi7客户端虽然支持 ...
C#将字符转换成utf8编码 GB321编码转换 public static string get_uft8(string unicodeString) { UTF8Encoding utf8 = new UTF8Encoding(); Byte[] encodedBytes = utf8.GetB ...
分类:
数据库 时间:
2017-01-19 00:42:38
阅读次数:
374