今天发现c_parser导出数据是会丢掉某些行,给过调试发现是他处理utf8编码时计算有误,目前还没有发现自动解决总是的方法,只会手动改代码来解决. 下一步计划把c_parser移植到windows下,并改正发现的问题, 做成windows程序的原因是自己对linux编程不太熟,调试更不熟,又考虑到... ...
分类:
数据库 时间:
2016-05-18 21:21:31
阅读次数:
176
在perl语言中,字符串只有两种形式:
(1)字节流字符串:不管字符串是何种内容、何种编码,都解析为单字节的字节串。
(2)字符流字符串:按照UTF8编码方案,从左到右把字节流解析为连续的字符流。
perl如何确定一个字符串是字节流字符串还是采用UTF8编码的字符流字符串呢?
在Perl内部,每个字符串都有一个UTF8编码标志,这个标志有两个状态:on或者off。如果标志为on,就是字符流...
分类:
其他好文 时间:
2016-05-13 02:37:16
阅读次数:
98
一:什么是NLPIR? NLPIR汉语分词系统(自然语言处理与信息检索共享平台),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平博士先后倾力打造十余年,内核升级10次。 全球用户突破20万,先后获得了 ...
分类:
其他好文 时间:
2016-05-09 15:50:35
阅读次数:
170
UTF-8:Unicode TransformationFormat-8bit,允许含BOM,但通常不含BOM。是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码。UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示。如,如果是UTF8编码,则在外国人的英文IE上也能显示...
分类:
其他好文 时间:
2016-04-27 13:04:05
阅读次数:
211
在mysql中存在着各种utf8编码格式,如下表: 1)utf8_bin 2)utf8_general_ci 3)utf8_general_cs utf8_bin将字符串中的每一个字符用二进制数据存储,区分大小写。 utf8_genera_ci不区分大小写,ci为case insensitive的缩 ...
分类:
数据库 时间:
2016-04-24 21:42:12
阅读次数:
230
为了支持中文显示,mysql服务使用utf8编码,使用navicate连接数据库,为了保持编码的一致性,连接也使用utf8编码,如下图所示:连接完成,表定义的备注信息一直乱码,起初以为是mysql服务器的问题,各种设置无果!这时查看使用的字符集:showvariableslike‘char%‘;发现,client..
分类:
数据库 时间:
2016-04-16 19:37:37
阅读次数:
270
实在是厌烦了notepad的utf8模式了,于是决定修改之,方案如下: 使用任何支持hex模式的编辑器打开%SystemRoot%/system32/notepad.exe查找二进制串56 8D 45 FC 50 6A 03把最后的03改成00(本来的03是指bom的utf8编码长度,改成0就等于不 ...
分类:
其他好文 时间:
2016-04-10 06:51:48
阅读次数:
186
dos命令窗口修改编码,CMD编码修改方法 第一步,打开命令窗口有两种方法第一种:可以点击左下角的开始按钮,在运行里面输入CMD,然后敲回车2第二种:组合键WIN+R键,组合键后就会弹出窗口,然后输入CMD,回车3下面就是打开的命令窗口,如果我们要修改成UTF8编码,输入命令CHCP 650014回 ...
分类:
其他好文 时间:
2016-04-07 12:04:00
阅读次数:
191
我用的appserv-win32-2.5.10做的环境,装这个包的时候用默认的utf8编码。在写数据库连接文件时,写成:$conn = mysql_connect("$host","$user","$password");mysql_query("SET NAMES 'UTF8'");mysql_s
分类:
Web程序 时间:
2016-03-14 12:05:20
阅读次数:
172
ubuntu使用apt-get安装mysql后,server的默认编码是latin1,下面把server的编码修改成utf8。 编码相关信息: 1 2 3 4 5 6 7 8 9 10 11 12 13 mysql> show variables like 'character%'; +------
分类:
数据库 时间:
2016-03-09 20:56:10
阅读次数:
243