NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;官方网址:http://ictclas.nlpir.org(地址一直在变,要是不能用直接搜NLPIR).....
分类:
其他好文 时间:
2015-05-10 12:45:23
阅读次数:
254
set nocompatible
source $VIMRUNTIME/vimrc_example.vim
source $VIMRUNTIME/mswin.vim
behave mswin
set fileencodings=ucs-bom,utf-8,cp936,gb18030,big5,euc-jp,euc-kr,latin1
"set encoding=utf-8
set te...
分类:
系统相关 时间:
2015-05-07 12:45:42
阅读次数:
195
编码规则是utf-8,如网页头中的:
那么js文件中如果有中文输出就会出现乱码,解决此个问题有两个方法:
1、在引用javascript输出的地方加上charset="gb2312" 或 charset="big5"(假设输出的是Big5繁体字)。
例:
2、把js文件保存为utf-8编码。 直接用记事本打开,下面有个编码,另存为utf-...
分类:
Web程序 时间:
2015-05-06 11:01:39
阅读次数:
139
一、网站搭建前提搭建好LAMP运行环境下载网站程序,这里以DiscuzX3.2作为示例Discuz程序下载地址:简体中文GBKhttp://download.comsenz.com/DiscuzX/3.2/Discuz_X3.2_SC_GBK.zip繁体中文BIG5http://download.comsenz.com/DiscuzX/3.2/Discuz_X3.2_TC_BIG5.zip简体UTF-8http://d..
分类:
Web程序 时间:
2015-05-01 01:53:55
阅读次数:
238
1、编码语系转换
常见中文编码语系有gb2312、big5、utf8,有时出于某种目的,一个文件要在不同的编码语系间转换,用iconv命令即可。
$ iconv -l
-l列出支持的编码语系。
$ iconv -f encoding -t encoding filename [-o file]
-f表示原编码格式,-t表示目标编码格式,-o表示stdout到文件。
还有一个好用的命令f...
分类:
其他好文 时间:
2015-04-23 10:54:58
阅读次数:
161
本地化过程中涉及到源文件和目标文件的传输问题,这时候编码就显得很重要。中文的网页和操作系统中通常采用ANSI编码,这也是微软OS的一个字符标准。对于ANSI,不同的国家和地区制定了不同的标准,由此产生了GB2312(简体中文),BIG5(繁体中文),JIS(日文)等各自的编码标准。但不同的ANSI编...
分类:
其他好文 时间:
2015-04-22 18:00:02
阅读次数:
123
源地址国内的专业Linux网站(GB)ChinaUnixLinux中国实验楼:免费提供了Linux在线实验环境,不用在自己机子上装系统也可以学习Linux,超方便实用!。国内的专业Linux网站(BIG5)香港Linux用户协会:了解香港Linux的好网站。Linux@Taiwan:台湾的Linux...
分类:
系统相关 时间:
2015-04-18 19:14:29
阅读次数:
200
终端输入gsettings set org.gnome.gedit.preferences.encodings auto-detected "['UTF-8','GB18030','GB2312','GBK','BIG5','CURRENT','UTF-16']"回车即可。
分类:
系统相关 时间:
2015-04-17 23:40:37
阅读次数:
240
首先,解释一下字符集:汉字编码:* GB2312字集是简体字集,全称为GB2312(80)字集,共包括国标简体汉字6763个。 * BIG5字集是台湾繁体字集,共包括国标繁体汉字13053个。 * GBK字集是简繁字集,包括了GB字集、BIG5字集和一些符号,共包括21003个字符。 * GB180...
分类:
系统相关 时间:
2015-04-16 11:52:28
阅读次数:
272
gedit中文文本乱码。
复制以下命令到终端中,然后回车即可:gsettings set org.gnome.gedit.preferences.encodings auto-detected "['UTF-8','GB18030','GB2312','GBK','BIG5','CURRENT','UTF-16']"...
分类:
系统相关 时间:
2015-04-14 16:38:44
阅读次数:
148