添加中文字符编码:$sudo vim
/var/lib/locales/supported.d/local#添加下面的中文字符集zh_CN.GBK GBKzh_CN.GB2312
GB2312zh_CN.GB18030 GB18030使其生效:$sudo dpkg-reconfigure local...
分类:
其他好文 时间:
2014-06-10 21:59:46
阅读次数:
355
Barcode Recognition Decoder
SDK条形码控件是一个在.NET开发环境中读取条码图像的单一DLL控件。在Visual Basic .NET或 C#
.NET开发的桌面应用程序或web应用程序中可轻松的使用它。该SDK没有速度的限制并能够像系统处理的速度一样解码图像。本产品....
分类:
其他好文 时间:
2014-06-10 20:27:53
阅读次数:
243
本文向你讲述如何用android标准的API
(MediaCodec)实现视频的硬件编解码。例程将从摄像头采集视频开始,然后进行H264编码,再解码,然后显示。我将尽量讲得简短而清晰,不展示
那些不相关的代码。但是,我不建议你读这篇文章,也不建议你开发这类应用,而应该转而开发一些戳鱼、打鸟、其乐融融...
分类:
移动开发 时间:
2014-06-10 19:58:12
阅读次数:
332
拼音输入法输出的候选分成两个部分,系统词以及短句(智能组词),智能组词是通过model以及解码弄出来的,后续再说。
系统词就是那些常用的词(词组)收录到词典中,用户的输入和词典中的词match时,直接吐出来,而不需要解码获得。
系统词以及对应的rank(score)对输入法的体验很大,毕竟大多数用户还是继续短词输入。
系统词包含几个部分:
1.基础词
2.高频短串
3....
分类:
其他好文 时间:
2014-06-10 19:17:09
阅读次数:
231
DMCTextFilter 是由北京红樱枫软件有限公司研制和开发的纯文本抽出通用程序库产品。本产品可以从各种各样的文档格式的数据中或从插入的OLE对象中,完全除掉特殊控制信息,快速抽出纯文本数据信息。便于用户实现对多种文档数据资源信息进行统一管理,编辑,检索和浏览。本产品采用了先进的多语言、多平台、多线程的设计理念,支持多国语言(英语,中文简体,中文繁体,日本语,韩国语),多种操作系统(Windows,Solaris,Linux,IBM AIX,Macintosh,HP-UNIX),多种文字集合代码(GBK...
分类:
其他好文 时间:
2014-06-10 19:13:51
阅读次数:
282
最近需要用到redis ,但是在编码这个问题上,纠结了很久。
需求 :
每天一个进程将中文文件入库到redis中(不定时更新) ,另外几个进程读取redis中的信息 ,并处理数据结果。
使用的redis模块 :
redis-py
问题 :
入库正常,读取数据成功,以GBK编码写入文件出现异常。
通过以下参数连...
分类:
其他好文 时间:
2014-06-10 19:10:21
阅读次数:
212
输入法,尤其是拼音输入法,解决的就是一些序列标注的问题,针对给定的状态(拼音),获取其概率最高的隐状态(中文)。
这个是一个标准的HMM,针对HMM的解码过程,是一个很成熟也很完备的东西。
local的计算和存储能力都有限,我们选择一般是二阶马尔科夫,也就是所谓的bigram model。 高阶对质量会有帮助,但是涉及到存储和计算,工程上不可行。
同理,利用ME 以及CRFmodel...
分类:
其他好文 时间:
2014-06-10 18:18:23
阅读次数:
208
由于Node.js仅支持如下编码:utf8, ucs2, ascii, binary, base64, hex,并不支持中文GBK或GB2312之类的编码,
因此如果要读写中文内容,必须要用额外的模块:iconv-lite
注:Node的iconv模块,仅支持linux,不支持Windows,因此要用纯js的iconv-lite,另:作者说iconv-lite的性能更好,具体参考git站点:i...
分类:
Web程序 时间:
2014-06-10 17:52:42
阅读次数:
255
最进要写一个多线程加载资源的资源管理器(ResourceManager)和多线程音频解码器(MultiThread
Decoder)。因为距最近一次用到多线程放下好久了,所以今天把生产者消费者问题练一下手。
为什么选择生产者消费者问题,因为他比较接近资源管理器和多线程音频解码器的原型。 比如...
分类:
编程语言 时间:
2014-06-10 11:45:52
阅读次数:
367
LINUX 如下:
1)导出数据
[root@www.cnscn.org ~]$ mysqldump -u root -p dbname --default-character-set=gbk > base_user.sql;
2)查看导出的sql文件的编码
[root@www.cnscn.org ~]$ file base_user.sql
base_user.sql: UTF-8 Unicode text, with very long lines
3)转成要用的编码
[root@www.cn...
分类:
数据库 时间:
2014-06-10 11:14:39
阅读次数:
394