本文旨在介绍CoNLL格式的中文依存语料库(汉语依存树库)、CoNLL格式相关工具,以及提供两个公开的中文依存语料库下载。最近做完了分词、词性标注、命名实体识别、关键词提取、自动摘要、拼音、简繁转换、文本推荐,感觉HanLP初具雏形。现在希望拿下依存句法分析,这样我就做出了史上第一个(?)民间句法分...
分类:
其他好文 时间:
2014-11-19 21:59:55
阅读次数:
256
下载搜狗拼音输入法安装包删除ibus sudo dpkg -P ibus* sudo dpkg -l | grep ibus #确认没有以ibus开头的包存在安装软件sudo apt-get install fcitxsudo dpkg -i sogou-pinyin_linux...
分类:
系统相关 时间:
2014-11-18 13:22:28
阅读次数:
252
using System;using System.Collections.Generic;using System.Text;namespace WindowsApplication1{ public static class ChineseToPinYin {/// /// 汉字拼音转换类 /....
分类:
其他好文 时间:
2014-11-17 19:07:06
阅读次数:
748
字头字母与之前军牌相对应汉字所对应单位V军军委、四总部、大区级军直单位K空空军H海海军B北北京军区S沈沈阳军区L兰兰州军区J济济南军区N南南京军区G广广州军区C成成都军区 可以看出,除了军委、四总部以及大区级军直单位所用的字母为“V”字外,其它均采用了单位名称第一个字的汉语拼音首字母作为新式军用车....
分类:
其他好文 时间:
2014-11-16 22:52:48
阅读次数:
445
汉语拼音不好怎么办?网站拼音搜索怎么搞?一切尽在转换神器~软件和源码先发布,等我有时间再讲解~软件下载:http://pan.baidu.com/s/1kTMIxOb 源码下载:http://pan.baidu.com/s/1gdGKVVd 本期推荐:codesmith三层模板英朗大字典 下一期:....
什么是索引拿汉语字典的目录页(索引)打比方:正如汉语字典中的汉字按页存放一样,SQL Server中的数据记录也是按页存放的,每页容量一般为4K 。为了加快查找的速度,汉语字(词)典一般都有按拼音、笔画、偏旁部首等排序的目录(索引),我们可以选择按拼音或笔画查找方式,快速查找到需要的字(词)。同理,...
分类:
数据库 时间:
2014-11-13 09:14:47
阅读次数:
314
在学习三层架构时,我们在需要获取中文字所获取的拼音,需要引进一个ChnCharInfo.dll的程序文件,并且引用命名空间using Microsoft.International.Converters.PinYinConverter;接下来是如何实现拼音的获取: 1 public static.....
输入汉字,提取其首字母: /// /// 汉字转拼音缩写 /// Code By /// 2004-11-30 /// /// 要转换的汉字字符串 /// 拼音缩写 public s...
分类:
其他好文 时间:
2014-11-11 22:45:50
阅读次数:
292
下载ibus-googlepinyin-0.1.2.tar.bz2和libgooglepinyin-0.1.2.tar.bz2切换到root权限sudosocdlibgooglepinyin-0.1.2mkdirbuildcdbuildcmake..-DCMAKE_INSTALL_PREFIX=/usrmakemakeinstall编译libgooglepinyin结束后编译ibus-googlepinyincdibus-googlepinyin-0.1.2mkdirbuildc..
分类:
其他好文 时间:
2014-11-10 15:51:40
阅读次数:
172
原文:SQL——索引
1. 什么是索引 索引是SQlServer编排数据的内部方法,是检索表中数据的直接通道。它类似汉语词典里面
的拼音目录,通过它可以快速查找到某个字词。 索引页是数据库中存储说要的数据页。索引页存放检索数据行的关键字页及数据行的地址指针。索引页类似于汉语字典中按拼音或笔画排序的目...
分类:
数据库 时间:
2014-11-10 13:33:59
阅读次数:
220