本文利用了Rcpp包,将C++代码直接在R语言里编译调用,从而实现将汉字转化为拼音,使用方法,将C++代码保存为pinyin.cpp,然后在R语言用sourceCpp()函数编译之后就会出现函数getLetter了
效果:> library(Rcpp)
> sourceCpp("pinyin.cpp")
> getLetter("试试效果怎样")
[1] "SHISHIXIAOGUOZENYANG...
分类:
编程语言 时间:
2015-03-08 21:35:04
阅读次数:
5117
一、简介项目地址:https://github.com/stuxuhai/jpinyinJPinyin是一个汉字转拼音的Java开源类库,在PinYin4j的功能基础上做了一些改进。【JPinyin主要特性】1、准确、完善的字库;Unicode编码从4E00-9FA5范围及3007(〇)的20903...
分类:
其他好文 时间:
2015-02-21 12:00:14
阅读次数:
169
项目中需要实现类似通讯录那样按拼音进行排序以及索引列表的显示的功能,我这里使用了PinYin4Objc这个库来实现此功能。PinYinObjc是一个效率很高的汉字转拼音类库,智齿简体和繁体中文,有如下特点:1.效率高,使用数据缓存,第一次初始化以后,拼音数据存入文件缓存和内存缓存,后面转换效率大大提...
分类:
移动开发 时间:
2015-02-12 17:53:01
阅读次数:
233
using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Text.RegularExpressions;public class PinYin{ //定义拼音区...
分类:
其他好文 时间:
2015-01-06 15:06:17
阅读次数:
194
GB2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个。分区表示GB2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号。这种表示方式也称为区位码。1)01-09区为特殊符号。2)16-55区为一级汉字,按拼音排序。3)56-87区为二级汉字,按部首/笔画排序。...
package oa.common.utils;import net.sourceforge.pinyin4j.PinyinHelper;import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;import net.sourceforge...
分类:
编程语言 时间:
2014-12-30 16:46:51
阅读次数:
177
汉字转拼音 敏感词过滤 禁用词查找 这些很常用的互联网需求 大家出道时是怎么做的? 大家偷懒时是怎么做的? 常规算法 - 从数据库到用户提交内容去匹配: 把数据库中所有数据压到大数组中(这时数据越多,与数据库...
分类:
其他好文 时间:
2014-12-16 17:21:49
阅读次数:
286
实现思路很简单,汉字有21个声母:b, p, m, f, d, t, n, l, g, k, h, j, q, x, zh, ch, sh, r, z, c, s有韵母24个,其中单韵母有6个:a, o, e, i, u, v, 复韵母有18个:ai , ei, ui , ao, ou, iu , ...
分类:
Web程序 时间:
2014-12-12 18:23:28
阅读次数:
781