标签:font tac trim class rgs pinyin4j char mpi ret
<dependency>
<groupId>com.belerweb</groupId>
<artifactId>pinyin4j</artifactId>
<version>2.5.0</version>
</dependency>
代码
package com.ccytsoft.wkc.util; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; import java.util.regex.Matcher; import java.util.regex.Pattern; /** * 获取首字母工具 * * @author kuangxiang * @Date 15:06 2017/11/24 */ public class ChineseCharacterUtil { /*** * 将汉字转成拼音(取首字母或全拼) * @param hanzi * @param full 是否全拼 * @return */ public static String convertHanzi2Pinyin(String hanzi,boolean full) { /*** * ^[\u2E80-\u9FFF]+$ 匹配所有东亚区的语言 * ^[\u4E00-\u9FFF]+$ 匹配简体和繁体 * ^[\u4E00-\u9FA5]+$ 匹配简体 */ String regExp="^[\u4E00-\u9FFF]+$"; StringBuffer sb=new StringBuffer(); if(hanzi==null||"".equals(hanzi.trim())) { return ""; } String pinyin=""; for(int i=0;i<hanzi.length();i++) { char unit=hanzi.charAt(i); if(match(String.valueOf(unit),regExp))//是汉字,则转拼音 { pinyin=convertSingleHanzi2Pinyin(unit); if(full) { sb.append(pinyin); } else { sb.append(pinyin.charAt(0)); } } else { sb.append(unit); } } return sb.toString(); } /*** * 将单个汉字转成拼音 * @param hanzi * @return */ private static String convertSingleHanzi2Pinyin(char hanzi) { HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat(); outputFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); String[] res; StringBuffer sb=new StringBuffer(); try { res = PinyinHelper.toHanyuPinyinStringArray(hanzi,outputFormat); sb.append(res[0]);//对于多音字,只用第一个拼音 } catch (Exception e) { e.printStackTrace(); return ""; } return sb.toString(); } /*** * @param str 源字符串 * @param regex 正则表达式 * @return 是否匹配 */ public static boolean match(String str,String regex) { Pattern pattern=Pattern.compile(regex); Matcher matcher=pattern.matcher(str); return matcher.find(); } /** * 汉字首字母大写字母 * * @param chinese 汉字 * @param isFull 是否全拼 * * @return 汉字首字母大写字母 */ public static String upperCase(String chinese,boolean isFull){ return convertHanzi2Pinyin("我是中国人123abc",isFull).toUpperCase(); } /** * 汉字首字母小写字母 * * @param chinese 汉字 * @param isFull 是否全拼 * * @return 汉字首字母小写字母 */ public static String lowerCase(String chinese,boolean isFull){ return convertHanzi2Pinyin("我是中国人123abc",isFull).toLowerCase(); } /** * 测试方法 */ public static void main(String[] args) { System.out.println(convertHanzi2Pinyin("我是中国人123abc",false).toUpperCase()); } }
标签:font tac trim class rgs pinyin4j char mpi ret
原文地址:http://www.cnblogs.com/htyj/p/7891918.html