标签:void tab als 依赖 set empty continue 汉字转拼音 ext
JAVA中汉字转拼音的方法并不复杂,可以使用pinyin4j包来实现。
一、下载pinyin4j的架包,并导入项目中,如下:
如果是maven项目,maven依赖如下:
1 <dependency> 2 <groupId>com.belerweb</groupId> 3 <artifactId>pinyin4j</artifactId> 4 <version>2.5.0</version> 5 </dependency>
二、汉字转拼音方法,附上代码例子,如下:
1 public class PinyinUtil { 2 3 public static void main(String[] args) throws Exception { 4 System.out.println(getPinyin("haha你笑起来真好看", " ")); 5 System.out.println(getPinyinInitials("你笑起来真好看")); 6 } 7 8 /** 9 * 将汉字转换为全拼 10 * 11 * @param text 文本 12 * @param separator 分隔符 13 * @return {@link String} 14 */ 15 public static String getPinyin(String text, String separator) { 16 char[] chars = text.toCharArray(); 17 HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat(); 18 // 设置大小写 19 format.setCaseType(HanyuPinyinCaseType.LOWERCASE); 20 // 设置声调表示方法 21 format.setToneType(HanyuPinyinToneType.WITHOUT_TONE); 22 // 设置字母u表示方法 23 format.setVCharType(HanyuPinyinVCharType.WITH_V); 24 String[] s; 25 String rs = StringUtils.EMPTY; 26 try { 27 StringBuilder sb = new StringBuilder(); 28 for (int i = 0; i < chars.length; i++) { 29 // 判断是否为汉字字符 30 if (String.valueOf(chars[i]).matches("[\\u4E00-\\u9FA5]+")) { 31 s = PinyinHelper.toHanyuPinyinStringArray(chars[i], format); 32 if (s != null) { 33 sb.append(s[0]).append(separator); 34 continue; 35 } 36 } 37 sb.append(String.valueOf(chars[i])); 38 if ((i + 1 >= chars.length) || String.valueOf(chars[i + 1]).matches("[\\u4E00-\\u9FA5]+")) { 39 sb.append(separator); 40 } 41 } 42 rs = sb.substring(0, sb.length() - 1); 43 } catch (BadHanyuPinyinOutputFormatCombination e) { 44 e.printStackTrace(); 45 } 46 return rs; 47 } 48 49 /** 50 * 获取汉字首字母 51 * 52 * @param text 文本 53 * @return {@link String} 54 */ 55 public static String getPinyinInitials(String text) { 56 StringBuilder sb = new StringBuilder(); 57 for (int i = 0; i < text.length(); i++) { 58 char ch = text.charAt(i); 59 String[] s = PinyinHelper.toHanyuPinyinStringArray(ch); 60 if (s != null) { 61 sb.append(s[0].charAt(0)); 62 } else { 63 sb.append(ch); 64 } 65 } 66 return sb.toString(); 67 } 68 }
其中,拼音格式参数说明:
HanyuPinyinCaseType | 设置拼音的大小写 | LOWERCASE | 小写 |
UPPERCASE | 大写 | ||
HanyuPinyinToneType | 设置拼音的音调 | WITH_TONE_NUMBER | 用数字表示音调。如:wo3 |
WITHOUT_TONE | 不表示音调。如:wo | ||
WITH_TONE_MARK | 用符号表示音调。如:w? | ||
HanyuPinyinVCharType | 设置拼音的表示方法 | WITH_U_AND_COLON | 用字母u和冒号表示。如:lu: |
WITH_V | 用字母v表示。如:lv | ||
WITH_U_UNICODE | 用Unicode编码表示。如:lü |
PS:这里有一个注意的点,就是音调和表示方法是配合使用的,所以用符号表示音调的时候,只能使用Unicode编码的方法显示,如果设置其他两种表示方式会报错。
格式效果:
表示方法 | ||||
WITH_U_AND_COLON | WITH_V | WITH_U_UNICODE | ||
声调 | WITH_TONE_NUMBER | lu3 | lv | lü3 |
WITHOUT_TONE | lu | lv3 | lü | |
WITH_TONE_MARK | Exception | Exception | lǚ |
三、使用效果如下:
文本:haha你笑起来真好看
全拼:haha ni xiao qi lai zhen hao kan
首字母:nxqlzhk
标签:void tab als 依赖 set empty continue 汉字转拼音 ext
原文地址:https://www.cnblogs.com/pcheng/p/12871373.html