码迷,mamicode.com
首页 > 其他好文 > 详细

pinyin4j的使用

时间:2019-05-20 19:15:42      阅读:102      评论:0      收藏:0      [点我收藏+]

标签:sys   and   unifi   imp   校验   exception   set   output   OLE   

import java.util.Objects;

import org.springframework.util.StringUtils;

import cc.xxx.mall.common.assertion.Assert;
import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

/**
 * 汉子转拼音处理
 * 
 * @project common-utils
 * @fileName PinYin4j.java
 * @Description
 * @author light-zhang
 * @date 2019年3月29日
 * @version 1.0.0
 */
public class PinYin4j {
    /**
     * 将汉字转换为全拼
     * 
     * @param src
     * @return String
     */
    public static String getPinYin(String src) {
        if (StringUtils.isEmpty(src)) {
            return null;
        }
        char[] srcChar = src.toCharArray();
        String[] temp = new String[srcChar.length];
        // 设置汉字拼音输出的格式
        HanyuPinyinOutputFormat pinyinFormat = new HanyuPinyinOutputFormat();
        pinyinFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
        pinyinFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
        pinyinFormat.setVCharType(HanyuPinyinVCharType.WITH_V);

        final StringBuffer buffer = new StringBuffer(srcChar.length);
        try {
            for (char index : srcChar) {
                if (isChinese(index)) {
                    temp = PinyinHelper.toHanyuPinyinStringArray(index, pinyinFormat);
                    buffer.append(temp[0]);// 取出该汉字全拼
                } else {
                    buffer.append(Character.toString(index));
                }
            }
        } catch (BadHanyuPinyinOutputFormatCombination e) {
            Assert.RuntimeException("转换拼音出现错误");
        }
        return buffer.toString();
    }

    /**
     * 提取每个汉字的首字母
     * 
     * @param str
     * @return String
     */
    public static String getPinYinHeadChar(String src) {
        if (StringUtils.isEmpty(src)) {
            return null;
        }
        char[] srcChar = src.toCharArray();
        final StringBuffer buffer = new StringBuffer(srcChar.length);
        for (char index : srcChar) {
            if (isChinese(index)) {// 当是中文时
                String pinyinArray[] = PinyinHelper.toHanyuPinyinStringArray(index);
                if (!Objects.isNull(pinyinArray)) {
                    buffer.append(pinyinArray[0].charAt(0));
                }
            } else {
                buffer.append(index);
            }
        }
        return buffer.toString();
    }

    /**
     * 将字符串转换成ASCII码
     * 
     * @param cnStr
     * @return String
     */
    public static String getCnASCII(String src) {
        if (StringUtils.isEmpty(src)) {
            return null;
        }
        // 将字符串转换成字节序列
        byte[] bytes = src.getBytes();
        final StringBuffer buffer = new StringBuffer(bytes.length);
        for (byte index : bytes) {
            // 将每个字符转换成ASCII码
            buffer.append(Integer.toHexString(index & 0xff));
        }
        return buffer.toString();
    }

    /**
     * 判定输入的是否是汉字
     *
     * @param c 被校验的字符
     * @return true代表是汉字
     */
    public static boolean isChinese(char c) {
        Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
        if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS
                || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS
                || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A
                || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION
                || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION
                || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) {
            return true;
        }
        return false;
    }

    public static void main(String[] args) {
        String fullName = "美方原先对2000亿美元中国商品加征的关税,english";
        // System.out.println(isChinese(fullName.charAt(50)));
        // System.out.println(PinYin4j.getPinYin(fullName));// 全拼
        // System.out.println(PinYin4j.getPinYinHeadChar(fullName));// 首拼
        System.out.println(getCnASCII(fullName));
        for (int i = 0; i < 1; i++) {
            System.out.println(PinYin4j.getPinYinHeadChar(fullName));// 首拼
            System.out.println(PinYin4j.getPinYin(fullName));// 全拼
        }
    }
}

 

pinyin4j的使用

标签:sys   and   unifi   imp   校验   exception   set   output   OLE   

原文地址:https://www.cnblogs.com/light-zhang/p/10895829.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!