当前位置: 首页 > 工具软件 > pinyin4j > 使用案例 >

java pinyin4j_Java汉字转拼音pinyin4j用法详解

富勇军
2023-12-01

一、工具介绍

pinyin4j 是一个支持将简体和繁体中文转换到成拼音的Java开源类库;

1. 功能

支持同一汉字有多个发音

还支持拼音的格式化输出,比如第几声之类的,

同时支持简体中文、繁体中文转换为拼音…使用起来也非常简单。下面是其官方网址,其中提供了下载:

2. 目录结构及说明

doc : pinyin4j的api文档

lib : pinyin4j的jar包

src: pinyin4j的源代码

CHANGELOG.txt : pinyin4j的版本更新日志

COPYING.txt : LICENSE说明

README.txt : pinyin4j的概要介绍

3. 原理

pinyin4j使用了一个.txt的文本文件(uicode_to_hanyu_pinyin.txt)用来存储汉字unicode编码与拼音的对应关系,通过读取该配置文件达到转换的目的。

该属性文件存储信息的基本格式如下:89E3 (jie3,jie4,xie4) //(对应汉字”解”)89E3 是汉字对应的unicode编码的16进制数,(jie3,jie4,xie4)是该汉字对应的三种读音(在汉语里有多音字)

说明pinyin4j支持多音字的处理pinyin4j的处理过程是这样的:

根据String的toCharArray方法得到每个字符(得到”解”字的unicode编码,实际上是35299,由于java中char和String都是unicode编码的可以直接转为int型的编码数据35299),然后利用Integer.toHexString(c1).toUpperCase()将其转换成16进制数[也就是89E3],通过读取配置文件得到“解”字的拼音(jie3,jie4,xie4),那么这里有三个拼音,pinyin4j的默认取值为第一个,也就是jie3[表示读jie,声调是三声]

二、pinyin4J 使用

pinyin4j 提供的工具类为PinyinHelper,里边提供了静态方法

- toHanyuPinyinString()(过时)

- toHanyuPinyinStringArray()

pinyin4j 中有四个辅助类分别是:

- HanyuPinyinCaseType

- HanyuPinyinToneType

- HanyuPinyinVCharType

- HanyuPinyinOutputFormat

具体功能和用法见一下代码:

HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();

// 控制大小写

// UPPERCASE:大写 (ZHONG)

// LOWERCASE:小写 (zhong)

defaultFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE);

// WITHOUT_TONE:无音标 (zhong)

// WITH_TONE_NUMBER:1-4数字表示英标 (zhong4)

// WITH_TONE_MARK:直接用音标符(必须WITH_U_UNICODE否则异常) (zhòng)

defaultFormat.setToneType(HanyuPinyinToneType.WITH_TONE_NUMBER);

// WITH_V:用v表示ü (nv)

// WITH_U_AND_COLON:用"u:"表示ü (nu:)

// WITH_U_UNICODE:直接用ü (nü)

defaultFormat.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);

// oHanyuPinyinStringArray如果传入的字符不是汉字不能转换成拼音,那么会直接返回null。

String[] pinyin = PinyinHelper.toHanyuPinyinStringArray('重', defaultFormat);

for(String str: pinyin){

System.out.println(str);

}

结果:

ZHONG4

CHONG2

其他工具类

获取获得汉语拼音首字母

将字符串中的中文转化为拼音,英文字符不变

/**

* 获得汉语拼音首字母

*

* @param chines

* 汉字

* @return

*/

public static String getAlpha(String chines) {

String pinyinName = "";

char[] nameChar = chines.toCharArray();

HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();

defaultFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE);

defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);

for (int i = 0; i < nameChar.length; i++) {

if (nameChar[i] > 128) {

try {

pinyinName += PinyinHelper.toHanyuPinyinStringArray(

nameChar[i], defaultFormat)[0].charAt(0);

} catch (BadHanyuPinyinOutputFormatCombination e) {

e.printStackTrace();

}

} else {

pinyinName += nameChar[i];

}

}

return pinyinName;

}

/**

* 将字符串中的中文转化为拼音,英文字符不变

*

* @param inputString

* 汉字

* @return

*/

public static String getPingYin(String inputString) {

HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();

format.setCaseType(HanyuPinyinCaseType.LOWERCASE);

format.setToneType(HanyuPinyinToneType.WITHOUT_TONE);

format.setVCharType(HanyuPinyinVCharType.WITH_V);

String output = "";

if (inputString != null && inputString.length() > 0

&& !"null".equals(inputString)) {

char[] input = inputString.trim().toCharArray();

try {

for (int i = 0; i < input.length; i++) {

if (java.lang.Character.toString(input[i]).matches(

"[\\u4E00-\\u9FA5]+")) {

String[] temp = PinyinHelper.toHanyuPinyinStringArray(

input[i], format);

output += temp[0];

} else

output += java.lang.Character.toString(input[i]);

}

} catch (BadHanyuPinyinOutputFormatCombination e) {

e.printStackTrace();

}

} else {

return "*";

}

return output;

}

/**

* 汉字转换为汉语拼音首字母,英文字符不变

*

* @param chines

* 汉字

* @return 拼音

*/

public static String converterToFirstSpell(String chines) {

String pinyinName = "";

char[] nameChar = chines.toCharArray();

HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();

defaultFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE);

defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);

for (int i = 0; i < nameChar.length; i++) {

if (nameChar[i] > 128) {

try {

pinyinName += PinyinHelper.toHanyuPinyinStringArray(

nameChar[i], defaultFormat)[0].charAt(0);

} catch (BadHanyuPinyinOutputFormatCombination e) {

e.printStackTrace();

}

} else {

pinyinName += nameChar[i];

}

}

return pinyinName;

}

更多关于Java汉字转拼音pinyin4j用法请查看下面的相碰链接

 类似资料: