网站首页娱乐新闻焦点新闻历史秘闻社会百态技术文章科技资讯其他资讯女性专栏

首页 > 网络文摘 > 正文

PHP汉语转拼音（支持20378汉字）

浏览数：64 / 时间：2015年06月09日

PHP汉语转拼音（支持20378汉字）

在项目中需要通过php来实现抽取汉字的拼音功能，当时实现的方式使用GB2312的字库来实现的，但是在项目中发现像”咔咔“这样的汉字就无能为力了，抽取不出来正确的拼音了。GB2312类库的版本地址：http://blog.csdn.net/wgw335363240/article/details/38588151

为了能够尽可能多的正确抽取出汉字的拼音，参考了pinyin4j.jar的java实现，把汉语拼音的抽取转换为php版本，经测试，使用到的汉字基本都可以转换正确。在转换的过程中，php引擎需要安装了”mbstring“类库的支持，因为php引擎默认是使用iso-8859-1编码来实现的（即strlen(‘中国‘)的长度为6,相当于java中的”中国“.getBytes().length，它的长度也为6,当时java提供了”中国“.tochars()的实现，这个方法得到的chars集合长度为2,实际上就是按照汉字来遍历的），mbstring类库就相当于java中的tochars方法，把字符串按照汉字来遍历。如果不安装类库，还要自己根据utf8编码的规则类遍历byte，从而实现对汉字的拼音的抽取。

注意：

（1）php需要支持mbstring类库

（2）php要是使用utf-8编码编写，这里比较懒，没有编写支持其他语言

汉字转换拼音的原理如下：

（1）定义Unicode与拼音的映射字典（在php体现为数组），该字典从pinyin4j.jar文件，去掉了多音字和声调

（2）输入一个汉字如”严厉“，利用mbstring类库解析为”严“和”厉“两个字符

（3）把解析后的”严“和”厉“依次调用相关方法抽取一个汉字的拼音，如先抽取”严“

（4）把”严“字（此时是3个byte编码）转换为Unicode码（4E25，十进制为：20005）

（5）把Unicode码（4E25）与字典的key进行比较，获取到对应的拼音

（6）”厉”字也采取同样的策略来抽取拼音

抽取效率：

抽取一个汉字的时间：0.00076600000000004秒

代码：

上传到资源中，现在上传不上去。

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

PHP汉语转拼音（支持20378汉字）

标签： style 代码 java 使用 log 文件 http si 方法 style 代码 java 使用 log 文件 http si 方法

相关文章

随机文章

您可能还喜欢

您可能还喜欢

最新图文

更多

可爱穿搭很重要

可爱穿搭很重要

工藤美樱写真集

工藤美樱写真集

斯米兰海水是真不错

斯米兰海水是真不错

海边想拍氛围照

海边想拍氛围照

海岛度假

海岛度假

甜妹 ootd 穿搭

甜妹 ootd 穿搭

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

7080后儿时集体回忆插画

7080后儿时集体回忆插画

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

职业模特拍摄省事很多

职业模特拍摄省事很多

您可能还喜欢

更多

小偷刺业主3刀民警赶到时躺地上装死

小偷刺业主3刀民警赶到时躺地上装死

中国超模

中国超模

红色延安十大美女的人生结局

红色延安十大美女的人生结局

乌鲁木齐一早市发生爆炸

乌鲁木齐一早市发生爆炸

吴莫愁发新片谈李代沫动情落泪：等他回来

吴莫愁发新片谈李代沫动情落泪：等他回来

巴西男子头颈颠倒身残志坚

巴西男子头颈颠倒身残志坚

刘雯秀场新造型太震撼，两条带子做衣服太时髦，肩部“凹凸不平”

刘雯秀场新造型太震撼，两条带子做衣服太时髦，肩部“凹凸不平”

亮瞎眼！帅哥美女骑行西藏前后惊悚对比

亮瞎眼！帅哥美女骑行西藏前后惊悚对比

幼儿园疑发劣质食物家长讨说法

幼儿园疑发劣质食物家长讨说法

美国成人展

美国成人展

您可能还喜欢

更多

狠心母亲将两孩子扔进车流碾死

狠心母亲将两孩子扔进车流碾死

鲁迅书法绵里裹铁

鲁迅书法绵里裹铁

51岁关之琳抹浓妆现身活动脸颊深陷美人迟暮

51岁关之琳抹浓妆现身活动脸颊深陷美人迟暮

女子占座被指责飞踹老人

女子占座被指责飞踹老人

美女翻译头戴发卡清纯小清新

美女翻译头戴发卡清纯小清新

尼泊尔四个月大婴儿震后22小时获救

尼泊尔四个月大婴儿震后22小时获救

海滩试拍

海滩试拍

台湾人气双胞胎曝近照 12岁姐妹俩爱跳舞

台湾人气双胞胎曝近照 12岁姐妹俩爱跳舞

潘主兰书法

潘主兰书法

厦门旅游海边夜拍

厦门旅游海边夜拍