有时在处理文件时候,我们需要将中文姓名转换为拼音,或者是转换为拼音首字母,本文将介绍三种Python实现的方法,最后给一个批量操作的代码案例!
一、xpinyin
开门见山,Python中文字转拼音可以使用xpinyin,直接使用pip安装即可"htmlcode">
pip install xpinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
接着导入xpinyin下的 Pinyin 方法如下
from xpinyin import Pinyin
首先试试中文名转拼音,
p = Pinyin() result1 = p.get_pinyin('叶伏天') result1
结果如下:
'ye-fu-tian'
tone_marks
可以显示声调
result2 = p.get_pinyin('叶伏天', tone_marks='marks')
结果如下:
'yè-fú-tiān'
去掉空格"htmlcode">
s = result1.split('-') result3 = s[0].capitalize() + ' ' + ''.join(s[1:]).capitalize() result3 结果如下: 'Ye Futian'
有时需要中文名转拼音首字母,也很简单"text-align: center">
二、pypinyin
另一种方法是使用pypinyin,安装同样可以使用pip
# 安装 pip install pypinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
直接导入就行"htmlcode">
import pypinyin
再来看看中文名转拼音的实现办法
result1 = pypinyin.pinyin('叶庭云', style=pypinyin.NORMAL) result1
结果如下:
[['ye'], ['ting'], ['yun']]
启用多音节来实现声调
result2 = pypinyin.pinyin('叶庭云', heteronym=True) result2
结果如下:
[['yè', 'xié'], ['tíng'], ['yún']]
因为返回的是一个嵌套的list,所以需要简单调整一下
result_ = [i[0] for i in result1] result3 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize() result3
结果如下:
'Ye Tingyun'
启用多音字模式时,竟然发现 ‘叶' 也是多音字,查询了资料发现确实是这样,涨知识啦!
下面是中文名转拼音首字母的方法
三、snownlp
最后一种办法是使用snownlp,同样的pip安装与导入如下:
# 安装 pip install snownlp -i http://pypi.douban.com/simple --trusted-host pypi.douban.com # 导入 from snownlp import SnowNLP
中文名转拼音"htmlcode">
s = SnowNLP('叶庭云') s.pinyin
结果如下:
['ye', 'ting', 'yun']
将list转为字符串
result4 = s.pinyin[0].capitalize() + ' ' + ''.join(s.pinyin[1:]).capitalize() result4
结果如下:
'Ye Tingyun'
最后是中文名转拼音首字母
四、批量将中文名转换成拼音
现在,掌握了基本使用后,我们就能利用批量操作来解放双手
import pypinyin import pandas as pd df = pd.read_excel('学生名单_test.xls') df.head()
先导入一份学生名单如下
下面是使用pypinyin批量将全部学生的中文姓名转换为拼音
pinyin_name = [] first_pinyin = [] for i in df['姓名']: result = pypinyin.pinyin(i, style=pypinyin.NORMAL) result_ = [i[0] for i in result] result2 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize() result3 = ''.join([i[0].upper() for i in result_]) print(result2, i, sep=' ') pinyin_name.append(result2) first_pinyin.append(result3) df['英文名'] = pinyin_name df['拼音首字母'] = first_pinyin df.head()
或者是转换为拼音首字母,运行结果如下:
以上就是python 批量将中文名转换为拼音的详细内容,更多关于python 中文名转换为拼音的资料请关注其它相关文章!
华山资源网 Design By www.eoogi.com
广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
华山资源网 Design By www.eoogi.com
暂无评论...
更新日志
2024年11月15日
2024年11月15日
- 老头杯第二届规则是什么 英雄联盟老头杯第二届规则介绍
- 王崴-爵士听堂.蓝色波萨(HQCD)[WAV+CUE]
- 群星《欧美动听情歌·柔情第5季》2CD【DTS-WAV分轨】
- [极品珍藏]德意志进行曲集卡拉扬SACD[WAV+CUE]
- 前暴雪制作人呼吁反击DEI 玩家:夺回文化!
- 腾讯证实子公司Sharkmob大规模裁员:整个市场很低迷
- 荣耀加冕 问鼎冠军 中国代表队获第四届东亚电竞锦标赛团体总冠军
- 污甩乐队.2024-Let.the.dirt.left【摩登天空】【FLAC分轨】
- 杜德伟.1994-ALL.FOR.YOU(英)【滚石】【WAV+CUE】
- 群星.2013-百代好声音ADMSCD1【EMI百代】【WAV+CUE】
- 群星《私人音乐精选示范碟》PRIVATEMUSIC 发烧唱片名碟[WAV+CUE][1.1G]
- 山口百惠《あなたへの子守唄》日本索尼钢刻字首版[WAV分轨][1.1G]
- 群星《宝丽金20周年特别发烧版》1:1母盘直刻限量编号[低速原抓WAV+CUE][1G]
- 凤飞飞.1984-仲夏(夏艳)[WAV]
- 常安《民歌红·江南燕》DTS-ES6.1[WAV]