实用小技巧 利用Python一秒将全部中文名转为拼音

2021-01-23 13:06:25 浏览数 (1)

文章目录

  • 一、xpinyin
  • 二、pypinyin
  • 三、snownlp
  • 四、批量将中文名转换成拼音

一、xpinyin

代码语言:txt复制
# 安装xpinyin
pip install xpinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

使用 xpinyin 下的 Pinyin 方法

代码语言:txt复制
# 使用xpinyin下的 Pinyin 方法
from xpinyin import Pinyin

试试中文名转拼音

代码语言:txt复制
p = Pinyin()
result1 = p.get_pinyin('叶伏天')
result1

结果如下:
'ye-fu-tian'

tone_marks:设置显示声调

代码语言:txt复制
# tone_marks:显示声调
result2 = p.get_pinyin('叶伏天', tone_marks='marks')
result2

结果如下:
'yè-fú-tiān'

字符串操作,去掉 ‘-’,并且将姓和名的首字母大写

代码语言:txt复制
s = result1.split('-')
result3 = s[0].capitalize()   ' '   ''.join(s[1:]).capitalize()
result3

结果如下:
'Ye Futian'

中文名转拼音首字母

二、pypinyin

代码语言:txt复制
# 安装pypinyin
pip install pypinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
代码语言:txt复制
import pypinyin

中文名转拼音

代码语言:txt复制
result1 = pypinyin.pinyin('叶庭云', style=pypinyin.NORMAL)
result1

结果如下:
[['ye'], ['ting'], ['yun']]
代码语言:txt复制
# 启用多音字模式
result2 = pypinyin.pinyin('叶庭云', heteronym=True)
result2

结果如下:
[['yè', 'xié'], ['tíng'], ['yún']]
代码语言:txt复制
result_ = [i[0] for i in result1]
result3 = result_[0].capitalize()   ' '   ''.join(result_[1:]).capitalize()
result3

结果如下:
'Ye Tingyun'

启用多音字模式时,竟然发现 ‘叶’ 也是多音字,查询了资料发现确实是这样,涨知识啦!

中文名转拼音首字母

三、snownlp

代码语言:txt复制
# 安装snownlp
pip install snownlp -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
代码语言:txt复制
from snownlp import SnowNLP

中文名转拼音

代码语言:txt复制
s = SnowNLP('叶庭云')
s.pinyin

结果如下:
['ye', 'ting', 'yun']
代码语言:txt复制
result4 = s.pinyin[0].capitalize()   ' '   ''.join(s.pinyin[1:]).capitalize()
result4

结果如下:
'Ye Tingyun'

中文名转拼音首字母

四、批量将中文名转换成拼音

读取测试数据

代码语言:txt复制
import pypinyin
import pandas as pd

df = pd.read_excel('学生名单_test.xls')
df.head()

批量将中文名转拼音

代码语言:txt复制
pinyin_name = []
first_pinyin = []
for i in df['姓名']:
    result = pypinyin.pinyin(i, style=pypinyin.NORMAL)
    result_ = [i[0] for i in result]
    result2 = result_[0].capitalize()   ' '   ''.join(result_[1:]).capitalize()
    result3 = ''.join([i[0].upper() for i in result_])
    print(result2, i, sep=' ')
    pinyin_name.append(result2)
    first_pinyin.append(result3)
    
df['英文名'] = pinyin_name
df['拼音首字母'] = first_pinyin
df.head()

运行结果如下:

作者:叶庭云 微信公众号:修炼Python CSDN:https://yetingyun.blog.csdn.net/ 本文仅用于交流学习,未经作者允许,禁止转载,更勿做其他用途,违者必究。 觉得文章对你有帮助、让你有所收获的话,期待你的点赞呀,不足之处,也可以在评论区多多指正。

0 人点赞