使用现有的txt文本和图片,就可以用wordcloud包生成词云图。大致步骤是:
1、读取txt文本并简单处理;
2、读取图片,以用作背景;
3、生成词云对象,保存为文件。
需要用到3个库:jieba(用于分割文本为词语)、imageio(用于读取图片)、wordcloud(功能核心,用于生成词云)。
我用简历和我的照片,生成了一个词云图:
代码如下:
代码语言:javascript复制import jieba
import imageio
import wordcloud
# 读取txt文本
with open('resume.txt','r',encoding='utf-8') as f:
text = f.read()
# 简单处理文本,删除空格等多余字符
text = text.replace(' ','').replace('t','').replace('n','')
# 使用jieba分隔词语
wordlist = jieba.lcut(text) # ['aa','bb','cc'...]
# print(wordlist)
# 用空格连接各个词语,又形成一个大字符串
string = ' '.join(wordlist) # 'aa bb cc'
# 读取图片
image = imageio.imread('ding.jpg')
# 生成词云图片
# 先实例化一个词云对象
wc = wordcloud.WordCloud(width=image.shape[0], # 词云图宽度同原图片宽度
height=image.shape[1],
background_color='white', # 背景颜色白色
font_path='msyh.ttc', # 指定字体路径,微软雅黑,可从win自带的字体库中找
mask=image, # mask 指定词云形状图片,默认为矩形
scale=3) # 默认为1,越大越清晰
# 再给词云输入文字
wc.generate(string)
# 保存成文件
wc.to_file('wordcloud21.png')
以上就是本文的全部内容,希望对大家的学习有所帮助。