Python stylecloud制作酷炫的词云图

2022-07-27 08:16:30 浏览数 (2)

这周参加一个创新培训,结束后有个答辩需要制作ppt,为了更好的展示内容,想到用词云图。本文分享一下如何基于Python的stylecloud制作酷炫的词云图。stylecloud是wordcloud优化改良版,操作简单,直接调用。

  • 可以使用 Font Awesome 提供的免费图标更改词云的形状;
  • 通过 palettable 更改调色板以自定义风格,更改背景颜色;
  • 添加梯度使颜色按照特定方向流动。

1、基本说明

首先安装stylecloud和jieba库,jieba主要用来做语义分割用,因为使用的时候会遇到文本解析

代码语言:javascript复制
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple stylecloud
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple jieba

gen_stylecloud 的默认参数

代码语言:javascript复制
def gen_stylecloud(text=None,
                   file_path=None,   # 输入文本/CSV 的文件路径
                   size=512,  # stylecloud 的大小(长度和宽度)
                   icon_name='fas fa-flag',  # stylecloud 形状的图标名称(如 fas fa-grin)。[default: fas fa-flag]
                   palette='cartocolors.qualitative.Bold_5',  # 调色板(通过 palettable 实现)。[default: cartocolors.qualitative.Bold_6]
                   colors=None,
                   background_color="white",  # 背景颜色
                   max_font_size=200,  # stylecloud 中的最大字号
                   max_words=2000,  # stylecloud 可包含的最大单词数
                   stopwords=True,  # 布尔值,用于筛除常见禁用词
                   custom_stopwords=STOPWORDS,
                   icon_dir='.temp',
                   output_name='stylecloud.png',   # stylecloud 的输出文本名
                   gradient=None,  # 梯度方向
                   font_path=os.path.join(STATIC_PATH,
'Staatliches-Regular.ttf'), # stylecloud 所用字体
                   random_state=None,  # 控制单词和颜色的随机状态
                   collocations=True,
                   invert_mask=False,
                   pro_icon_path=None,
                   pro_css_path=None):

在 word.txt 中有下面的一段话

代码语言:javascript复制
Python面向对象---类的基本使用
面向对象
类(class):是一种用来描述具有相同属性和方法的对象的集合。
类变量:类变量在整个实例化的对象中是公用的。一般定义在类中且在函数体之外。
方法:类中的函数
数据成员:类变量或者实例变量用于处理类及其实例对象的相关的数据。
方法重写:如果从父类继承的方法不能满足子类的需求,可以对其进行改写,这个过程叫方法的覆盖(override),也称为方法的重写。
局部变量:定义在方法中的变量,只作用于当前实例的类。
实例变量:在类的声明中,属性是用变量来表示的,这种变量就称为实例变量,实例变量就是一个用 self 修饰的变量。
继承:即一个派生类(derived class)继承基类(base class)的字段和方法。继承也允许把一个派生类的对象作为一个基类对象对待。就像我们定义一个fruit(水果)类,然后又定义了一个fruit类的派生类apple(苹果),它有着fruit类的一些属性和方法,也有着自己的一些独特的属性和方法,和fruit类是一种’is-a’的关系。
实例化:类的一个具体对象,类像当于一个模板,只有我们将其实例化为一个对象后才能对其进行相应的操作。
对象:通过类定义的数据结构实例。对象包括两个数据成员(类变量和实例变量)和方法。

默认情况下,词云的形状是一面旗帜

代码语言:javascript复制
# -*- coding: utf-8 -*-

import jieba
from stylecloud import gen_stylecloud


def cloud(file_name):
with open(file_name, 'r', encoding='utf8') as f:
        word_list = jieba.cut(f.read())
        result = " ".join(word_list)  # 分词用 隔开
# 制作中文云词
        gen_stylecloud(text=result,
                       font_path='C:\Windows\Fonts\simhei.ttf',
                       output_name='t1.png',
                       )  # 必须加中文字体,否则格式错误


if __name__ == "__main__":
    file_name = './word.txt'
    cloud(file_name)

2、用法

2.1、设置背景

代码语言:javascript复制
# -*- coding: utf-8 -*-

import jieba
from stylecloud import gen_stylecloud


def cloud(file_name):
with open(file_name, 'r', encoding='utf8') as f:
        word_list = jieba.cut(f.read())
        result = " ".join(word_list)  # 分词用 隔开
# 制作中文云词
        gen_stylecloud(text=result,
                       font_path='C:\Windows\Fonts\simhei.ttf',
                       background_color='black',
                       output_name='t2.png',
                       )  # 必须加中文字体,否则格式错误


if __name__ == "__main__":
    file_name = './word.txt'
    cloud(file_name)

2.2、更改调色板以自定义风格

代码语言:javascript复制
# -*- coding: utf-8 -*-

import jieba
from stylecloud import gen_stylecloud


def cloud(file_name):
with open(file_name, 'r', encoding='utf8') as f:
        word_list = jieba.cut(f.read())
        result = " ".join(word_list)  # 分词用 隔开
# 制作中文云词
        gen_stylecloud(text=result,
                       font_path='C:\Windows\Fonts\simhei.ttf',
                       palette='colorbrewer.diverging.Spectral_11',
                       output_name='t3.png',
                       )  # 必须加中文字体,否则格式错误


if __name__ == "__main__":
    file_name = './word.txt'
    cloud(file_name)

更多的配色参考 https://jiffyclub.github.io/palettable/

使用 Font Awesome 提供的免费图标更改词云的形状(不用自己找形状)

https://fontawesome.dashgame.com/

选择某个图标,右击复制,把这个图标内容粘贴到代码即可

代码语言:javascript复制
# -*- coding: utf-8 -*-

import jieba
from stylecloud import gen_stylecloud


def cloud(file_name):
with open(file_name, 'r', encoding='utf8') as f:
        word_list = jieba.cut(f.read())
        result = " ".join(word_list)  # 分词用 隔开
# 制作中文云词
        gen_stylecloud(text=result,
                       font_path='C:\Windows\Fonts\simhei.ttf',
                       palette='cartocolors.diverging.Fall_4',
                       icon_name='fas fa-car', 
                       output_name='t4.png',
                       )  # 必须加中文字体,否则格式错误


if __name__ == "__main__":
    file_name = './word.txt'
    cloud(file_name)

2.3、设置颜色梯度方向

垂直方向

代码语言:javascript复制
import jieba
from stylecloud import gen_stylecloud


def cloud(file_name):
with open(file_name, 'r', encoding='utf8') as f:
        word_list = jieba.cut(f.read())
        result = " ".join(word_list)  # 分词用 隔开
# 制作中文云词
        gen_stylecloud(text=result,
                       font_path='C:\Windows\Fonts\simhei.ttf',
                       palette='cartocolors.diverging.TealRose_2',
                       icon_name='fas fa-bell',
                       gradient='vertical',
                       output_name='t5.png',
                       )  # 必须加中文字体,否则格式错误


if __name__ == "__main__":
    file_name = './word.txt'
    cloud(file_name)

水平方向

代码语言:javascript复制
import jieba
from stylecloud import gen_stylecloud


def cloud(file_name):
with open(file_name, 'r', encoding='utf8') as f:
        word_list = jieba.cut(f.read())
        result = " ".join(word_list)  # 分词用 隔开
# 制作中文云词
        gen_stylecloud(text=result,
                       font_path='C:\Windows\Fonts\simhei.ttf',
                       palette='cartocolors.diverging.TealRose_2',
                       icon_name='fas fa-bell',
                       gradient='horizontal',
                       output_name='t6.png',
                       )  # 必须加中文字体,否则格式错误


if __name__ == "__main__":
    file_name = './word.txt'
    cloud(file_name)

3、关键字模式

如果是提供关键字来生成词云,例如word1.txt

代码语言:javascript复制
Python
ython
thon
hon
on
n
Matlab
atlab
tlab
lab
ab
b
数学分析
学分析
分析
析
大数据
数据
据
算法
法
人工智能
工智能
智能
能
创新
新
创业
业
科技
技
我也不知道
也不知道
不知道
知道
道

代码如下

代码语言:javascript复制
import jieba
from stylecloud import gen_stylecloud


def cloud(file_name):
    with open(file_name, 'r', encoding='utf8') as f:
        lines = f.readlines()
        result = ''
        for line in lines:
            result  = ' '   line
        # 制作中文云词
        gen_stylecloud(text=result,
                       font_path='C:\Windows\Fonts\simhei.ttf',
                       output_name='t10.png',
                       )  # 必须加中文字体,否则格式错误


if __name__ == "__main__":
    file_name = './word1.txt'
    cloud(file_name)

其他的个性化需求设计各位读者可以试一下,

最后分享一个网址,可以直接得到词云,

http://www.wordart.cc/

0 人点赞