一张图总结今年发生的乱七八糟的事

2019-09-23 11:15:49 浏览数 (1)

今年到现在也算是差不多过完了,可以差不多来个年度总结了,围绕在我们生活的世界今年发生过什么大事???

先说说我印象比较深刻的几件事吧,孟晚舟被捕,马爸爸宣布即将退位,暴走大事件被禁,AI大会上海,IO2018,Xmax发布会,magic2发布会等等。

那么在你们的心中是不是也有属于自己印象深刻的事情,那我们现在来盘点盘点吧。

首先,我这里有一份甲哥爬下来的数据,大家也可以拿去看看:

链接:

https://pan.baidu.com/s/1LKRVWpdX3hjRIJ3HaBP2gA

提取码:

de6h

里面爬的资料还算全(当然也有一些不在,有效期的话可以自己去爬一爬,我就偷个懒,拿了现成的数据)

我们需要解析xlsx的数据,之后把觉得有用是数据处理一下拿过来:

我们需要用到的包有pandas,worldcloud,pillow,(matplotlib复制显示图像用的,如果你只是想把图片存下来就不需要用到它了)

代码语言:javascript复制
import pandas as pd
import matplotlib.pyplot as plt
from wordcloud import WordCloud, ImageColorGenerator
import os
import numpy as np
import PIL.Image as Image

读取xlsx:

代码语言:javascript复制
data = pd.read_excel('2018.xlsx',header=0, encoding='utf-8')

获取每条数据:

代码语言:javascript复制
for i in range(len(data)):
    item = list(data.loc[i])
    item = [str(i) for i in item]
    list_sheet.append(item)

之后我们就可以筛选每条数据了,这里我们先介绍一个简单的处理,可以查看每条数据的点赞评论,如果点赞超过2或者评论超过2,我们就默认数据是有效的,当然你可以可以提高要求,具体就看你自己,要求不一样,产生的图片当然也就不一样。

代码语言:javascript复制
info=[]
for i in list_sheet:
    if int(i[2])>=1 or int(i[3])>=1:
        info.append(i[1])

之后,因为要做词云,需要把list数据拿出来做成字符串,我们使用join方法:

代码语言:javascript复制
result = "".join(info)

之后制作词云:

代码语言:javascript复制
d= os.path.dirname(os.path.abspath( __file__ ))
pic = np.array(Image.open(os.path.join(d, r"3.jpg")))
my_wordcloud = WordCloud(background_color="white",
                         max_words=20000,
                         mask=pic,
                         max_font_size=400,
                         random_state=420,
                         font_path=r'C:UsersewuxyuqDesktopframeworksimhei.ttf'
                         ).generate(result)
my_wordcloud.to_file('2018.jpg')

制作完毕了,我们可以直接把结果秀出来:

代码语言:javascript复制
image_colors = ImageColorGenerator(pic)
plt.imshow(my_wordcloud.recolor(color_func=image_colors))
plt.imshow(my_wordcloud)
plt.axis("off")
plt.show()

之后我们需要的结果就诞生了:

不论你怎么去处理数据,我们总能找出一个规律,马爸爸永远出现在我们的视野!有钱就是任性!还不快去赚钱!!!

(说完小编放下了手中的笔,继续加班去了

点击阅读原文,可查看完整代码

0 人点赞