今年到现在也算是差不多过完了,可以差不多来个年度总结了,围绕在我们生活的世界今年发生过什么大事???
先说说我印象比较深刻的几件事吧,孟晚舟被捕,马爸爸宣布即将退位,暴走大事件被禁,AI大会上海,IO2018,Xmax发布会,magic2发布会等等。
那么在你们的心中是不是也有属于自己印象深刻的事情,那我们现在来盘点盘点吧。
首先,我这里有一份甲哥爬下来的数据,大家也可以拿去看看:
链接:
https://pan.baidu.com/s/1LKRVWpdX3hjRIJ3HaBP2gA
提取码:
de6h
里面爬的资料还算全(当然也有一些不在,有效期的话可以自己去爬一爬,我就偷个懒,拿了现成的数据)
我们需要解析xlsx的数据,之后把觉得有用是数据处理一下拿过来:
我们需要用到的包有pandas,worldcloud,pillow,(matplotlib复制显示图像用的,如果你只是想把图片存下来就不需要用到它了)
代码语言:javascript复制import pandas as pd
import matplotlib.pyplot as plt
from wordcloud import WordCloud, ImageColorGenerator
import os
import numpy as np
import PIL.Image as Image
读取xlsx:
代码语言:javascript复制data = pd.read_excel('2018.xlsx',header=0, encoding='utf-8')
获取每条数据:
代码语言:javascript复制for i in range(len(data)):
item = list(data.loc[i])
item = [str(i) for i in item]
list_sheet.append(item)
之后我们就可以筛选每条数据了,这里我们先介绍一个简单的处理,可以查看每条数据的点赞评论,如果点赞超过2或者评论超过2,我们就默认数据是有效的,当然你可以可以提高要求,具体就看你自己,要求不一样,产生的图片当然也就不一样。
代码语言:javascript复制info=[]
for i in list_sheet:
if int(i[2])>=1 or int(i[3])>=1:
info.append(i[1])
之后,因为要做词云,需要把list数据拿出来做成字符串,我们使用join方法:
代码语言:javascript复制result = "".join(info)
之后制作词云:
代码语言:javascript复制d= os.path.dirname(os.path.abspath( __file__ ))
pic = np.array(Image.open(os.path.join(d, r"3.jpg")))
my_wordcloud = WordCloud(background_color="white",
max_words=20000,
mask=pic,
max_font_size=400,
random_state=420,
font_path=r'C:UsersewuxyuqDesktopframeworksimhei.ttf'
).generate(result)
my_wordcloud.to_file('2018.jpg')
制作完毕了,我们可以直接把结果秀出来:
代码语言:javascript复制image_colors = ImageColorGenerator(pic)
plt.imshow(my_wordcloud.recolor(color_func=image_colors))
plt.imshow(my_wordcloud)
plt.axis("off")
plt.show()
之后我们需要的结果就诞生了:
不论你怎么去处理数据,我们总能找出一个规律,马爸爸永远出现在我们的视野!有钱就是任性!还不快去赚钱!!!
(说完小编放下了手中的笔,继续加班去了
)
点击阅读原文,可查看完整代码