这是 月小水长 的第 120 篇原创干货
写了个一站式微博分析可视化网站 作为长期项目,本次开放微博话题人物关系共现可视化功能,用户可以输入 2021 新版微博话题爬虫发布 的 csv 结果文件和自己的邮箱,然后网站后台提取话题的文本内容中相互艾特的人物关系并且生成 gephi 构图所需的 edge.csv 和 node.csv 文件,处理成功并压缩后发送至你输入的邮箱地址。接口地址如下:
http://weibo.buyixiao.xyz/custom-vis/topic-user-co-occurrence-visual/
使用 gephi 导入 edge.csv 和 node.csv 分别作为边数据和点数据,采用 ForceAtlas 2 布局,最终的效果图如下:
gephi 效果图
需要注意的几点
1、话题爬虫的 csv 文件必须有 user_name 和 content 列,其中 user_name 是每一条边的起点,user_name 对应的 content 就是我们要提取出的 @ 人物的微博文本;同时,该 csv 文件必须是 utf-8 格式,最好不要在 excel、记事本等软件中打开修改,不然请确保修改编码格式也是 utf-8;上传的 csv 限制最大 10M。
2、后台处理耗时不到 1 min,如果超时还没有收到,请查看邮件垃圾箱,再不然在文末点击阅读原文的 buyiXiao's blog 网站留言,我会及时查看后台日志并反馈。
3、gephi 导入边数据集有个大坑是,需要用记事本将 edge.csv 改成 ANSI 格式,然后导入电子表格时格式选择 GB2312,否则 gephi 会提示以下错误:
边表格需要一个包含节点标号”源“和”目标“列
最后,有关微博可视化网站的更新日志和功能大全,可在以下地址查看。
https://buyixiao.github.io/blog/one-stop-weibo-visualization.html