大家好,文摘菌又来啦! ?
上周的公开课分享,文摘菌邀请到了一位知书达理美丽大方冰雪聪明人见人爱……(此处省略1万字描述)的小姐姐,给大家直播文本分析重的常用套路呢!
这位小姐姐,也是大数据文摘文章的论文作者小姐姐,点这里查看她的歌词文本分析:《我的安河桥北和你的外滩18号:京沪歌词分析中的爱恨别离》
小姐姐的自我介绍:
张希煜,学心理学出身,现在在一家数据公司做行为分析,文本挖掘爱好者(最近沉溺于叙述学和叙事研究不能自拔,可能是因为学心理学落下的病根)。
公开课主要内容是:以歌词为例,一起聊聊在文本分析中的一些套路,以及使用语言学方法的一些尝试。
内容回顾▼
北京到底哪里好?(图片所用词频来自知乎上同名问题)
从这里就能看出来,词云图只是一个图,作用是启发观众的脑洞。重要的其实是你怎么讲你的故事。
做词云图要避免的坑:“非常”这种副词不要放进来,可以适当合并短语,一张图20-40个词比较合适。从配色到字号再到词语的位置,词云的样式也是有讲究的!
一些传统数据统计的方法都可以用来做词频相关分析。
然而……
文摘菌还能说什么呢?这是每个被PPT和报告支配过的分析师都有的痛吧!
其实看完之后文摘菌只想说,小姐姐,你的PPT做得好好看诶!
下次要不要来开个PPT讲座??