这是 月小水长 的第 137 篇原创干货
目前公众号平台改变了推送机制,点“赞”、点“在看”、添加过“星标”的同学,都会优先接收到我的文章推送,所以大家读完文章后,记得点一下“在看”和“赞”。
2021 新版微博话题爬虫发布 的关键词设置小有学问,多次尝试才能摸清门道,文章 新版微博话题爬虫总是爬一些无关数据的原因 中介绍到,设置复杂词语进行微博关键词搜索,这个复杂词语会被拆分然后搜索,比如 日本地震,最后搜到的结果也会包括类似下面的微博
代码语言:javascript复制我在日本,我听说美国地震了
日本地震,被拆成了日本和地震,可能会搜到一些和日本地震没啥关系的美国地震。排除这种影响,可以将关键词设置为 #日本地震#,也就是日本地震这个话题了,具体不展开了,还是可以去这篇文章仔细看看:新版微博话题爬虫总是爬一些无关数据的原因
今天要说的是关键词搜索 or and 语法,光说不做假把戏,直接上例子。
如果需要设置抓取 日本地震 或者 美国地震,可以将关键词设置为以下两种之一:
"keyword": "(日本 or 美国) and 地震"
或者
"keyword": "日本地震 or 美国地震"
使用 微博话题爬虫,以上两种配置抓取到的结果是一样的。
顺便说一句,微博话题爬虫已于 2022 年 8 月底更新 新增用户认证类型,微博话题爬虫 8 月更新,之前获取的可能已经会有报错,请删除原来的文件并重新获取。