Github | 高效微信公众号历史文章和阅读数据爬虫

今天逛github看到了一个很好的项目，给大家分享一下。

项目地址：https://github.com/54xingzhe/weixin_crawler

weixin_crawler是一款使用Scrapy、Flask、Echarts、Elasticsearch等实现的微信公众号文章爬虫，自带分析报告和全文检索功能，几百万的文档都能瞬间搜索。weixin_crawler设计的初衷是尽可能多、尽可能快地爬取微信公众的历史发文

如果你想先看看这个项目是否有趣，这段不足3分钟的介绍视频一定是你需要的：

https://www.youtube.com/watch?v=CbfLRCV7oeU&t=8s

语言		Python3.6
前端	web框架	Flask / Flask-socketio / gevent
	js/css库	Vue / Jquery / W3css / Echarts / Front-awsome
后端	爬虫	Scrapy
	存储	Mongodb / Redis
	索引	Elasticsearch

UI主界面

添加公众号爬取任务和已经爬取的公众号列表

爬虫界面

设置界面

公众号历史文章列表

报告

搜索

0 人点赞