微博水军账号 spammer 检测模型上线

2023-03-02 18:47:40 浏览数 (2)

用过 twitter 的 botometer 的同学都知道,botometer 可以通过检测 twitter 帐户的活动评价该账号属于机器人的可能性。

但是据笔者所知(可能笔者孤陋寡闻),weibo 并没有对应的产品或服务。于是我磨洋工(几个月前就说着要做了)做出了这个服务:检测微博账号是 spammer 的可能性。

笔者正常搜集了微博的一些 spammer 账号和正常账号共计 3000 余,手动打上标签。并爬取账号的关系网络特征、微博内容特征约 10 余特征,PCA 降维后抽取其中 6 个特征,搭建四层全连接网络,sigmod 激活加上BCE Loss,L2 normal 等常用方法,再调整 batch_size 和 lr 最后训练的模型,在测试集准确度 85% 左右,召回率很高但是精确度偏低

最后把模型部署上线,直接在网页上输入微博账号 uid 就能看到该账号的检测结果,如下。

输入的 uid ,可以查看

代码语言:javascript复制
https://weibo.com/u/3580036505

明显是一个 spammer 账号,模型预测正确,可信度为 0.985。

模型会一直迭代优化,欢迎体验

代码语言:javascript复制
https://weibo-crawl-visual.buyixiao.xyz/weibo-spammer-evaluator

0 人点赞