众所周知,现在移动端流量占比是越来越重,尤其是app抢占了大量的移动端入口流量,而搜索引擎中移动端的流量也不容忽视,前面本渣渣有分享过百度搜索下拉词的挖掘采集工具及源码,今天就为大家分享Python百度移动端搜索下拉词采集工具及源码。
百度SEO优化中,PC端和移动端要不是两套页面,要么自适配,PC和移动端虽然有相互联系,但对于SEO从业者来说无疑是两个机会,所谓东边不亮,西边亮,可能PC端数据不怎么样,移动端数据会更好一些,关于移动端的优化及数据你一定要重视,尤其是有在竞价推广的大佬哥们,移动端着陆页面肯定是需要单独出一套页面,同时来进行优化的。
百度PC端下拉词与移动端下拉词基本大部分都是重合的,数据其实都是差不多的,仅有部分不同,可作为挖词补充!
百度PC端下拉词与移动端下拉词
挖掘 足球直播 下拉关键词结果:
百度搜索下拉词:['足球直播在线观看免费高清', '足球直播软件app免费', '足球直播在线观看免费', '足球直播360无插件', '足球直播软件哪个好', '足球直播在线观看免费高清视频', '足球直播在线观看免费高清et', '足球直播免费视频直播app', '足球直播在哪个平台可以看', '足球直播视频在线观看']
百度移动搜索下拉词:['足球直播', '足球直播在线观看免费高清', '足球直播软件app免费', '足球直播在线观看免费', '足球直播软件哪个好', '足球直播免费视频直播app', '足球直播在线观看免费高清et', '足球直播在线观看免费高清视频', '足球直播360无插件', '足球直播在哪看']
大佬哥们可以参考对比一下!
Python 百度移动端下拉词采集源码
与PC端下拉词采集类似,除了下拉词接口端口不一样,其实大部分源码都是通用,大同小异!
最关键的是接口:
代码语言:javascript复制https://m.baidu.com/sugrec?pre=1&p=3&ie=utf-8&json=1&prod=wise&from=wise_web&net=1&os=1&sp=300&rm_brand=0&callback=jsonp2&wd=詹姆斯
浏览器抓包:
百度移动端下拉词采集参考源码:
代码语言:javascript复制# -*- coding: utf-8 -*-
#百度移动端下拉词搜索
#@author 微信公众号:Python与SEO
#20220524 by微信:huguo00289
import requests
import json
url=f"https://m.baidu.com/sugrec?pre=1&p=3&ie=utf-8&json=1&prod=wise&from=wise_web&net=1&os=1&sp=300&rm_brand=0&callback=jsonp2&wd={word}"
r = requests.get(url=url)
cont = r.content.decode('utf-8') # 获取返回的内容
# print(cont)
res = cont[7: -1]
res_json = json.loads(res) # json格式转换
keys=[]
qs=res_json['g']
for q in qs:
keys.append(q['q'])
print(f'百度移动搜索下拉词:{keys}')
对比参考源码:
代码语言:javascript复制# -*- coding: utf-8 -*-
#百度移动端下拉词搜索
#@author 微信公众号:Python与SEO
#20220524 by微信:huguo00289
import requests
import json
import logging
logging.basicConfig(filename='xlclog.txt', level=logging.DEBUG,
format='%(asctime)s - %(levelname)s - %(message)s')
#获取百度PC端下拉关键词
def bdxl(word):
requests.packages.urllib3.disable_warnings()
url = 'https://sp0.baidu.com/5a1Fazu8AA54nxGko9WTAnF6hhy/su?wd=%s&sugmode=2&json=1&p=3&sid=1427_21091_21673_22581&req=2&pbs=%�%�%�%�%�%�&csor=2&pwd=%�%�%�%�%�%�&cb=jQuery11020924966752020363_1498055470768&_=1498055470781' % word
r = requests.get(url, verify=False) # 请求API接口,取消了HTTPS验证
cont = r.content # 获取返回的内容
res = cont[41: -2].decode('gbk') # 只取返回结果中json格式一段,并且解码为unicode
res_json = json.loads(res) # json格式转换
keys=res_json['s']
print(f'>> 已获取百度搜索下拉词:{keys}')
logging.info(f'>> 已获取百度搜索下拉词:{keys}')
return keys # 返回下拉词
#获取百度移动端下拉关键词
def mbdxl(word):
url=f"https://m.baidu.com/sugrec?pre=1&p=3&ie=utf-8&json=1&prod=wise&from=wise_web&net=1&os=1&sp=300&rm_brand=0&callback=jsonp2&wd={word}"
r = requests.get(url=url)
cont = r.content.decode('utf-8') # 获取返回的内容
# print(cont)
res = cont[7: -1]
res_json = json.loads(res) # json格式转换
keys=[]
qs=res_json['g']
for q in qs:
keys.append(q['q'])
print(f'>> 已获取百度移动搜索下拉词:{keys}')
logging.info(f'>> 百度移动搜索下拉词:{keys}')
#获取百度移动端下拉关键词(添加了ua协议头)
def mmbdxl(word):
headers={"User-Agent": "Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1",}
url=f"https://m.baidu.com/sugrec?pre=1&p=3&ie=utf-8&json=1&prod=wise&from=wise_web&net=1&os=1&sp=300&rm_brand=0&callback=jsonp2&wd={word}"
r = requests.get(url=url,headers=headers)
cont = r.content.decode('utf-8') # 获取返回的内容
# print(cont)
res = cont[7: -1]
res_json = json.loads(res) # json格式转换
keys=[]
qs=res_json['g']
for q in qs:
keys.append(q['q'])
print(f'>> 已获取百度移动搜索下拉词:{keys}')
logging.info(f'>> 百度移动搜索下拉词:{keys}')
if __name__=='__main__':
word="足球直播"
bdxl(word)
mbdxl(word)
mmbdxl(word)
Python 百度移动端下拉词采集工具exe
百度移动端下拉词采集工具exe说明:
- 采集工具编写语言为Python,仅供参考学习使用;
- 可批量挖掘百度采集移动端下拉词,需提供关键词txt文本;
- 工具为本渣渣手写,本公众号下载保证无毒无后门,可免费使用;
- 工具编写环境为 win7 64位,推荐该系统环境下使用,个别系统环境可能不兼容;
- 为避免泛滥,工具使用需要验证授权,联系本渣渣即可免费获取运行授权码,无任何限制,联系索取即可!
- 使用需提前准备好关键词列表txt,文档名为keywords.txt,关键词列表名不可更改,关键词一行一个;
- 下拉关键词采集完,输出为words.csv文件,log.txt文件为运行日志文件,如有fail.txt文件则为运行采集失败关键文
工具下载地址(百度云盘):
链接:https://pan.baidu.com/s/1jl7zdLjUx6LRkSTrQXQayw
提取码:z7bi
·················END·················
你好,我是二大爷,
革命老区外出进城务工人员,
互联网非早期非专业站长,
喜好python,写作,阅读,英语
不入流程序,自媒体,seo . . .
公众号不挣钱,交个网友。