Python与SEO,Python百度移动端搜索下拉词采集工具及源码

2022-06-14 16:36:01 浏览数 (1)

众所周知,现在移动端流量占比是越来越重,尤其是app抢占了大量的移动端入口流量,而搜索引擎中移动端的流量也不容忽视,前面本渣渣有分享过百度搜索下拉词的挖掘采集工具及源码,今天就为大家分享Python百度移动端搜索下拉词采集工具及源码。

百度SEO优化中,PC端和移动端要不是两套页面,要么自适配,PC和移动端虽然有相互联系,但对于SEO从业者来说无疑是两个机会,所谓东边不亮,西边亮,可能PC端数据不怎么样,移动端数据会更好一些,关于移动端的优化及数据你一定要重视,尤其是有在竞价推广的大佬哥们,移动端着陆页面肯定是需要单独出一套页面,同时来进行优化的。

百度PC端下拉词与移动端下拉词基本大部分都是重合的,数据其实都是差不多的,仅有部分不同,可作为挖词补充!

百度PC端下拉词与移动端下拉词

挖掘 足球直播 下拉关键词结果:

百度搜索下拉词:['足球直播在线观看免费高清', '足球直播软件app免费', '足球直播在线观看免费', '足球直播360无插件', '足球直播软件哪个好', '足球直播在线观看免费高清视频', '足球直播在线观看免费高清et', '足球直播免费视频直播app', '足球直播在哪个平台可以看', '足球直播视频在线观看']

百度移动搜索下拉词:['足球直播', '足球直播在线观看免费高清', '足球直播软件app免费', '足球直播在线观看免费', '足球直播软件哪个好', '足球直播免费视频直播app', '足球直播在线观看免费高清et', '足球直播在线观看免费高清视频', '足球直播360无插件', '足球直播在哪看']

大佬哥们可以参考对比一下!

Python 百度移动端下拉词采集源码

与PC端下拉词采集类似,除了下拉词接口端口不一样,其实大部分源码都是通用,大同小异!

最关键的是接口:

代码语言:javascript复制
https://m.baidu.com/sugrec?pre=1&p=3&ie=utf-8&json=1&prod=wise&from=wise_web&net=1&os=1&sp=300&rm_brand=0&callback=jsonp2&wd=詹姆斯

浏览器抓包:

百度移动端下拉词采集参考源码:

代码语言:javascript复制
# -*- coding: utf-8 -*-
#百度移动端下拉词搜索
#@author 微信公众号:Python与SEO
#20220524 by微信:huguo00289
import requests
import json

url=f"https://m.baidu.com/sugrec?pre=1&p=3&ie=utf-8&json=1&prod=wise&from=wise_web&net=1&os=1&sp=300&rm_brand=0&callback=jsonp2&wd={word}"
r = requests.get(url=url)
cont = r.content.decode('utf-8')  # 获取返回的内容
# print(cont)
res = cont[7: -1]
res_json = json.loads(res)  # json格式转换
keys=[]
qs=res_json['g']
for q in qs:
    keys.append(q['q'])

print(f'百度移动搜索下拉词:{keys}')

对比参考源码:

代码语言:javascript复制
# -*- coding: utf-8 -*-
#百度移动端下拉词搜索
#@author 微信公众号:Python与SEO
#20220524 by微信:huguo00289
import requests
import json
import logging

logging.basicConfig(filename='xlclog.txt', level=logging.DEBUG,
                    format='%(asctime)s - %(levelname)s - %(message)s')

#获取百度PC端下拉关键词
def bdxl(word):
    requests.packages.urllib3.disable_warnings()
    url = 'https://sp0.baidu.com/5a1Fazu8AA54nxGko9WTAnF6hhy/su?wd=%s&sugmode=2&json=1&p=3&sid=1427_21091_21673_22581&req=2&pbs=%�%�%�%�%�%�&csor=2&pwd=%�%�%�%�%�%�&cb=jQuery11020924966752020363_1498055470768&_=1498055470781' % word
    r = requests.get(url, verify=False)  # 请求API接口,取消了HTTPS验证
    cont = r.content  # 获取返回的内容
    res = cont[41: -2].decode('gbk')  # 只取返回结果中json格式一段,并且解码为unicode
    res_json = json.loads(res)  # json格式转换
    keys=res_json['s']
    print(f'>> 已获取百度搜索下拉词:{keys}')
    logging.info(f'>> 已获取百度搜索下拉词:{keys}')
    return keys  # 返回下拉词

#获取百度移动端下拉关键词
def mbdxl(word):
    url=f"https://m.baidu.com/sugrec?pre=1&p=3&ie=utf-8&json=1&prod=wise&from=wise_web&net=1&os=1&sp=300&rm_brand=0&callback=jsonp2&wd={word}"
    r = requests.get(url=url)
    cont = r.content.decode('utf-8')  # 获取返回的内容
    # print(cont)
    res = cont[7: -1]
    res_json = json.loads(res)  # json格式转换
    keys=[]
    qs=res_json['g']
    for q in qs:
        keys.append(q['q'])

    print(f'>> 已获取百度移动搜索下拉词:{keys}')
    logging.info(f'>> 百度移动搜索下拉词:{keys}')


#获取百度移动端下拉关键词(添加了ua协议头)
def mmbdxl(word):
    headers={"User-Agent": "Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1",}
    url=f"https://m.baidu.com/sugrec?pre=1&p=3&ie=utf-8&json=1&prod=wise&from=wise_web&net=1&os=1&sp=300&rm_brand=0&callback=jsonp2&wd={word}"
    r = requests.get(url=url,headers=headers)
    cont = r.content.decode('utf-8')  # 获取返回的内容
    # print(cont)
    res = cont[7: -1]
    res_json = json.loads(res)  # json格式转换
    keys=[]
    qs=res_json['g']
    for q in qs:
        keys.append(q['q'])

    print(f'>> 已获取百度移动搜索下拉词:{keys}')
    logging.info(f'>> 百度移动搜索下拉词:{keys}')


if __name__=='__main__':
    word="足球直播"
    bdxl(word)
    mbdxl(word)
    mmbdxl(word)
    
Python 百度移动端下拉词采集工具exe

百度移动端下拉词采集工具exe说明:

  1. 采集工具编写语言为Python,仅供参考学习使用;
  2. 可批量挖掘百度采集移动端下拉词,需提供关键词txt文本;
  3. 工具为本渣渣手写,本公众号下载保证无毒无后门,可免费使用;
  4. 工具编写环境为 win7 64位,推荐该系统环境下使用,个别系统环境可能不兼容;
  5. 为避免泛滥,工具使用需要验证授权,联系本渣渣即可免费获取运行授权码,无任何限制,联系索取即可!
  6. 使用需提前准备好关键词列表txt,文档名为keywords.txt,关键词列表名不可更改,关键词一行一个;
  7. 下拉关键词采集完,输出为words.csv文件,log.txt文件为运行日志文件,如有fail.txt文件则为运行采集失败关键文

工具下载地址(百度云盘):

链接:https://pan.baidu.com/s/1jl7zdLjUx6LRkSTrQXQayw

提取码:z7bi

·················END·················

你好,我是二大爷,

革命老区外出进城务工人员,

互联网非早期非专业站长,

喜好python,写作,阅读,英语

不入流程序,自媒体,seo . . .

公众号不挣钱,交个网友。

0 人点赞