大家好,我是架构君,一个会写代码吟诗的架构师。今天说一说谷歌百度雅虎都是中国公司开发的通用搜索引擎_百度搜索引擎url,希望能够帮助大家进步!!!
一、百度搜索引擎URL参数全解析
在搜索引擎的RUL地址参数中,我们可以清晰的知道,该软件是否与搜索引擎进行了点击付费类的合作,我们以百度搜索的URL参数部分举例说明如下:
http://www.baidu.com/s?wd=关键字
wd(Keyword):查询的关键词;(必要参数)
http://www.baidu.com/s?wd=关键字& amp;cl=3
cl(Class):搜索类型,cl=3为网页搜索,cl=2为图片搜索;(必要参数)
http://video.baidu.com/v?rn=20&pn=0
pn(Page Number):显示结果的页数;
http://www.baidu.com/s?ie=gb2312
ie(Input Encoding):查询关键词的编码,缺省设置为简体中文,默认ie=gb2312;
http://image.baidu.com/i?ct=201326592&cl=2&lm=-1&tn=baiduimage&pv=&z=0&word=www.qqku8.cn&s=0
ct–此值一般是一串数字,可能是搜索请求的验证码;
si–在限定的域名中搜索,比如想在本站内搜索可使用参数si=www.unvs.cn,要使这个参数有效必须结合ct参数一起使用;
http://video.baidu.com/v?rn=20&pn=0
rn(Record Number):搜索结果显示条数,缺省设置rn=10,取值范围:10-100;
http://www.baidu.com/s?bs=QQ表情
bs(Before Search):上一次搜索输入的关键词;
tn:提交搜索请求的来源站点,这是百度与免费软件合作时的利益来源,举例来说我们使用的一些免费浏览器中所提供的百度搜索时,URL地址中都带有tn= 内容,tn=后面的内容就是百度联盟的账号。如:Firefox的tn=suvion_dg(tn=suvion_4_dg),傲游的 tn=myie2dg,The World的tn=suvion_4_pg,只要你使用了这些带有tn=的搜索,只要点击了其中的广告,提供该软件的浏览器就会从中赚取利益。搜索结果有个例外,当tn=baidulocal时,你可以得到一个无竞价无广告的百度搜索结果.(此参数与百度联盟有关)
其它一些参数补充解析:
http://www.baidu.com/s?lm=0(搜 索结果时间限制) &si=&rn=10(每页显示的数目) &ie=gb2312&(语言)ct=0 &wd=�%6��& (关键词)pn=10 (在第pn比上10后加上1页)&ver=0&cl=3&uim=6&usm=0
tn 搜索框所属网站。另一种所属定义,比如 tn=sitehao123,就是 http://www.hao123.com/ 左上那个搜索框
tn=baidulocal 表示百度站内搜索,返回的结果很干净,无广告干扰.
tn=baiducnnic 想把百度放在框架中吗?试试这个参数就可以了,是百度为Cnnic定制的
sr 不建议使用该参数.结合bs使用。一般查询sr=0或者为空值,但sr=1时,查询将结合bs的值一起作为查询的关键字.默认值为0,除0,1外其它值无效。
ct 语言限制。0-所有语言,1-简体中文网页,2-繁体中文网页;其它不确定或者无效或。默认值为0.
rn 搜索结果显示条数(Record Number),取值范围在10–100条之间,缺省设置rn=10
pn 搜索结果的页码,从零开始计数。即pn = ${结果页码-1}*rn。
lm 搜索结果的时间限制。以天为单位,例如搜索最近一个月的网页,lm=30.默认值为0,表示没有时间限制。
q5 搜索内容位置限制.0-所有内容;1-网页标题(相当于使用’title:’查询前缀);2-url(相当于使用’inurl:’查询前缀);其它值等效于0.默认值为0
q6 搜索内容网站限制.例如q6=sohu.com,表示只搜索sohu.com的网页;相当于使用了’site:前缀’.默认值为空
dq 不建议使用该参数.查询内容来原的地区限制. 具体值有百度确定.默认值为空.试了一下,使用这个参数的效果很差.
myselectvalue
submit=
tb=on 贴吧?
f 未知。 默认值为空
cl 未知。 默认值为空
rs2 未知。
sc 未知。
二、谷歌搜索引擎URL参数全解析
q–查询的关键词(Query),百度对应的参数为wd
hl–Google搜索的界面语言(Interface Language)
hl=zh-CN简体中文语言界面,我们用的Google中文就是这个参数。
hl=zh-TW繁体中文语言界面,港台地区常使用
hl=en 英文语言界面
start–显示结果的页数,百度对应的参数为pn
lr–搜索内容的语言限定(Language Restrict),限定只搜索某种语言的网页。如果lr参数为空,则为搜索所有网页。
常用的有:
lr=lang_zh-CN只搜索简体中文网页
lr=lang_zh-TW只搜索繁体中文网页
lr=lang_zh-CN|lang_zh-TW搜索所有中文网页
lr=lang_en只搜索英文网页
ie–查询输入文字的编码(Input Encoding),Google缺省设置ie=utf-8,即请求Google搜索时参数q的值是一段utf-8编码的文字,如果要直接使用中文,可以设置ie=gb2312,即为简体中文编码
oe–搜索返回页面的编码(Output Encoding),Google缺省设置oe=utf-8
num–搜索结果显示条数(Number),取值范围在10–100条之间,缺省设置num=10,百度对应的参数为rn
newwindow–是否开启新窗口以显示查询结果。 缺省设置newwindow=1,在新窗口打开网页
safe–安全搜索选项(SafeSearch),设置该参数可以过滤成人内容, 缺省设置safe为空,即不过滤成人内容,设置为safe=vss,即过滤成人内容。这个参数真是让一些人欢喜,让一些人忧。
三、yahoo搜索引擎URL参数全解析
yahoo的更简单,与百度谷歌不同的是把ie换成ei:
ei–查询输入文字的编码(Input Encoding),缺省设置ie=gb2312,即为简体中文
vs–在限定的域名中搜索,比如想在本站内搜索可使用参数si=www.unvs.cn,在yahoo里面这个可以单独使用!
今天文章到此就结束了,感谢您的阅读,Java架构师必看祝您升职加薪,年年好运。