网址规范化(URL canonicalization)指的是搜索引擎挑选最合适的URL作为真正(规范化的)网址的过程。
下面这几个URL,一般指的是同一个文件:
http://www,网址,ccom
http://网址,com
http://www,网址,ccom/index.php
http://网址,ccom/index.php
为何出现不规范网址?
1、CMS系统原因,使同一篇文章可以通过不同的URL访问。
2、URL静态化设置错误,同一篇文章中有多个静态化URL。
3、URL静态化后,静态和动态URL共存,都有链接,也都可以访问。
4、加密网址与非加密网址都可以访问。
5、URL中有端口号或者后缀代码。
不规范URL的影响
1、CMS系统在不同地方链接到不同的URL,分散了权重,不利于排名。
2、外部链接也可能指向不同的URL,分散权重。
3、搜索引擎判断的规范化网址不是站长想要的那个网址。
4、如果网址规范化问题太严重,也可能会影响收录。
5、复制内容过多,让搜索引擎误认为有作弊嫌疑。
如何解决网址规范化问题?
1、确保使用的CMS系统只产生规范化网址,无论是否静态化。
2、所有内部链接统一,都指向规范化网址。
3、在Google管理工具中设置首选域名。
4、使用301转向,把不规范URL全部转向规范化URL。
5、使用Canonical标签。
6、提交给搜索引擎的XML网站地图中全部使用规范化网址。
注:这些方法各有局限:
1、Google管理工具不适用与其他搜索引擎。
2、有的网站因为技术原因做不了301转向。
3、CMS系统经常不受自己控制。
4、内部链接自己可以控制,但外部链接不受控制。
本篇总结:
到目前为止网址规范化问题一直都是困扰站长及搜索引擎的一个问题,良家佐言也因为网站改版问题,使网址呈现动态、改版前、改版后等三种URL状态。
最后向搜索引擎提交死链,利用robots文件屏蔽及外部优化来更新网站被抓取的数据,才解决了URL进行规范化问题。
作者:茹莱神兽
来源:https://www.woshiyy.cn/2580.html