你的网店后台显示商品页被百度抓取了上万次,可真正带来订单的,还是那几个老页面。钱花在服务器上,流量却喂了重复页面。
这不是技术故障,是你家网站链接里带的那些“尾巴”在捣乱。
链接后面跟了一串“?”,到底在干什么
你打开一个商品分类页,选了个“红色,42码”,网址就变成了:
你的域名.com/shoes?color=red&size=42
问号后面的东西,就是URL参数。它们让同一个页面能根据你的选择变内容,不用为每个组合单独做个新页面。
这听起来很聪明,对吧?但问题就出在这里。
为什么你的网站越做越“重”
参数用不好,会搞出三件坏事:
第一,百度不知道该收哪个版本。
一个页面带“?sort=asc”,另一个带“?sort=desc”,内容几乎一样,只是排序不同。搜索引擎得猜:到底哪个才算数?猜错了,你真正想推的页面反而没排名。
第二,抓取额度被白白浪费。
百度每天给你的网站分配的抓取次数是有限的。如果它把时间都花在抓那些参数不同的重复页面上,你新上的爆款、重要的活动页,就可能一直没被收录。
第三,你的页面在互相打架。
“?color=red”和“?color=blue”两个链接,可能都指向同一类关键词。相当于你自己左手打右手,哪个都打不赢。
先判断:你家网站的参数是“有用”还是“添乱”
不是所有参数都该砍。你得先分清两类:
主动参数——确实改变了页面内容。比如筛选颜色、尺码、翻页(?page=2)。这类参数有价值,但要管好。
被动参数——不改变内容,只做跟踪用。比如给推广链接加的标记(?utm_source=wechat)。这类参数对用户没用,对搜索引擎是噪音。
怎么判断?很简单:去掉参数,页面内容变不变?不变的就是被动参数,该处理掉。
五步走,把参数管起来
第一步:给所有带参数的页面贴上“正版标签”
在页面代码的里加一行:
<link rel="canonical" href="你的域名.com/shoes" />
这行代码告诉百度:别看那些花里胡哨的参数版本,就认这个不带参数的原始页面。这是最管用的办法,尤其是做服装、家具这类需要大量筛选的网站。
第二步:在robots.txt里拦掉没用的参数
打开你网站根目录下的robots.txt文件,加一条:
Disallow: /*?sort=
这样百度就不会去抓那些只改了排序方式的重复页面了。省下来的抓取额度,留给真正重要的内容。
第三步:内部链接只连干净版本
你网站上的“相关推荐”“热门分类”这些链接,确保它们指向的是不带参数的网址。别小看这一步,内部链接的权重积累,全看链接指向哪里。
第四步:别用参数做多语言或多地区
有些老板图省事,用参数区分中文版和英文版。别这么干。用独立的子目录(比如你的域名.com/en/)更清楚,百度也更容易识别。
第五步:检查工单里把参数排除掉
当你用工具检查网站健康度时,先把参数页面排除掉。不然报告里全是重复内容的问题,真正的bug反而被淹没了。
一个容易踩的坑:参数顺序不同,就是两个页面
?color=red&size=42 和 ?size=42&color=red
在系统看来,这可能是两个不同的网址。大多数建站系统会自动处理顺序问题,但如果你自己手动加参数做推广,一定要统一顺序。不然又多了一堆重复页面。
什么时候该砍掉参数功能
不是所有筛选功能都值得保留。
比如你只卖5款鞋,搞个“按价格排序”的参数,就纯属给自己找麻烦。功能带来的好处,抵不上它制造的重复页面成本。
判断标准:这个筛选功能,真的改变了用户看到的内容吗?如果只是换个顺序、换个展示方式,就别加参数。
最后说一句
管好URL参数,本质上就是给搜索引擎指路:哪条路是主干道,哪条是死胡同。
别让百度在你家网站里瞎转悠。把路标立清楚,它才能把你的好货送到客户眼前。
微信扫码