你的网站明明有产品,客户搜来搜去就是找不到,流量上不去。你让技术查,技术说“没问题”。结果问题很可能出在一个你根本看不见的地方——网址参数。
网址参数就是链接里“?”后面那一串东西。比如你网店一个商品页,客户按颜色、尺寸筛选一次,网址尾巴就多一串。这玩意儿用好了是功能,用不好就是给自己挖坑。
你的网站流量,可能被网址参数悄悄吃掉了
你想想,一个商品,客户选红色生成一个链接,选蓝色又生成一个链接,按价格排序又是一个。百度爬虫来你网站,发现几百个长得差不多的页面,它懵了:到底哪个才是真正的内容?它没那么多耐心,干脆都不收录。
更亏的是,你本来花钱做了外链,结果外链指向的是带参数的版本,权重全分散了。等于你请了十个销售,让他们去十个不同的门市部上班,结果客户只认一个总店,其他九个白养着。
两个问题先问自己
你的网店有没有这种情况:后台显示被百度抓了几万页,但实际有流量的就那几百个?
你的商品页,是不是客户每点一次筛选条件,网址就变一次?
如果中了一条,你就要看下面怎么解决了。
怎么判断你的参数是“好参数”还是“坏参数”
参数分两种:主动参数和被动参数。
主动参数会改变页面内容。比如客户选了“红色、42码”,页面显示的就是红鞋42码。这类参数必须有,但不能让它乱生页面。
被动参数不改变内容,只用来跟踪。比如你从朋友圈广告来的客户,网址后面跟一长串跟踪码。这类参数对百度没用,反而浪费抓取额度。
判断标准很简单:去掉这个参数,页面内容变不变?不变就是被动参数,直接屏蔽掉。
五步管好网址参数,让百度只抓你想要的页面
第一步:给所有带参数的页面贴上“正版标签”
这个标签叫“canonical标签”。你告诉百度:别看那些带参数的版本,就看没参数的那个主页面。
比如你的商品页是“yourshop.com/shoe”,客户筛选后变成“yourshop.com/shoe?color=red&size=42”,你要在这个筛选页的代码头部加上一行,告诉百度正版是“yourshop.com/shoe”。
这一步特别重要,尤其是你的网店筛选条件多的时候:颜色、尺码、价格区间、品牌……每多一个组合就多出一堆网址。不加这个标签,百度光抓这些变体就忙不过来了。
第二步:在“robots.txt”里直接屏蔽没用的参数
那些不改变内容的参数,比如跟踪码、排序方式,直接在网站根目录的“robots.txt”文件里写清楚:别抓这些。
举个例子,你网站有个“?sort=”参数,客户点“按销量排序”就会出现。这个参数不产生新内容,只是把商品顺序调一下。你就在robots.txt里写一行:
Disallow: /*?sort=
百度看到这个,就不会去抓那些排序页了。
第三步:内部链接全部指向干净版本
你网站内部的链接,比如“猜你喜欢”“相关推荐”,链接地址一定要用不带参数的那个版本。
很多老板不知道,自己网站内部到处是带参数的链接,等于自己把权重分散了。你要让技术检查一遍,所有内链都指向主页面。
第四步:别用网址参数做多语言版本
有的老板为了省事,用“?lang=zh”“?lang=en”来做中英文版本。百度明确说过不要这么干。
正确做法:中文版用“yourshop.com/zh/”,英文版用“yourshop.com/en/”,或者用二级域名“zh.yourshop.com”。这样百度才知道哪个页面该推给哪个地区的客户。
第五步:做技术排查时先把参数网址排除掉
你让技术做网站体检,如果工具把几万个带参数的网址都算进去,报告根本没法看。先把参数网址排除掉,只看核心页面有没有问题。
一个真实场景
有个做服装的老板,网站有2000个商品。他让技术一查,百度抓了8万个网址。怎么回事?每个商品有5个颜色、4个尺码、3种排序方式,光一个商品就能生出60个带参数的网址。2000个商品就是12万个网址。
百度一天只给他几百个抓取额度,全浪费在这些变体上了。真正的商品页反而没被好好抓。
后来他做了三件事:加canonical标签、屏蔽排序参数、内部链接全改回主页面。三个月后,核心商品页的收录量翻了一倍,自然流量涨了四成。
最后给你一个检查清单
- 你的商品页有没有加canonical标签指向主页面?
- robots.txt里有没有屏蔽不改变内容的参数?
- 网站内部链接是不是都指向干净版本?
- 多语言版本是不是用了独立目录而不是参数?
- 技术排查时有没有先把参数网址排除掉?
这五条你让技术花半天检查一遍,比花钱投广告划算得多。
微信扫码