你花了几万块做独立站,百度就是不来流量。技术员跟你说“网站没问题”,但你打开百度站长平台一看,抓取量少得可怜,收录的还尽是些乱七八糟的链接。
问题很可能出在一个你根本看不见的地方:网址里的参数。
网址后面那串“?xxx=xxx”是什么东西
你打开一个电商网站,选“红色、L码”的T恤,网址就变成了:
yoursite.com/t-shirt?color=red&size=L
问号后面的 color=red&size=L 就是网址参数。
这东西本身是好用的——不用为每一种颜色和尺寸单独做个页面,一个页面通过参数就能展示不同内容。但问题也出在这里:参数一多,你的网站就凭空多出成千上万个“假页面”,把百度的爬虫彻底搞晕了。
页面写满了关键词,为什么还是没排名
先算一笔账。百度爬虫每天分给你网站的抓取时间有限,这叫“抓取预算”。
假设你的网站只有1000个真正有价值的产品页,但因为筛选、排序、分页这些功能,系统自动生成了5万个带参数的网址。百度爬虫来了,花了一整天在那5万个长得差不多的参数页面上转悠,真正重要的1000个页面反而没时间抓。
更麻烦的是,百度看到这么多长得一样的页面,不知道该把哪个排在搜索结果里。最后可能一个都不排,或者排了个参数页,用户一点进去,网址又长又乱,体验极差。
你花大价钱做的内容、投的外链,就因为网址参数没管好,全白费了。
哪些参数会害了你,哪些不会
先搞清楚两类参数。
主动参数——会改变页面内容。比如:
?color=red(筛选红色商品)?page=2(翻到第二页)?keyword=运动鞋(搜索关键词)
这些参数生成的页面内容确实不一样,但跟主页面(不带参数的版本)高度相似,容易造成重复内容。
被动参数——不改变页面内容,只用来追踪。比如:
?source=wechat(标记来自微信的流量)?campaign=618(标记618活动的流量)
被动参数不改变页面内容,但同样会制造出多个网址版本。
怎么判断你的网站有没有被参数坑了
打开百度搜索资源平台(百度站长平台),看两个数据:
抓取量:如果抓取量比你的实际页面数多出好几倍,说明爬虫在参数页面上浪费了大量资源。
索引量:如果索引量远低于抓取量,说明百度觉得你的大部分页面不值得收录——很可能是重复内容太多。
再做一个最简单的测试:把你的某个产品页网址复制出来,去掉问号及后面的所有参数,看能不能正常访问。如果去掉参数后页面打不开,或者跳到首页,说明你的网站架构有问题。
五个动作,把参数管起来
第一步:给所有带参数的页面加上canonical标签
这是最核心的操作。让开发人员在每个参数页面的HTML头部加上一行代码,告诉百度:“这个页面只是主页面的一种展示方式,请把权重归到主页面。”
具体写法:
<link rel="canonical" href="https://yoursite.com/t-shirt" />
不管用户怎么筛选、排序,最终都指向那个不带参数的主页面。
第二步:用robots.txt拦住没价值的参数
有些参数你根本不需要百度抓取。比如排序参数 ?sort=price,用户按价格排序只是为了自己看,不需要被收录。
在robots.txt里加上类似这样的规则:
Disallow: /*?sort=
Disallow: /*?page=
但注意:别一刀切。如果搜索功能对你很重要,搜索参数(如 ?keyword=)可以放行。
第三步:内部链接只指向干净版本
你的网站内部互相链接时,不要链接到带参数的版本。比如产品推荐、相关文章、导航菜单,全部指向不带参数的网址。
这等于在告诉百度:“这些才是我的正经页面,那些带参数的只是工具。”
第四步:参数顺序要固定
?color=red&size=L 和 ?size=L&color=red,在百度看来是两个不同的网址。如果你的网站系统不能自动固定参数顺序,让开发人员写个规则,保证同样的筛选条件永远生成同样的参数顺序。
第五步:别用参数做多语言或多地区版本
有些老板想用参数区分不同地区的内容,比如 ?lang=zh。这种做法百度明确不推荐。应该用独立的目录或子域名,比如 yoursite.com/en/ 或 en.yoursite.com。
一个真实的例子
有个做家具的老板,独立站有300个产品,但网址参数生成了将近2万个不同链接。百度每个月只抓了2000次,其中1800次都浪费在参数页上。真正能卖货的产品页,平均每个一个月被百度光顾不到一次。
后来做了三件事:所有参数页加了canonical标签、robots.txt拦掉了排序和翻页参数、内部链接全部改成干净版本。两个月后,百度抓取量没变,但有效页面的抓取次数翻了三倍,自然搜索流量涨了40%。
别让参数变成你的成本
网址参数本身不是坏事,但它像水管里的泥沙——不清理就会堵住整个系统。
你不需要懂技术代码,但需要盯住两件事:
- 百度站长平台里抓取量和索引量的比例
- 你的网站是不是有大量“长得一样但网址不同”的页面
发现不对,就让技术员按上面五步去改。这比花钱买关键词、做外链,见效更快。
微信扫码