你花了几万块做推广,结果客户搜你家品牌名,跳出来十几个长得差不多的页面。点进去一看,同一个产品,只是按价格排了个序,或者换了个颜色筛选,百度就给你搞出了好几个不同的网址。
更糟的是,你真正想让客户看到的那个主页面,反而找不到了。
这不是百度故意整你,是你家网站后台那些链接尾巴——也就是网址参数——在捣乱。
你根本不知道的“链接尾巴”在烧钱
网址参数,就是网址问号(?)后面那一串东西。比如你家一个产品页,正常是 yourshop.com/shoes,但客户筛选了蓝色、42码之后,网址就变成了 yourshop.com/shoes?color=blue&size=42。
这东西本身是个好工具,能帮客户快速找到想要的东西。但问题是,如果你不管它,百度爬虫每次来你家,都会把这些带参数的链接当成一个个全新的页面去收录、去抓取。你有10个筛选条件,理论上就能组合出成百上千个“假页面”。
结果就是:
- 你花钱买的“抓取额度”全浪费了:百度每天分给你网站的抓取次数是有限的。它把时间都花在抓那些“?color=blue”、“?sort=asc”的重复页面上,你真正重要的新品、爆款页面,反而可能排着队等不到抓取。
- 你的权重被自己分掉了:别人给你网站留了个外链,指向的是
yourshop.com/shoes。结果百度一看,你家有十几个带参数的地址,内容都差不多,它不知道该把这条外链的权重算给谁。最后大家都没分到多少,排名自然上不去。 - 客户看到的页面不是你想要的:有时候客户从朋友圈点进来,带着一堆跟踪参数,百度可能就把那个带参数的版本当成主页面了。你精心设计的首页,反而没被展示。
怎么判断你家网站有没有被参数“拖后腿”
你不需要懂技术代码,看几个现象就行。
现象一:搜你家品牌名,百度结果里出现好几个长得一样的页面。
比如搜“XX女装”,出来三个结果,网址分别是 xxnvzhuang.com/dress、xxnvzhuang.com/dress?color=red、xxnvzhuang.com/dress?page=2。这就是典型的参数重复问题。
现象二:百度站长工具里,显示抓取了很多带“?”的链接。
如果你在用百度搜索资源平台,进去看看“抓取异常”或者“抓取统计”,如果发现大量带问号、带 ?page=、?sort= 的链接,说明问题已经比较严重了。
现象三:网站后台“页面收录量”很高,但实际有流量的页面没几个。
很多老板一看后台,说“我们网站收录了10万个页面”,很兴奋。但仔细一看,这10万个里,有9万5都是各种筛选、排序组合出来的垃圾页面,真正能给你带来客户的,可能就几百个。
别让参数吃掉你的推广费:5步自查清单
下面这几件事,你花半天时间跟建站公司或者懂技术的员工沟通一下,就能解决大部分问题。
1. 给所有带参数的页面贴上“我是替身”的标签
这是最重要的一步。让你的技术员在所有带参数的页面代码里,加一行代码(叫Canonical标签),明确告诉百度:“不管这个链接长什么样,真正的正主是那个不带参数的干净链接。”
比如 yourshop.com/shoes?color=blue 这个页面,代码里要写上“这个页面的标准版本是 yourshop.com/shoes”。
这样百度就知道,权重和收录,都算在那个干净链接上。所有带参数的,都是临时的、不用收录的替身。
2. 在“robots.txt”里关掉那些没用的参数
如果你网站里有那种纯粹为了跟踪、排序、或者分页产生的参数(比如 ?utm_source=wechat、?page=2、?sort=price),直接让技术员在网站根目录的 robots.txt 文件里,加一行禁止抓取。
比如加一句:Disallow: /*?sort=,百度就不会再去抓那些按价格排序的重复页面了。这能立刻释放大量的抓取额度给你的核心页面。
3. 内部链接只指向干净的网址
你网站自己的导航栏、推荐位、文章里的链接,全部要指向不带参数的干净版本。比如“最新产品”这个按钮,链接应该是 yourshop.com/new,而不是 yourshop.com/new?page=1。
你内部的链接,就是给百度画的地图。地图上全是岔路,百度自然就迷路了。
4. 别用参数来做“地区切换”
很多做加盟的老板,喜欢在网址后面加个 ?city=beijing 来区分不同城市的页面。这种做法百度很难识别,容易造成混乱。
更好的做法是用不同的文件夹,比如 yourshop.com/beijing/,或者用二级域名 beijing.yourshop.com。这样百度能清清楚楚地知道,这是两个不同的内容。
5. 敏感信息绝对不要放在网址里
网址是公开的,会被浏览器历史记录、服务器日志、甚至别人转发时完整记录下来。客户的手机号、订单号、微信ID,这些东西千万别出现在网址参数里。
比如让客户付款,跳转链接里带了 ?user_id=123456&phone=138xxxx,这等于把客户隐私直接贴在了大街上。
总结一下,你只需要做两件事
第一,分清主次。告诉百度,你家网站谁才是主角(干净链接),谁是跑龙套的(带参数链接)。
第二,关掉废话。把那些毫无价值的排序、分页参数,直接在抓取入口就拦下来。
把这套逻辑理清楚,你会发现,不用多花一分钱推广费,百度给你网站的流量和权重,反而会慢慢涨回来。因为你的网站,终于不再是一个到处是分身、让百度犯迷糊的“信息垃圾场”了。
微信扫码