你花了几千块做个网站,内容也更新了,但百度就是不收录你的产品页。去搜自己公司名,翻三页都找不到。问题出在哪?
可能不是内容不行,而是你忘了给搜索引擎一张“地图”。
网站做好了,为什么百度就是不来?
搜索引擎的爬虫不是全能的。你的网站要是没有外部链接指向它,爬虫可能根本不知道你的存在。尤其是新站,没有外链,就像一家开在深山里的店,导航上搜不到。
你需要的,是一个叫 XML 站点地图 的东西。它就是一个文件,把网站里所有重要的页面列出来,告诉百度:“这些页面都在这里,快来抓。”
站点地图到底能帮你什么?
它不直接提升排名,但能让你的页面被更快地发现和收录。
具体来说,它告诉搜索引擎三件事:
- 你的网站有哪些页面
- 这些页面最后更新是什么时候
- 哪些页面相对更重要
对于新站,没有外链,提交站点地图就是让爬虫直接走VIP通道进来。
对于老站,它能帮你把藏得深的页面(比如某个冷门产品页)也翻出来,还能让新文章发布后几小时内就被抓取,而不是等上好几周。
别搞混了:这个“地图”不是给人看的
很多老板知道网站要有个“网站地图”,但那通常是给访客看的,叫HTML站点地图,上面列了一堆链接方便用户点。
XML 站点地图是写给爬虫看的代码文件。普通人打开它看到的是一堆乱码,但百度能读懂。两码事,别搞混。
怎么判断你的网站有没有这个地图?
很简单。在浏览器里打开你的网站域名,后面加上 /sitemap.xml。
比如你的网站是 www.nidegongsi.com,就输入 www.nidegongsi.com/sitemap.xml。
如果看到一堆类似代码的东西,说明已经有了。如果显示404(页面不存在),那就没有。
没有站点地图怎么办?三种方法
方法一:用网店系统的自带功能
现在主流的网店系统(比如用WordPress做的独立站),从某个版本开始就自带基础站点地图功能了。
你只需要在浏览器输入 你的域名/wp-sitemap.xml,就能看到系统自动生成的地图。
但这个自带功能比较简陋。你不能控制哪些页面放进去、哪些不放,也不能在发布新内容时自动通知百度。
方法二:装一个SEO插件(推荐)
这是最省事的办法。装一个SEO插件,比如国内常用的那些,它们基本都自带站点地图功能。
装好之后,一般默认就开启了。你可以在插件设置里找到“站点地图”选项,看到它的地址,然后复制下来。
这类插件的好处是:
- 你可以手动排除不想被收录的页面,比如“感谢下单页”、“隐私政策”这些不需要排名的页面
- 发布新文章时,它会自动通知搜索引擎
- 如果你网站里有视频,还能生成专门的视频站点地图,让视频有机会在搜索结果里展示缩略图
方法三:纯手动制作(不推荐)
如果你懂技术,可以自己写一个XML文件上传到服务器。但操作繁琐,改起来也麻烦,普通老板没必要折腾。
最关键一步:把地图提交给百度
地图生成了,你不告诉百度,它还是不知道。
去百度搜索资源平台(以前的百度站长平台),注册并验证你的网站所有权。
验证通过后,在左侧菜单找到“站点地图”或“链接提交”,把你刚才复制的地图地址粘贴进去,点击提交。
提交后,百度会开始抓取你的网站。过几天你可以回去看看数据,能看到哪些页面被收录了,哪些被排除了。
提交完就完事了?你得盯着点
站点地图不是一劳永逸的。
你需要在百度搜索资源平台里定期看看“收录”相关的报告。如果发现大量页面被标记为“不被收录”,你得查原因。
常见的不收录原因有:
- 页面内容太短,没啥价值
- 跟其他页面重复了
- 你误操作把页面设成了“禁止索引”
这时候,你可以检查一下你的SEO插件设置,看看是不是不小心把不该屏蔽的页面给屏蔽了。
几个常见坑,提前告诉你
坑一:以为站内链接好就不用地图了
有些老板觉得网站内部链接做得很好,爬虫总能顺着找到。但新站没有外链,爬虫连门都进不来,内链再好也没用。小站点也建议做,几分钟的事,别省。
坑二:把所有页面都塞进地图
有些页面你根本不想让它出现在搜索结果里,比如测试页、后台登录页、重复的标签页。这些页面放进地图,浪费爬虫的抓取额度,还可能让百度觉得你网站质量差。该排除的就要排除。
坑三:提交完就不管了
站点地图的状态会变化。比如你删除了某个产品,但地图没更新,百度来抓的时候发现是死链,就会降低对你网站的信任。用插件自动更新,省心很多。
总结一下你该做什么
- 访问
你的域名/sitemap.xml,检查有没有地图 - 没有的话,装一个SEO插件,自动生成
- 去百度搜索资源平台提交地图地址
- 隔几天看一次收录报告,处理异常页面
- 把不想被收录的页面(隐私政策、后台页等)从地图里排除
这事儿花不了你半小时,但能让你网站的每个产品页都有机会被百度看到。不做,你写的文章、上的产品,可能永远躺在服务器里吃灰。
微信扫码