你的网站是不是被自己“锁”起来了?

昨天帮一个做工业设备B2B的客户查流量暴跌,发现首页和三款主力产品页全从谷歌消失了。
翻日志一看——全是 Googlebot 的 403,源头直指 /robots.txt
他上周让外包改测试环境,顺手加了行 Disallow: /……主站直接被“一键封禁”。

第一步:立刻确认“案发现场”和损失

先别删文件,打开浏览器,直接输:你的域名.com/robots.txt
眼睛盯住所有 Disallow: 行。常见雷区有三个:

  • Disallow: /(整站封杀)
  • Disallow: /product/(本想屏蔽旧目录,结果把新品页也拖下水)
  • Disallow: /blog/(以为只是挡掉几篇草稿,结果连爆款干货也一起锁了)

接着马上去 Google Search Console →「网址检查」,粘贴那个消失的页面链接。
如果显示“已屏蔽”,且原因写明 robots.txt,就是它了。
再点开「覆盖率」报告,看“已排除”栏目里有多少页面躺着——数字跳得越高,越说明你漏看了。

一个真实案例:深圳一家做激光切割机的工厂,技术员在部署新后台时,把 Disallow: /admin/ 误写成 Disallow: /admi/,结果整个 /admi/ 开头的路径全被拦住,包括他们最重要的 /admission-guide.html(客户准入流程页)。流量跌了快一半才反应过来。

第二步:安全地修改 robots.txt 文件

改之前,先备份原文件——哪怕就复制粘贴到记事本里存个档。
如果你中的是 Disallow: / 这种“核弹级”误操作,最稳妥的解法不是删掉这行,而是明确告诉爬虫:“全都放行”:

User-agent: *
Allow: /

或者更干净的做法:直接清空文件,只留这一行。
别碰编码!确保服务器保存为 UTF-8,改完立刻用浏览器刷新 /robots.txt 链接,确认内容已更新。
然后回 Search Console 的「网址检查」工具,再测一遍刚才消失的页面——状态必须变成“允许”,才算真正解封。

第三步:主动“敲门”,邀请搜索引擎回来

解封≠自动回归。Googlebot 不会秒回,你得亲手递上名片。
打开 Search Console →「网址检查」→ 粘贴你最想救回来的那个页面(比如 /cnc-machine-model-x/),点「请求编入索引」。
这个动作相当于直接喊话:“这儿有新东西,快来看!”

如果是整批页面躺平(比如 /blog/ 下几十篇文章全没了),那就靠 sitemap.xml
检查你的站点地图是否包含这些页面,确认无误后,在 Search Console →「站点地图」里重新提交一次。
顺便翻翻网站内链:首页、产品分类页、侧边栏推荐位……有没有指向这些页面的链接?没有的话,现在就补上一两个。

一个具体操作:优先救“命脉页面”——比如你靠它拿询盘的落地页、常年排在搜索前三的教程页。别贪多,先保1~3个最关键的。

第四步:恢复期的耐心等待与监控

别指望今天改完,明天就上榜。
小站可能等3~5天才有动静,老站快些,但也要给爬虫留出抓取、解析、重新排序的时间。
每天花2分钟看两处:

  • Search Console「覆盖率」报告里,“已排除”数字是不是在往下掉,“有效”页面数有没有涨;
  • 在谷歌搜 site:你的域名.com "页面标题关键词",看那几个页面有没有悄悄冒出来。

另外,留意服务器日志里 Googlebot 的访问记录——如果它开始频繁扫你刚解封的URL,说明信号已收到。

第五步:如何避免悲剧再次发生?

别等下次出事才想起来设防。

  • 每次改 robots.txt,必须走内部审批:开发改完 → 运维复核 → 在 Search Console 的「robots.txt 测试工具」里跑一遍再上线;
  • robots.txt 加进你日常巡检清单,就像查404链接一样,每月扫一眼;
  • 所有能碰服务器的人,都得知道一件事:这文件不是“可有可无的配置”,是网站对外的“门禁开关”。

一个习惯养成:每次上线新栏目、迁移旧内容、甚至只是换了个CMS插件,顺手打开 /robots.txt,快速扫一遍路径前缀有没有撞车。

如果恢复效果不理想怎么办?

有些页面解封后迟迟不露面,大概率是被降权了——Google 认为你“消失太久,可能不重要了”。
这时候别硬等,要动手唤醒它:

  • 给页面加一段新信息:比如更新参数、补充客户案例、嵌入新视频,哪怕只是重写导语;
  • 从首页、产品总览页、最新文章列表里,给它加个带锚文本的显眼链接;
  • 在微信公众号推文、行业论坛发帖时,自然带上这个页面链接——不是硬广,是当真有用资料分享出去。

本质上,你要把它当做一个“重启项目”,而不是“等它复活”。

今天下班前就能完成的具体操作

现在,关掉其他标签页,用10分钟做完这四步:

  1. 新开无痕窗口,访问 https://你的网站域名/robots.txt,全选复制内容;
  2. 登录 Google Search Console → 左侧菜单拉到底 →「设置」→「旧版工具和报告」→「robots.txt 测试工具」;
  3. 把刚复制的内容粘贴进去,在下方输入你最怕丢的3个页面路径(例如 /industrial-laser/, /support-contact/, /faq/);
  4. 点「测试」——如果任何一行显示“已屏蔽”,截图发给同事一起看,今晚就定修复方案。

做完这个,你心里那块石头,今晚就能落地。