你的网站是不是被死链拖累了?

打开百度搜索结果,点进自己网站的链接——“404 Not Found”?这种尴尬已经发生过多少次了?更扎心的是,后台日志里躺着几百上千条404请求,你却只能一条条复制、粘贴、提交……每次点“提交20条”,都像在给漏船舀水。

别硬扛了。百度资源平台真能批量处理死链,只是入口藏得深,操作有门道。

死链批量提交,到底有几种靠谱方法?

就三条路,选对了省下大把时间:

  • 死链规则提交:适合改版后大量URL有固定变化规律的站点,比如 /article/123 全部变成 /post/123,可以用正则匹配旧路径。
  • 死链文件提交:最常用、最稳妥的方式。把所有确认失效的URL列成一个纯文本文件,丢给百度一次性验证。
  • API接口调用:适合有开发能力的团队,写个脚本自动抓取+校验+推送,后续完全不用人工干预。

那些号称“一键清理”的浏览器插件,底层其实也是走这三类逻辑。别被界面迷惑,关键看它背后用的是哪一套。

一个真实例子:我们帮一家本地生活资讯站做迁移,老栏目下线后留下近万条失效链接。手动提交要翻500页,光点鼠标就手酸。最后用TXT文件方式一次提交,两天内百度就完成了大部分死链的识别和过滤。

如何制作和提交“死链文件”?

核心就三件事:整理准、放对位置、填对地址

先准备一个 .txt 文件,用记事本或VS Code这类轻量工具编辑。每行只写一个完整URL,比如:

https://www.example.com/news/old-post-1.html
https://www.example.com/category/2019/

注意:这些链接必须真实返回404(或410)状态码,不能是跳转页、空页面,也不能混入正常能打开的链接。

编辑好后,上传到你网站根目录下,路径尽量简洁,比如 https://你的域名.com/deadlinks.txt。别放在子目录里,也别加多余参数。

接着登录百度资源平台,进入「搜索服务」→「死链提交」,选择「文件提交」方式,把上面那个完整URL粘进去,点提交。百度蜘蛛会按这个地址去下载、逐行抓取并验证。

提醒一句:文件里多一个空行、少一个 https://、或者URL里带中文没编码,都可能导致整份文件被判定为无效。

怎样高效地发现全站死链?

别靠猜,也别等用户反馈。主动找,才找得全。

最直接的办法是看服务器日志——筛选出所有状态码为404的请求URL。但需要你有服务器权限和基础命令能力(比如用 grep " 404 " access.log)。

更普适的做法是用爬虫工具扫一遍。像 Screaming Frog、Sitebulb、甚至国产的「爱站SEO工具箱」都有站点爬取功能。设置好深度(建议3~4层)、开启状态码检测,跑完就能导出所有404链接。

我们惯用的流程是:
① 爬虫扫全站 → 导出404列表;
② 用Excel或在线工具快速去重、清洗(去掉参数过长、重复路径);
③ 随机抽20~30条,手动在浏览器里打开确认是否真404;
④ 把确认无误的链接整理进TXT文件。

这一步花不了半天,但换来的是未来几个月的安心。

提交死链文件后,要注意哪些关键点?

提交只是开始,后面两件事不做,等于白干:

  • 文件别删,地址别改。百度不是只来一次,它可能隔几天再回访校验。如果你把 deadlinks.txt 删了,或者换成了 dead-links-v2.txt,它就再也找不到新死链了。
  • 定期更新文件内容。不是一劳永逸。每次栏目调整、文章下线、链接改写之后,都要重新扫描、生成新TXT、覆盖上传。
  • 盯紧资源平台的状态反馈。提交后去「死链文件记录」里看,显示「有效」才算成功。如果一直卡在「失效」,先检查三点:文件能否在外网直接访问?URL里有没有拼错?TXT里有没有隐藏字符或BOM头?

很多站长卡在这一步,不是技术不行,是少点了个刷新按钮,或者忘了清浏览器缓存。

处理死链,如何避免“误伤”正常页面?

批量操作最大的风险,不是漏掉死链,而是把活页当死链处理。

比如有些页面返回的是200状态码,但内容只有“该内容已下线”几个字——这是典型的“软404”。百度不认它,你强行提交,反而可能影响收录判断。

所以,在整理死链清单前,务必做两件事:

  • 人工抽检:哪怕只抽10条,挨个打开看看。重点看:是否真的打不开?有没有跳转?是否加载缓慢导致误判?
  • 区分处理软404:对这类页面,优先考虑加 <meta name="robots" content="noindex">,或者在 robots.txt 里用 Disallow: /old-section/ 屏蔽,而不是塞进死链文件。

快不是目的,准才是底线。宁可少提100条,也不能错提1条。

今天就能执行的具体操作步骤

现在就打开电脑,照着做:

  1. 打开你常用的SEO工具(比如爱站SEO工具箱、Screaming Frog免费版,或者百度资源平台自带的「网站支持」里的爬虫功能);
  2. 输入你的网站域名,启动一次完整爬取(深度设为3,超时调高一点);
  3. 爬完后,在结果中筛选「HTTP状态码 = 404」,导出为CSV或TXT;
  4. 用记事本打开导出文件,删掉表头、空行、非URL内容,确保每行都是干净的完整链接;
  5. 把文件保存为 deadlinks.txt,通过FTP或主机后台上传到你网站根目录;
  6. 登录百度资源平台 → 搜索服务 → 死链提交 → 选“文件提交”,填入 https://你的域名.com/deadlinks.txt,点击提交。

做完这六步,你就已经比80%还在手动点“提交20条”的同行快了一大截。今晚睡前,试试看。