你的网站是不是被死链拖累了?
打开百度搜索结果,点进自己网站的链接——“404 Not Found”?这种尴尬已经发生过多少次了?更扎心的是,后台日志里躺着几百上千条404请求,你却只能一条条复制、粘贴、提交……每次点“提交20条”,都像在给漏船舀水。
别硬扛了。百度资源平台真能批量处理死链,只是入口藏得深,操作有门道。
死链批量提交,到底有几种靠谱方法?
就三条路,选对了省下大把时间:
- 死链规则提交:适合改版后大量URL有固定变化规律的站点,比如
/article/123全部变成/post/123,可以用正则匹配旧路径。 - 死链文件提交:最常用、最稳妥的方式。把所有确认失效的URL列成一个纯文本文件,丢给百度一次性验证。
- API接口调用:适合有开发能力的团队,写个脚本自动抓取+校验+推送,后续完全不用人工干预。
那些号称“一键清理”的浏览器插件,底层其实也是走这三类逻辑。别被界面迷惑,关键看它背后用的是哪一套。
一个真实例子:我们帮一家本地生活资讯站做迁移,老栏目下线后留下近万条失效链接。手动提交要翻500页,光点鼠标就手酸。最后用TXT文件方式一次提交,两天内百度就完成了大部分死链的识别和过滤。
如何制作和提交“死链文件”?
核心就三件事:整理准、放对位置、填对地址。
先准备一个 .txt 文件,用记事本或VS Code这类轻量工具编辑。每行只写一个完整URL,比如:
https://www.example.com/news/old-post-1.html
https://www.example.com/category/2019/
注意:这些链接必须真实返回404(或410)状态码,不能是跳转页、空页面,也不能混入正常能打开的链接。
编辑好后,上传到你网站根目录下,路径尽量简洁,比如 https://你的域名.com/deadlinks.txt。别放在子目录里,也别加多余参数。
接着登录百度资源平台,进入「搜索服务」→「死链提交」,选择「文件提交」方式,把上面那个完整URL粘进去,点提交。百度蜘蛛会按这个地址去下载、逐行抓取并验证。
提醒一句:文件里多一个空行、少一个 https://、或者URL里带中文没编码,都可能导致整份文件被判定为无效。
怎样高效地发现全站死链?
别靠猜,也别等用户反馈。主动找,才找得全。
最直接的办法是看服务器日志——筛选出所有状态码为404的请求URL。但需要你有服务器权限和基础命令能力(比如用 grep " 404 " access.log)。
更普适的做法是用爬虫工具扫一遍。像 Screaming Frog、Sitebulb、甚至国产的「爱站SEO工具箱」都有站点爬取功能。设置好深度(建议3~4层)、开启状态码检测,跑完就能导出所有404链接。
我们惯用的流程是:
① 爬虫扫全站 → 导出404列表;
② 用Excel或在线工具快速去重、清洗(去掉参数过长、重复路径);
③ 随机抽20~30条,手动在浏览器里打开确认是否真404;
④ 把确认无误的链接整理进TXT文件。
这一步花不了半天,但换来的是未来几个月的安心。
提交死链文件后,要注意哪些关键点?
提交只是开始,后面两件事不做,等于白干:
- 文件别删,地址别改。百度不是只来一次,它可能隔几天再回访校验。如果你把
deadlinks.txt删了,或者换成了dead-links-v2.txt,它就再也找不到新死链了。 - 定期更新文件内容。不是一劳永逸。每次栏目调整、文章下线、链接改写之后,都要重新扫描、生成新TXT、覆盖上传。
- 盯紧资源平台的状态反馈。提交后去「死链文件记录」里看,显示「有效」才算成功。如果一直卡在「失效」,先检查三点:文件能否在外网直接访问?URL里有没有拼错?TXT里有没有隐藏字符或BOM头?
很多站长卡在这一步,不是技术不行,是少点了个刷新按钮,或者忘了清浏览器缓存。
处理死链,如何避免“误伤”正常页面?
批量操作最大的风险,不是漏掉死链,而是把活页当死链处理。
比如有些页面返回的是200状态码,但内容只有“该内容已下线”几个字——这是典型的“软404”。百度不认它,你强行提交,反而可能影响收录判断。
所以,在整理死链清单前,务必做两件事:
- 人工抽检:哪怕只抽10条,挨个打开看看。重点看:是否真的打不开?有没有跳转?是否加载缓慢导致误判?
- 区分处理软404:对这类页面,优先考虑加
<meta name="robots" content="noindex">,或者在robots.txt里用Disallow: /old-section/屏蔽,而不是塞进死链文件。
快不是目的,准才是底线。宁可少提100条,也不能错提1条。
今天就能执行的具体操作步骤
现在就打开电脑,照着做:
- 打开你常用的SEO工具(比如爱站SEO工具箱、Screaming Frog免费版,或者百度资源平台自带的「网站支持」里的爬虫功能);
- 输入你的网站域名,启动一次完整爬取(深度设为3,超时调高一点);
- 爬完后,在结果中筛选「HTTP状态码 = 404」,导出为CSV或TXT;
- 用记事本打开导出文件,删掉表头、空行、非URL内容,确保每行都是干净的完整链接;
- 把文件保存为
deadlinks.txt,通过FTP或主机后台上传到你网站根目录; - 登录百度资源平台 → 搜索服务 → 死链提交 → 选“文件提交”,填入
https://你的域名.com/deadlinks.txt,点击提交。
做完这六步,你就已经比80%还在手动点“提交20条”的同行快了一大截。今晚睡前,试试看。