你发了一篇干货满满的行业分析,结果搜自己网站名字都找不到它?别急着改标题——先看看是不是不小心把搜索引擎“拒之门外”了。
很多页面根本就不是给用户看的,而是给后台、筛选逻辑、测试流程服务的。它们悄悄占着爬虫的名额,却从不带来一个真实访客。
为什么你的核心页面迟迟不被收录?
搜索引擎每天能抓的页面数量是有限的。这就像快递员一天只能送50单,如果他花了45单去送一堆没人要的样品页,你那款爆款产品的详情页,可能连门都没进。
我帮过一家做工业配件的网站诊断收录问题。他们有800多个产品页,但自动生成的参数筛选页(比如“压力范围:0–10MPa + 材质:不锈钢 + 接口类型:NPT”)堆了上万个。爬虫天天在这些组合页里绕圈,三个月下来,真正的产品页只进了不到三分之一的索引。加完noindex后,两周内核心页面收录量翻了两倍多。
你现在就可以打开自己网站的后台,快速扫一眼:有没有那种点进去只有几个字、没正文、没图、也没人会搜的页面?比如“搜索结果为空”页、老活动下线后的空壳页、测试用的临时专题页……这些,就是第一批该贴上noindex标签的地方。
怎么判断哪些页面该加noindex?
一句话:用户搜什么词,会想点进这个页面?如果答案是“不会”,那就该加。
这些页面,基本不用犹豫:
- 搜索结果页:用户搜“气动阀门选型”,出来的列表页。内容随关键词变,没有固定价值,收了反而让谷歌觉得你在凑数。
- 标签页和小分类页:比如“#法兰连接”下面只有两篇旧文章,连摘要都不完整。这类页面权重低,还容易和别的页撞内容。
- 后台类页面:登录页、注册页、购物车、订单完成页。它们是流程环节,不是信息出口。
- 分页第二页及以后:如果page-2只是page-1的下半截,没新增解读、没独立结论,那它对搜索者毫无意义。
有个做企业培训的内容站,一直奇怪为什么新课介绍页总不被收。我让他们导出sitemap一看,发现连“讲师个人主页”(只有头像+一句话简介)都被提交了。加上noindex后,课程页的收录速度明显加快。
正确添加noindex的3个常见坑
<meta name="robots" content="noindex">看着简单,但真动手时,三个坑八成人都踩过。
坑1:只靠robots.txt拦住爬虫,却不告诉它“别收”
Disallow只是说“别来拿”,不是说“别存”。蜘蛛可能压根不抓,但万一别人外链指向这个URL,谷歌还是会把它当一个“空页面”记进索引——既没内容,又占位置,还拉低信任分。
正确做法:想彻底排除,先加noindex;如果连爬都不想让它爬,再加Disallow。两者不是替代关系,是配合关系。
坑2:noindex标签放错了地方
有位前端同事跟我说,他加了noindex,查源码也看到了,可就是不生效。最后发现标签被塞进了<body>里。搜索引擎只认<head>里的noindex。JS动态插入更悬——虽然谷歌能跑JS,但加载失败、执行延迟、资源竞争都会让它漏掉。最稳的办法:在服务器吐HTML时,就把noindex写死在<head>里。
坑3:加完就忘,等它自己“醒”过来
noindex不是开关一按就立刻消失。谷歌得重新抓一次,才能更新索引状态。很多人加完等一周、两周,结果页面还在搜索结果里挂着。
解决方法很直接:打开谷歌搜索控制台,用“网址检查”工具,挨个提交那些刚加了noindex的URL,点“请求编入索引”。状态变成“已排除(noindex)”,才算真正落地。
管理noindex的3个实用方法
别指望每次上线新页面都手动加标签。管百来个页面可以手点,管上千个就得靠系统。
方法1:在CMS模板里设规则
如果你用的是WordPress、Shopify或国内常用的建站系统(如Z-Blog、Emlog),直接改模板文件。比如:所有URL含/tag/或/search/的页面,自动输出noindex;所有带?page=参数的分页,第2页起自动加。这样新生成的页面天生就“守规矩”。
之前帮一家B2B设备供应商调优,他们在文章模板里埋了个判断:发布超7天 + 有至少3条真实客户留言,才允许被索引。其他轻量内容默认noindex。三个月后,首页展示中来自自然搜索的占比涨了一大截。
方法2:用现成SEO插件批量控
Yoast SEO、Rank Math、国内一些主题自带的SEO模块,都有“按内容类型设置noindex”的选项。你可以一键关掉整类标签页、归档页、作者页的索引权限。适合不想碰代码的小团队或个人站长。注意一点:插件越多,页面加载越慢。流量不大时省事优先;日均UV过万,建议回归模板层控制。
方法3:每月花半小时做一次“noindex体检”
新上的活动页是不是误开了索引?之前标为noindex的老专题,现在补全了案例和参数表,值不值得放开?用Screaming Frog爬一遍,导出所有带noindex的URL,再对照后台逐个过筛。你会发现,有些页面早就该“摘帽”,有些则该“戴帽”。
去掉noindex的正确时机和操作
noindex不是永久封印。内容升级了,它的权限也该跟着变。
什么时候该去掉?
- 原本只有标题和倒计时的活动页,现在加了详细方案、客户见证、对比表格;
- 一篇时效新闻被重构成常青指南,比如《2023年展会回顾》改成《工业展参展避坑手册》;
- 测试页正式上线,内容稳定、路径清晰、有真实用户反馈。
操作就三步:
- 从页面
<head>里删掉那行<meta name="robots" content="noindex">; - 打开谷歌搜索控制台,用“网址检查”提交这个URL,点“请求编入索引”;
- 等3–5天,回来看状态是否变成“已编入索引”。
千万别来回折腾。今天加明天删,谷歌会把你标记为“内容不稳定站点”,下次抓取就给你降频。
有个旅游博主早年把所有目的地页都noindex了,怕内容不够深。后来他重写了20多个重点城市指南,每篇配实拍图、本地交通贴士、淡季优惠清单。统一去掉noindex并提交后,一周内全部进索引,两个月后有7篇进了前三页。
如何用搜索控制台监控noindex效果
加完不等于做完。你得盯住两件事:有没有误伤?有没有漏网?
第一眼先看“已排除(noindex)”列表
路径:搜索控制台 → 索引 → 页面 → 已排除 → 已标记为noindex。这里列着所有你主动屏蔽的页面。如果某天数字突然暴涨几千,大概率是模板逻辑写崩了,或者插件批量误操作——赶紧查源头。
再看“效果”报告里的结构变化
路径:效果 → 按页面查看。重点关注两类页面的“展示次数”:
- 那些你刚加了noindex的低价值页:展示应该快速下滑;
- 你真正想推的核心页(比如产品页、解决方案页):展示应该稳步上升。
如果两边都在跌,说明可能误关了不该关的页面;如果低价值页还在高展示,说明noindex没生效。
之前优化一个技术论坛,他们所有“用户签名档”页面都被索引了——每页就一行文字+一个头像,展示量虚高,点击率不到0.3%。加noindex后,签名档展示断崖下跌,但精华帖的展示和点击双双上涨,总流量反而更健康。
今天就能执行的1个操作
打开谷歌搜索控制台,进入“索引” → “页面” → “未收录”,把筛选条件设为“已发现但无法访问”或“已发现但被屏蔽”。把列表里的URL全复制下来,粘贴到Excel里,一一对应回你的网站后台,看它们属于哪一类:是标签页?搜索页?用户中心页?还是某个下线活动的残留链接?
确认是低价值页面后,立刻登录你的建站后台或FTP,在对应页面模板或单页HTML的<head>里,加上<meta name="robots" content="noindex">。
然后回到搜索控制台,用“网址检查”工具,把这批URL一个个提交,点“请求编入索引”。
一周后回来,再看这些页面的状态栏——只要变成“已排除(noindex)”,你就已经抢回了一部分爬虫额度。