你是不是也遇到过这种事:
网站明明只写了200篇干货,Search Console里却显示索引了上万页?
点开一看,全是 /page/2/、/page/3/……甚至 /page/137/ 这种页面,内容和首页几乎一样,连标题都懒得换。
这些不是什么“隐藏彩蛋”,是分页参数悄悄干的坏事。
它不发警告,不贴罚单,就 quietly 把你的权重摊薄、把爬虫骗去抓空页面、让用户搜到第8页才看到你的内容。
我帮一个做家居测评的团队查问题,他们分类页每页只放6篇文章,但分页开到了42页。
Search Console里光“卧室好物”这个分类,就收录了300多个分页——而真正有用的只有第一页。
用户搜“床头柜推荐”,结果点进来是 /page/19/,页面加载完发现:没图、没更新、连评论都是空的。
分页参数为什么会让搜索引擎“认不清谁是主角”?
因为对 Google 来说,/category/?page=1 和 /category/?page=2 是两个不同的地址。
哪怕它们模板一样、H1一样、正文前半段也一样,只要 URL 不同,它就会当成新页面来抓、来存、来排。
更麻烦的是,很多网站还叠加了其他参数:
?page=2&sort=price_asc?page=3&filter=wood&stock=in?page=5&sort=date_desc&tag=best
一个分类页,轻轻松松生成几十上百个变体。
搜索引擎不会自动帮你判断:“哦,这都是同一个列表的不同切片”。它只会老实干活——抓、存、排。
结果就是:你的核心页面在等爬虫,爬虫却在翻第37页的空白分页。
怎么一眼看出自己中招了?
不用装工具,不用写代码,两步就能验证:
在百度或 Google 里搜:
site:你的域名
看搜索结果底部显示的“约 XXX 个结果”。如果这个数字比你实际发布的文章/产品数多出几倍、十几倍,基本坐实了。登进 Google Search Console → 左侧菜单点“索引” → “页面”
拉到最下面,看“未选为规范的网页”有多少。
这个数字越大,说明搜索引擎越困惑:它抓了一堆长得像的页面,但不确定哪个该当“正主”。
我见过一个知识付费小站,总共89门课,Search Console里“未选为规范”的页面有1700+条——全是课程列表的分页,每页12门课,翻到第150页才把课排完。
解决方案,按实操优先级排(别从最难的开始)
方法一:用 <link rel="canonical"> 指定“谁才是本尊”
这是最轻量、见效最快的处理方式。
打开你任意一个分页(比如 /category/page/2/),查看源代码,在 <head> 里加上这一行:
<link rel="canonical" href="https://你的域名/category/">
注意:所有分页(page/2、page/3、page/4……)的 canonical 都指向同一个地址——也就是你希望被收录的那个“主列表页”。
这样 Google 就明白:“哦,这些是副本,权重都归首页”。
⚠️ 适用前提:分页本身没额外内容。如果你每个分页都配了300字手写导读、本地化案例、用户留言精选……那 canonical 就不合适,往下看。
方法二:用 <meta name="robots" content="noindex,follow"> 让分页“隐身但不闭嘴”
这句话的意思是:
- 别把我放进搜索结果(noindex)
- 但请把我页面上的链接继续爬走(follow)
加在分页 <head> 里就行。
它不干扰链接传递,也不影响你详情页、专题页的收录,只是让分页自己退场。
我们给一个做烘焙教程的公众号官网用过这个方案。
他们列表页每页8篇,开了60多页,加完标签后一个月,索引量掉了85%,但首页和爆款教程的自然流量涨了——爬虫终于有空去看真正值得读的内容了。
方法三:小站可考虑 301 重定向,把多余分页“收编”到首页
适合文章/商品总数少、分页又特别碎的情况。
比如你总共就43篇文章,却分了6页(第6页只有1篇),那就干脆把 /page/2/ 到 /page/6/ 全部 301 跳转到 /category/。
操作简单,效果干净。
但别硬套在电商大站身上——上千商品分50页,全跳首页?用户点“下一页”直接回首页,体验崩了,转化也会掉。
方法四:在 Search Console 里告诉 Google:“page 参数不算数”
路径:Google Search Console → 设置 → URL 参数 → 添加参数
填入 page,选择“对内容无影响”,保存。
⚠️ 注意:这不是魔法开关。Google 会参考,但不一定照做。
所以建议把它当辅助项——配合 canonical 或 noindex 一起用,相当于双保险。
真实处理现场(非虚构)
去年帮一家卖手工皮具的独立站优化。
他们“男包分类”有23个分页,还支持按材质、价格、新品排序,URL 组合超过180种。
Search Console 显示索引了5.2万页,其中4.8万是各种分页变体。
我们做了三件事:
- 所有带
page=的列表页,加<meta name="robots" content="noindex,follow"> - 同时在这些页面
<head>里补上 canonical,统一指向/category/men-bags/ - 在 Search Console 的 URL 参数设置里,把
page和sort都标为“忽略”
三个月后,索引页降到6000以内。
更关键的是:产品详情页的曝光次数涨了,几个主力款的自然点击率明显提升——爬虫终于把预算省下来,用在刀刃上了。
常见误区,踩一个就够你调一周
❌ 加了 noindex,却忘了 follow
写成 <meta name="robots" content="noindex">(缺了 ,follow)→ 爬虫不仅不收你分页,连你分页上的产品链接都不爬了。
✅ 正确写法永远是:noindex,follow
❌ 给产品详情页也加了 noindex
分页是列表,详情页是内容。千万别手滑,把 /product/xxx/ 这类页面也批量打上 noindex。
我们见过有人用正则批量替换,结果把所有 /product/ 开头的 URL 都封了……流量一夜腰斩。
❌ 分页链接是 JS 渲染的,爬虫压根看不到
比如“下一页”按钮是 Vue 动态生成的,或者靠滚动加载。
这种分页,Google 可能根本不知道还有 page/2 这回事——但它又可能通过站内其他入口(比如导航、侧栏推荐)偶然发现并收录。
验证方法:用 Search Console 的“URL检查工具”,输入 /page/2/,看返回状态是不是“已索引”或“可抓取”。如果显示“无法访问”,先修链接,再谈收录。
行动建议:今天下班前就能做完
打开 Google Search Console → 点“索引” → “页面” → 拉到最底,记下“未选为规范的网页”数量。
然后,找你流量最大的那个分类页(比如 /blog/、/products/shoes/),用浏览器打开它的第2页(比如 /blog/page/2/),右键 → 查看源代码 → 搜索 <head> 里有没有:
rel="canonical"name="robots"
如果没有,现在就登录你的 CMS 或主题文件,把这两行加进去:
<link rel="canonical" href="https://你的域名/blog/">
<meta name="robots" content="noindex,follow">
改完立刻发布,不用等上线大版本。
两天后回 Search Console 看“未选为规范”数量有没有开始掉。
有动静,再铺到其他分类;没变化,检查是不是漏了某个模板,或者 CDN 缓存没刷新。
别等“哪天有空系统性优化”。
一个分页标签,就是一道止损线。
你现在花10分钟加上的那行代码,可能就是下个月不用通宵查索引日志的原因。