你的网站权重,是不是被这些“隐形页面”偷偷吃掉了?

你有没有试过:内容写得挺用心,外链也铺了不少,结果搜自己最想推的词,首页都摸不到边?
查了下索引量——好家伙,几万条;再看真实流量——冷得像冰箱。问题可能就藏在你从没点开过的链接里。

参数页面是什么?为什么它们是“权重杀手”?

参数页面,就是 URL 里带 ?= 的那种。
比如电商用户点了几下筛选,浏览器地址栏蹦出:example.com/products?category=shoes&color=red&size=42
这一个动作,背后可能衍生出几百个相似链接。
搜索引擎如果全当独立页面抓走、收录,麻烦就来了:

  • 内容几乎一样,但每个页面都分走一点内部链接的权重;
  • 大量页面重复度高,容易让 Google 觉得你站内容水、结构乱;
  • 曾有个旅游网站,目的地页因为没管排序和筛选参数,被收了几万个“假页面”,核心城市词卡在十页之后,拖了快一年才缓过来。

如何精准识别网站上的参数收录问题?

别靠感觉,直接查数据。
第一步,打开 Google Search Console(GSC),点进「覆盖率」报告,重点看这两类:

  • 标记为「已重复」或「已替代」的 URL;
  • 状态是「已提交,但未编入索引」且路径含 ? 的条目。
    第二步,在谷歌搜索框里敲:site:你的域名.com inurl:?,回车。看到的结果数,基本就是你已经被收录的参数页总量——通常比你想的多得多。
    第三步,翻翻网站日志(如果你有 access 权限),搜 ?,看看爬虫是不是天天在刷那些带参数的链接。三组数据一对,哪些参数在捣乱,一目了然。

禁止收录参数页面,这3个核心方法哪个更适合你?

方法一:用 robots.txt 拦住爬虫
robots.txt 里加一行:

Disallow: /*?*

所有遵守规则的爬虫看到这条,就不会去抓带问号的链接。
但它只管“不抓”,不管“不收”。如果页面早被收录、或者有外部链接指向它,它还会留在搜索结果里,只是不再更新。

方法二:用 rel="canonical" 把权重“归还”回去
在参数页的 <head> 里加:

<link rel="canonical" href="https://example.com/products/shoes/" />

意思是:“我这个带参数的页面,权威版本其实是上面那个,把我的权重算给它。”
适合那些内容有用、但不该单独排名的筛选页。

方法三:用 noindex 直接说“别收我”
在参数页 <head> 加:

<meta name="robots" content="noindex, follow">

效果最干净:不进索引库,但页面里的链接还能继续传权重。
对纯技术参数(比如会话ID、跟踪码)最稳妥。

动态参数与静态参数,处理策略有何不同?

先分清:这个参数,是人需要的,还是机器塞的?

  • 动态参数:像 ?sessionid=xxx?utm_source=weibo 这种,用户根本看不到、也用不上。一律进 robots.txt 黑名单,别让它露面。
  • 静态参数:比如 ?color=blue?sort=price,用户真会点,也可能带来转化。这类别一刀切屏蔽,而是用 rel="canonical" 指向优化好的静态专题页(比如 /blue-shoes/)。
    之前帮一个家具站改过,他们把 /sofas?material=leather 全部规范到 /leather-sofas/ 这个有图文、有场景、有用户评价的页面上,重复问题没了,皮革沙发这个词的排名也明显提升。

处理完参数后,别忘了这2个关键的收尾动作

第一,主动请 Google 忘掉旧链接
进 GSC → 左侧菜单点「移除」→ 选「临时移除」→ 粘贴几个典型的参数 URL(比如带 ?color=red&size=42 的),提交。不是永久删除,但能加速它们从搜索结果里淡出。

第二,盯紧三件事:索引量、核心词排名、爬虫动向

  • 看 GSC 的「索引状态」曲线,处理后几天内,索引总量该稳中有降;
  • 每周扫一眼你最在意的 3~5 个核心词,位置有没有松动、前移;
  • 回头检查一遍导航栏、侧边栏、面包屑——别一不小心,又把某个带参数的链接当正常入口挂上去了。

今天下班前,花15分钟执行这个自查动作

现在就打开 Chrome 或 Edge,无痕窗口,访问你的网站。
随便点开一个产品列表页,狂点筛选、排序、分页……盯着地址栏看:

  • URL 是不是越点越长?
  • 有没有冒出 ? 后面跟着一堆 &
    挑一个最复杂的,复制整条链接,粘贴到谷歌搜索框,前面加上 site:,回车。
    如果它真的出现在搜索结果里——恭喜,你已经定位到第一个“权重漏洞”。
    接着,打开 Google Search Console,直奔「覆盖率」报告,快速滑动两屏,找有没有成片的 inurl:? 被标为「已重复」。
    今天不做修改,只做确认。
    只要这一步做完,你就比昨天更清楚,问题在哪。