你是不是也这样:刚建好一批标签页,结果发现搜“白色T恤”出来的全是自己家的页面,点开三个,描述一模一样?更糟的是,Google干脆不收这些页——不是它不想收,是它觉得“这不就是同一张脸换了个马甲嘛”。
别急着删标签。问题不在标签本身,而在我们总把标签页当成“自动过滤器”,忘了它其实是个要独立出场的页面。
为什么标签页内容重复比你想的更致命?
标签页,比如电商网站的“白色 T 恤”、“男士 T 恤”、“纯棉 T 恤”,本质上是同一个产品库的不同筛选视角。你可能会想:“我内容不一样啊,一个强调颜色,一个强调性别,一个强调材质。”但搜索引擎只看页面文本。如果三个页面的产品描述都是“优质 T 恤,舒适透气”,那它就是重复内容。
我帮过一个做家居用品的站长,他建了20多个标签页:“客厅窗帘”“卧室窗帘”“遮光窗帘”“简约窗帘”……结果 Google Search Console 里一堆“已选择未编入索引”。他查了两个月,最后发现:所有标签页顶部都用同一段模板描述——“精选窗帘,遮光隔热,安装便捷”。搜索引擎不是在挑刺,它只是诚实地说:“这几个页面,说的是一件事。”
重复内容最伤人的地方是:它悄悄把你的流量分走了。本来该集中给“纯棉T恤”的权重,被“白色T恤”“夏季T恤”“基础款T恤”几个页面平分了。最后谁都没排上去。更麻烦的是,当这类页面占满你站点的三分之一以上,Google会开始怀疑:这个站到底有没有认真经营内容?
3 个方法让标签页内容“脱胎换骨”
方法一:给每个标签页写一段“自我介绍”
别套模板。每个标签页顶部,加一段50–150字、只属于它的开场白。不是“这是我们的白色T恤合集”,而是像朋友聊天那样说清楚:这个标签是为谁服务的?它和其他标签有什么不同?用户点进来想解决什么问题?
比如:
“白色T恤不是‘默认选项’,而是穿搭里的万能底牌。它要扛得住通勤衬衫外搭,也要经得起周末单穿配牛仔裤。我们选的这批,全部采用200克精梳棉+双针领口加固,洗十次也不垮形。”
去年我帮一个宠物用品站改“幼猫粮”标签页,原来它和“猫粮”页几乎一样。我在“幼猫粮”页顶上加了这么一段:
“小猫的肠胃还在发育,普通猫粮可能引起软便或食欲不振。这批幼猫粮特别添加了益生菌组合和DHA,蛋白含量比成猫粮高20%,且颗粒更小、更易咀嚼。”
改完一周,那个页面的搜索点击量就明显提升——因为Google第一次看清:这不是“猫粮”的副本,而是一个有明确对象、有具体需求的独立页面。
方法二:用 rel="canonical" 告诉搜索引擎“谁是老大”
rel="canonical" 不是“随便指一个页面”,而是告诉搜索引擎:“如果这几页长得太像,请以这个为准。”
举个常见场景:你有个“全部T恤”汇总页,还有“白色T恤”“纯棉T恤”“宽松版型T恤”等子标签页。如果后三者的正文内容90%来自汇总页(比如只改了标题和筛选条件),那就该把它们的 canonical 都指向“全部T恤”页。
但注意一个坑:如果你把“白色T恤”的 canonical 指向“全部T恤”,又希望“白色T恤”这个词能单独被搜到,那基本没戏。rel="canonical" 是放弃排名权的声明。真想靠“白色T恤”这个词抢流量?那就别用 canonical,老老实实用方法一写独特描述,再配合方法三筛掉无效页。
方法三:用 noindex “雪藏”那些不该被搜到的标签页
有些标签页天生就不该进搜索结果。比如“按销量排序”“最新上架”“价格从低到高”——它们没有固定内容,全靠后台算法动态生成,用户也不会主动搜这些词。
对这类页面,直接在 <head> 里加一行:
<meta name="robots" content="noindex, follow">
意思是:“别收录我,但可以顺着我身上的链接去爬其他页面。”
我见过一个服装站,光是“颜色×尺码×价格区间”的组合标签就生成了300多个页面。这些页除了URL参数不同,正文完全一致。加上 noindex 后,Google的爬虫很快就把精力转回了真正重要的产品页,核心页面的收录速度缩短了不少。
技术层面如何“一劳永逸”地解决?
如果你用的是 WordPress 或 Shopify,原生标签系统确实容易踩坑。不用推倒重来,三件事就能堵住漏洞:
第一,砍掉“自嗨型”标签。
别给每个属性都建标签页。“颜色:浅米色”“材质:涤纶65%”这种细节,用户根本不会搜,留着只会制造重复。只保留真实搜索词对应的标签,比如“纯棉”“防水”“大码”“无袖”——这些词你在淘宝、京东、小红书上都能看到人搜。
第二,别让所有标签页共用同一段产品描述。
很多主题默认调用的是商品后台的“短描述”字段,结果所有标签页一模一样。要么手动给每个标签页单独填一段简介(WordPress 可用 Yoast SEO 的“标签页描述”功能);要么用变量逻辑,比如在“白色T恤”页显示“这款白色T恤……”,在“男士T恤”页显示“这款男士T恤……”,让描述跟着标签名走。
第三,管住URL参数。
像 /tag/white-tshirt?sort=price_asc 这种带 ?sort= ?page= 的链接,本质是同一页面的多个快照。直接去 Google Search Console → 设置 → 参数,把 sort、filter、page 这些参数设为“忽略”。或者更简单:在 robots.txt 里加一行Disallow: /*?*sort=
让爬虫连门都不进。
内容重复的“隐形杀手”:你还没注意到的细节
有时候问题不出在单个标签页,而出在“邻居之间”。
比如你有“白色T恤”和“白色圆领T恤”两个标签页,产品列表重合度高达80%。哪怕顶部描述写了不同的话,Google仍会判定:这两个页面服务的是同一群人,解决的是同一个问题。它不看文字多努力,只看实际呈现的内容有多接近。
解决办法很简单:合并。把“白色圆领T恤”并入“白色T恤”,然后在页面上加个筛选栏,让用户一键切“圆领”“V领”“POLO领”。体验没损失,页面数减了,SEO负担也轻了。
另一个常被忽略的是分页。/tag/white-tshirt/page/2 这类页面,往往只有产品顺序和第1页不同,正文结构、标题、描述几乎一样。对这类页面,两个选择:
- 加
rel="prev"/rel="next"(适合内容量大的标签); - 或直接给所有分页加
noindex(更适合中小站点,省心)。
今天就能执行的 3 个操作步骤
别收藏吃灰,现在打开电脑,照着做:
打开你的 Google Search Console,点左侧“页面”报告 → 点右上角“筛选” → 输入
/tag/或/category/,再勾选“已选择未编入索引”或“重复内容”。把列出来的URL复制到记事本,标出哪些是标签页。打开其中3个最常被标记的标签页,逐个对比:它们的产品列表是否高度重合?顶部描述是不是复制粘贴的?如果是,立刻打开后台,给其中一个补一段专属开场白(就写在页面顶部编辑框里,不用动代码)。
找一个确定没价值的标签页(比如
/tag/price-low-to-high),进入网站后台的页面编辑模式(WordPress 是“标签”→“编辑”,Shopify 是“在线商店”→“导航”→对应标签),在SEO设置里找到“页面机器人指令”或直接在<head>区域加一行
<meta name="robots" content="noindex, follow">
保存,再回到 Search Console 提交该URL进行重新抓取。
做完这三步,不用等一个月——下周你再去看 Search Console 的“重复内容”数量,就会发现它开始往下掉了。真正的变化,从来不是从大方案开始的,而是从你改掉第一个标签页的那100个字开始的。