你的多语言网站,为什么谷歌就是不收录?

你刚上线法语版、日语版,满心期待海外流量,结果打开 Google Search Console——首页有收录,其他语种页面要么灰着(“已发现但未索引”),要么压根没影儿。别怀疑自己翻译得不够好,问题大概率不在内容,而在谷歌压根没把你的多语言页面当“独立站点”看。

我帮几十个出海团队调过多语言站,踩过所有坑。今天不讲理论,只说5个一查就准、改了就见效的硬伤。

为什么谷歌觉得你的页面是“重复内容”?

你以为换种语言就是新页面?谷歌不这么想。
它看到英文页和中文页用同一个模板、同样的H1结构、一样的图片alt、甚至导航栏文字只是直译,第一反应是:“这不就是复制粘贴?”
然后默默挑一个收录,其余标记为“重复”,丢进冷宫。

真实案例:一家深圳硬件公司,法语和德语版页面连产品参数表格的排版都一模一样,只改了单位和语言前缀。谷歌只收了英文页。我们让本地运营重写了产品描述,替换了当地客户实拍图,加了法语区常见使用场景。4周后,法语页收录量明显提升。

检查方法很简单:打开两个语种的同类页面(比如 /en/products/fr/products),肉眼对比——
标题、主文案、图片说明、CTA按钮文字,是不是90%以上雷同?
如果是,先别折腾技术设置,先把内容真正“本地化”再说。

hreflang 标签配置错了,等于没告诉谷歌“这是同一页”

很多人加了 hreflang 就以为万事大吉,其实错一个字符,整套标签就失效。

最常翻车的两种情况:

  • hreflang="x-default" 指向了一个根本不存在的URL(比如 /lang/ 这种空路径);
  • 忘了“自引用”:英文页写了指向中文页的 <link>,但中文页没回写指向英文页的那条。

举个例子:
你有 example.com/en/contactexample.com/zh/contact
英文页的 <head> 里必须有:

<link rel="alternate" hreflang="zh" href="https://example.com/zh/contact" />
<link rel="alternate" hreflang="en" href="https://example.com/en/contact" />

中文页也得有对应的一套。少一条,谷歌就当这套标签不存在。

还有一种误区:用 hreflang="en-us"hreflang="en-gb" 区分美式/英式英语,但页面内容完全一样。谷歌会认为你在“骗权重”。
除非你真改了价格单位、拼写(colour vs color)、本地合规说明,否则统一用 hreflang="en" 更安全。

你的站点地图,只提交了“主语言”页面?

别再把中、英、日、韩所有页面塞进一个 sitemap.xml 里交上去了。
谷歌拿到这种大杂烩,第一反应是:“这么多URL讲同一件事?先抓几个试试,剩下的等以后再说。”

真实案例:一家杭州SaaS公司的四语站点,最初只提交了一个含2000+ URL的总地图,三个月后日语页收录不到10个。我们拆成 sitemap-zh.xmlsitemap-en.xml 等四个独立文件,每个只放对应语种URL,并在 robots.txt 里明确声明:

Sitemap: https://example.com/sitemap-zh.xml
Sitemap: https://example.com/sitemap-en.xml

5周后,日语页收录量大幅增长。

操作不难:用你现在的建站工具(WordPress插件、Next.js的sitemap生成器、或者手动写)导出各语种URL列表,分别保存为不同文件,再更新 robots.txt

为什么你的“自动翻译”页面,谷歌根本不碰?

DeepL、Google Translate API 翻得快,但谷歌看得更细。
它能识别出“shipping cost”被生硬译成“costo de envío”而不是西班牙本地更常用的“gastos de envío”,也能发现整页文案像机器人念稿——没有语气词、没有本地惯用缩写、客户评价全是英文直译腔。

真实案例:成都一家设计工具公司,用自动翻译上线西班牙语站,3个月零收录。我们请马德里的设计师通读一遍,调整了术语、补了西语区用户的真实提问截图、加了本地支付方式说明。两周后,谷歌开始陆续收录。

如果你要用自动翻译:

  • 必须由母语者逐页校对,不是润色,是重写级修改;
  • 每个页面至少补充一段原创内容:比如当地客户怎么用你产品、本地竞品对比、政策适配说明;
  • 别一口气全发,每天最多提交5–10个页面,让谷歌慢慢消化。

你的服务器配置,可能让谷歌爬虫“迷路”

有些技术细节,人看不到,但谷歌爬虫很较真。

比如:

  • 用JavaScript切换语言(点个按钮才加载中文内容),爬虫很可能啥也抓不到;
  • 子目录结构(/fr/)设了全局301跳转,把所有不带语言前缀的请求都导向 /en/,那法语页就成了“孤儿”,谷歌根本找不到入口;
  • CDN节点配置不一致,导致爬虫在法兰克福抓到的是英文页,在巴黎却抓到空白页——谷歌判定“内容不稳定”,直接拒收。

真实案例:宁波一家汽配商的法语站,加载慢5秒,根源是CDN回源规则没按语言区分。修复后,法语页收录速度加快,数量也翻了一倍。

自查重点:

  • 打开法语页,右键“查看网页源代码”,确认核心文案、链接、图片src是否都在HTML里(不是靠JS注入);
  • 在浏览器禁用JavaScript后刷新,页面关键信息还能不能正常显示;
  • WebPageTest 选巴黎节点测一次法语页,再选洛杉矶测英文页,对比首屏内容是否一致。

1个你今天就能执行的操作步骤

现在,打开 Google Search Console → 左侧菜单点「页面」→ 顶部筛选器选「索引状态」→ 点「已发现但未索引」。

找一个你最想推的语种(比如日语),从中随机选10个页面。
接着做两件事:

  1. 在浏览器地址栏输入 https://search.google.com/search?q=site:yourdomain.com/ja/(把 yourdomain.com/ja/ 换成你的真实域名和路径),看看这些页面有没有出现在搜索结果里;
  2. 任选其中1个页面,用 Chrome 右键「查看网页源代码」,搜索关键词——比如你页面里写的“無料トライアル”,源码里有没有?图片的 alt 有没有?导航栏的链接是不是真实可点击的?

如果源码里缺内容、图片挂了、链接是JS生成的,那就先修页面结构。修完,回到 Search Console,对这10个页面点「请求索引」。
3天后回来查结果。成了?批量照做。没成?回头重点检查 hreflang 和站点地图。