做多语言网站,最扎心的不是翻译慢、不是排版乱,而是——你明明做了日文版、英文版,结果百度搜出来全是中文页面,点进去用户一脸懵,3秒关掉。更气人的是,百度还把你几个语言版本当“复制粘贴”,排名越推越靠后。
这事儿我帮十来个外贸、留学、SaaS客户调过,踩过的坑比走过的桥还多。
百度到底怎么判断网站的地域和语言?
百度不认 hreflang 标签。它看三样东西:服务器IP在哪儿、域名后缀是啥、页面里写的到底是哪种语言。
比如你用 site.com,服务器在美国,内容却是日文——百度大概率会把它当成“一个讲英文但偶尔夹带日文的全球站”,根本不会推给中国或日本用户。
真实案例:一个做B2B工业工具的客户,中/英/日三语,一开始全放在 site.com/zh/、site.com/en/ 这种子目录下。结果百度只认真抓了中文版,英文和日文页几乎没进索引。问题就出在这儿:百度爬虫默认把子目录当“栏目”,不是“独立站点”。
后来他们改用子域名(zh.site.com、en.site.com、jp.site.com),每套语言对应不同地区服务器,流量很快稳住了,中文版没丢,其他两个版本也开始有自然搜索进来了。
记住一点:百度对“地域”的判断,服务器位置 > 域名后缀 > 页面语言。你想打中国市场?中文版服务器必须在国内,或者用 .cn 域名。
子域名还是子目录?多语言网站的3种结构优缺点对比
直说结论:做百度优化,优先选子域名。不是因为它高级,而是它更“听话”。
- 子域名:百度把它当独立站点处理。权重能部分继承主站,但更重要的是——你可以给每个子域名配不同的服务器IP。中文版放阿里云,日文版放日本本地机房,百度爬虫一访问就知道:“哦,这是给日本用户准备的。”
- 子目录:所有语言挤在同一台服务器上,百度分不清谁是谁。它默认认为
site.com/jp/是“网站的一个日语栏目”,而不是“面向日本用户的独立站点”。 - 不同顶级域名(如
site.cn+site.jp):效果最准,但维护成本高到劝退。SSL、备案、CDN、SEO配置全得重来一遍,小团队真扛不住。
反面案例:一个做家居配件的跨境卖家,5个语言版本全塞在子目录里。半年下来,百度只深度抓了中文和英文,剩下三个版本连首页都难进索引。换成子域名后,每个语言版本都有了自己的爬取入口,收录量明显回升。
子域名确实要多配几份 robots.txt、多交几份站点地图,但比起被百度彻底忽略,这点麻烦真不算啥。
如何用服务器IP和域名后缀告诉百度“这个版本给谁看”
百度不听你说,但它会看你的“住址”和“门牌号”。
操作很简单:
- 每个语言版本用独立子域名,比如
cn.site.com、jp.site.com、en.site.com; - 把这些子域名分别解析到对应地区的服务器IP——中文版挂国内云厂商(阿里云/腾讯云),日文版挂日本AWS或乐天IDC,英文版挂新加坡或美国节点。
百度爬虫访问 jp.site.com 时,看到IP在日本,页面又是日文,它就会记一笔:“这是给日本用户看的。”
真实案例:一个做语言培训的网站,中韩双语。原来全跑在新加坡服务器上,百度只收了中文页。后来把韩文版单独迁到韩国本地服务器,一个月内,韩文页的百度收录量涨了不少,来自韩国的搜索点击也多了起来。
域名后缀有用,但不是刚需。.cn 或 .jp 能加一层信任感,但别为了换后缀去另买域名、重新备案。子域名 + 地域服务器,已经够用了。
内容策略:同一个产品,不同语言版本怎么写才不被判重复
别再把中文文案机翻成英文、日文就上线了。百度虽然不像Google那么敏感,但三套页面结构雷同、段落顺序一致、连H2标题都一一对应——它真会怀疑你在“灌水”。
本地化不是翻译,是换脑子写。
- 中文用户关心什么?价格、包邮、7天无理由、发货时效;
- 日本用户关心什么?包装细节、材质说明、是否支持退货、有没有日文说明书;
- 英美用户关心什么?品牌背景、环保认证、是否上过TechCrunch、有没有YouTube开箱视频。
举个实在的例子:卖一款智能插座。
- 中文版首页第一屏写:“99元起,京东顺丰次日达,全国联保”;
- 日文版开头强调:“采用日本PSE认证芯片,附赠日文详细安装图解+LINE客服支持”;
- 英文版则从“我们为什么重新设计插座”讲起,穿插用户实测视频链接和第三方测评截图。
另外,内链也要“守土有责”:中文版只链中文站内页,日文版只链日文页,别让百度看到 jp.site.com 里跳着指向 cn.site.com/product——它会觉得这站逻辑混乱。
百度站长工具的3个设置,让多语言网站收录翻倍
百度搜索资源平台(原百度站长工具)是免费的,也是最该先动的地方。很多人只交个sitemap就撤了,其实漏掉了三个关键开关:
每个子域名单独提交站点地图
别偷懒把所有语言版本塞进一个sitemap.xml。cn.site.com提交自己的sitemap-cn.xml,jp.site.com提交sitemap-jp.xml。百度靠这个区分“谁是谁”。手动设置“地域关联”
进入「站点设置」→「地域关联」,把cn.site.com关联“中国”,jp.site.com关联“日本”。这个动作比服务器IP还直接——等于亲手给百度递张名片:“这位,是专供日本用户的。”补上移动适配规则
尤其是中文版,很多网站PC页做了,手机页却没同步。在「移动适配」里,把cn.site.com的PC页和对应m.cn.site.com的移动端页面做一对一映射。不然用户手机点进来,可能跳到错的语言版本。
真实案例:一个旅游资讯站,中英日三语。最早只交了一个总sitemap,百度收录率不到30%。后来拆开交、加地域关联、补移动适配,一个月后,新页面平均3天内就能被收录,老页面排名也稳住了。
这三个设置加起来,半小时都用不了。
外链和社交信号怎么分配,才能让每个语言版本都有独立权重
外链不是越多越好,而是要“对口”。
中文版的外链,尽量来自知乎、微信公众号、百度贴吧、行业中文论坛;
日文版的外链,去找日本博客、雅虎日本问答、日本IT社区;
英文版的外链,去GitHub项目页、Product Hunt、Reddit相关板块发真实体验。
社交传播也一样:
- 中文内容发微博、百家号、小红书;
- 日文内容同步到Twitter(现在叫X)、LINE官方号、日本note;
- 英文内容推LinkedIn、Facebook主页、YouTube简介区。
百度会悄悄分析外链来源的语言、地域、权重,然后给对应子域名加分。如果你所有外链都指向 site.com 主域名,它只会觉得:“哦,这是个中文站,其他语言只是摆设。”
反面案例:一个下载类工具站,中英日三语,早期所有外链都导到主域名。半年过去,百度只把中文版推到第一页,其他两个版本连第二页都难进。后来他们按语言分头建外链,半年后,三个版本在各自市场的关键词排名都开始往上走。
今天就能执行的3个操作步骤
别收藏吃灰,现在打开电脑,照着做:
打开百度搜索资源平台,查查你各个语言版本的收录情况。如果发现
en.site.com收录量只有cn.site.com的十分之一,先确认是不是用了子目录。如果是,今晚就把子域名解析建好,明天联系运维把对应语言版本部署上去。进「站点设置」→「地域关联」,把你已有的子域名一个个关联到对应国家。比如
jp.site.com→ 日本,cn.site.com→ 中国。5分钟,不用重启,不用等审核。挑一个目前最冷清的语言版本(比如日文版),打开它的首页,删掉所有机翻痕迹。用日语重新写一段话:不说“我们的产品很优秀”,而说“这款插座在日本家庭实测中,连续使用18个月零故障”。写完就发布,别等“完美”。
这三步做完,你已经甩开80%还在用子目录硬扛的同行了。