你搜“王小波”,百度直接弹出人物卡片;你搜自家作者,连个头像都不给。不是内容不够好,是百度压根没认出——这人是谁,干过啥,跟谁有关。

为什么你的“人物介绍页”在百度里像个路人?

很多人觉得结构化数据是Google的事,百度不搭理。其实百度2017年就支持人物类结构化数据了,但到现在,绝大多数人物页还是光秃秃一段文字,没标签、没关系、没锚点。你写得再细,百度爬虫扫过去,只当是篇普通随笔。

它看不懂“生于北京,毕业于人大,代表作有《沉默的大多数》”这句话里哪是出生地、哪是学校、哪是书名。它需要你亲手标清楚:这是birthPlace,这是alumniOf,这是workPerformed。不标,它就跳过。

如何用3个步骤让百度“读懂”你的主人公?

别被“Schema”吓住。这事不靠技术,靠逻辑。你只需要把三件事理清楚:

第一步:定义“主体”身份

百度最关心的不是你填了多少字段,而是这几个核心信息有没有、对不对:

  • name:只写真名,别加括号、头衔或“著名”“资深”这类词。比如写“余华”,不是“余华(作家)”。
  • description:一句话说清身份,像朋友介绍那样自然:“中国当代作家,代表作《活着》《许三观卖血记》”。
  • sameAs:贴出权威出处链接,比如百度百科、豆瓣作者页、官方公众号主页。链接要是能打开的,别放死链。

我见过一个文学网站,把name写成“莫言(诺贝尔文学奖得主)”,结果整段结构化数据失效。百度要的是干净的姓名,头衔请挪到description里。

第二步:建立“关系网络”

人物不是单机游戏。百度知识图谱里,“关系”比“简介”更重。它想确认:这个人和谁是一家人?跟谁一起工作过?在哪读的书?

关键字段就这几个:

  • spouse:配偶名字,最好带@type: Person嵌套,哪怕只填name也比写“已婚”强。
  • parent / child:直系亲属,别往上扒祖宗三代。
  • alumniOf:毕业院校,写全称,比如“北京师范大学中文系”,别缩成“北师大”。
  • memberOf:所属机构,比如“中国作家协会”。

有个影视资讯站给导演页面加了colleague,但只写了“合作演员:黄渤、徐峥”。百度不认这种列表。正确做法是,为每位合作者单独建一个Person对象,至少带name

第三步:覆盖“关键事件”

代表作、获奖、重要任职,这些不是点缀,是百度判断人物分量的硬指标。

  • award:写具体奖项全称,比如“茅盾文学奖”“上海国际电影节最佳导演”,别写“多次获奖”“业内公认”。
  • jobTitlealumniOf:如果人物现任某职,比如“华东师范大学教授”,就用jobTitle;如果是校友身份,用alumniOf。别混着来。
  • knowsLanguage:作家、翻译家可加这个,比如“汉语、英语、西班牙语”,百度会据此关联海外作品。

有个文化类公众号,给一位策展人页面填了award:“业内知名,屡获嘉奖”。测试工具一跑,全红——百度要的是字符串,不是形容词。

这3个常见错误,正在毁掉你的结构化数据

错误一:乱填不存在的属性
给清代诗人页面加telephoneemail?百度看到这种明显不合常理的数据,会怀疑整页可信度。历史人物别填联系方式,当代人物也只填公开渠道能验证的。

错误二:一股脑塞太多关系
有团队给一位企业家页面,把父母、岳父母、子女、女婿、外甥全塞进一个JSON-LD块,代码拉到屏幕外。百度解析超时,直接丢弃整段。记住:只留直系+关键职业关系。其他关系,等百度先认出这个人再说。

错误三:填完就忘,从不复查
结构化数据不是交卷就完事。有人给还在任的CEO页面误填了deathDate,结果搜索结果里真显示“已故”。这种低级错误,每月用百度工具扫一遍就能避开。重点盯日期、状态类字段(startDateendDatealumniOf是否还有效),尤其换岗、离职、获奖后要及时更新。

为什么“人物关系”比“人物简介”更值钱?

当你只写“张艺谋导演”,百度只能给你排个名;但如果你同时告诉它:张艺谋是“北京电影学院校友”“《红高粱》导演”“中国电影家协会主席”“巩俐前夫”,百度就会把你这页,自动连到电影、院校、协会、合作演员的知识节点上。

这不是玄学,是它在构建一张网。你连得越准,这张网就越牢——你的页面不再是孤岛,而是别人搜“第五代导演”“国产大片”“金熊奖”时,可能顺带浮现的关联入口。

实际效果什么样?一家专注纪录片的网站,给每位导演页面都补上了sameAs(豆瓣导演页 + 百度百科 + 官方微博),三个月后,相关搜索的“人物卡片”出现频率明显提升,不少长尾词开始带关系图谱:比如搜“《舌尖上的中国》总导演”,直接弹出陈晓卿的合作团队和代表作链路。

今天就能执行的1个具体操作

打开你的网站后台,找访问量最高的那个人物页面(比如首页轮播位上的作家、公众号置顶的创始人、最近推文里的行业专家)。

现在就做:

  1. 打开百度搜索资源平台 → 结构化数据工具
  2. 粘贴那个页面的URL,点击“测试”
  3. 如果提示“未检测到结构化数据”,立刻在页面HTML的 <head> 区域,插入下面这段JSON-LD(用真实信息替换引号里的内容):
{
  "@context": "https://schema.org",
  "@type": "Person",
  "name": "李四",
  "alternateName": "李四(作家)",
  "description": "中国科幻作家,代表作《银河之门》",
  "award": "第35届中国科幻银河奖最佳长篇小说奖",
  "sameAs": [
    "https://baike.baidu.com/item/李四",
    "https://book.douban.com/author/123456/"
  ],
  "spouse": {
    "@type": "Person",
    "name": "王五"
  },
  "alumniOf": "北京大学中文系"
}
  1. 保存页面,回到测试工具重新扫描,确保没有红色报错
  2. 去百度站长平台 → 普通收录 → 手动提交这个URL

做完这5步,不用等优化周期,24小时内搜“李四 作家”,看有没有人物卡片弹出来。没有?检查两点:sameAs链接能不能正常打开,以及name里有没有多加括号或空格。这一步,已经卡住90%的同行。