你刚发完一篇干货满满的推文,刷新页面一看——最顶上那条评论写着“点击领取免费iPhone”,底下还挂着个乱码域名。
气不气?更糟的是,这玩意儿可能已经悄悄拖垮你的搜索排名了。

垃圾链接评论到底怎么溜进来的?

全是机器人在搞鬼。
它们不是真人,不看内容,不点赞,就盯着你网站上所有能填字的地方猛冲。
只要你的评论框没加验证码、没设提交限制、没开反垃圾检测——它三秒就能塞一条进来。

我见过一个做社区保洁服务的站长,后台积压了两万多条“感谢合作,欢迎访问www.xxx-casino.top”这类评论。他一开始觉得删掉就行,结果三个月后自然流量断崖式下滑。查了一圈才发现:Google 把他整个站打上了“垃圾外链集散地”的标签,首页直接掉出前二十。后来重做内容、清理链接、等算法重新评估……半年才缓过来。

这些机器人还会装模作样:换IP、换浏览器指纹、甚至故意停顿两秒再提交。普通插件扫一眼就放行,根本拦不住。

哪些地方最容易中招?

评论区是重灾区,但别以为其他地方就安全。

用户注册页?有人批量建号,在个人简介里塞同一串赌博链接。
联系表单?每天几十条“您好想咨询产品”,点开公司名全是跳转到卖减肥药的站。
产品评价区?更狡猾——“写得真好!能分享到我的博客吗?”后面跟着一个短链接。

有个做企业级SaaS工具的团队,就因为漏审了几条带链接的“咨询留言”,被Google判定为“主动分发低质外链”,核心功能页的排名当场掉了三层。

如何快速揪出这些隐藏的垃圾链接?

别一页页翻后台。
几千条评论,你刷到手抽筋也找不到重点。

用 Google Search Console 的「链接」报告。
它会清清楚楚列出:哪些外部网站给你导流,以及——你无意中给谁导了流。重点关注那些你完全没合作过、名字像乱码、域名后缀是 .xyz.top 的链接。

再翻翻服务器日志。
正常用户点开文章再评论;机器人呢?直奔 /wp-comments-post.php/api/comment/submit 这类接口,User-Agent 还写着“Mozilla/5.0 (Windows NT 6.1; rv:45.0) Gecko/20100101 Firefox/45.0”——这浏览器早该进博物馆了。

有个专注东南亚旅行攻略的博主,某天发现网站卡得像拨号上网。一查日志,每天有上千个脚本在狂刷他的评论接口,把服务器资源占满。他开了 Cloudflare 的 Bot Fight Mode,当天页面就恢复丝滑。

3个一次性清空垃圾评论的方法

方法1:SQL 批量删除

懂数据库?这是最快解法。
进 phpMyAdmin 或命令行,找到评论表(WordPress 一般是 wp_comments),执行这条语句:

DELETE FROM wp_comments WHERE comment_content LIKE '%http://%' OR comment_content LIKE '%https://%' OR comment_author_email LIKE '%@10minutemail.%' OR comment_author_ip REGEXP '^(192\\.168|127\\.0|10\\.)';

一个做家居小家电的店主照着做了。他先删掉所有含链接+内容少于5个字的评论,九成垃圾当场消失。剩下几百条人工过一遍,喝杯咖啡的工夫就干完了。

方法2:正则表达式批量匹配

不敢碰数据库?试试正则。
在 WordPress 后台或导出的 CSV 里搜这些模式:

  • ^Great article!.*?https?:\/\/[^\s]+$
  • ^[a-zA-Z0-9]{8,}@.*?\.(xyz|top|gq|club)$
  • ^Buy now.*?click.*?$

一个技术文档站的管理员,发现评论区全是“Nice post! Visit my site: abc123.xyz”这种。他用 Notepad++ 的正则替换,一键标红、一键删除,十分钟收工。

方法3:自动化规则+AI过滤

不想动手?那就让工具替你盯梢。
在 Akismet 或 CleanTalk 里设几条硬规则:

  • 评论含超过1个链接 → 自动隔离
  • 评论者昵称是纯数字或随机字母(如 xq8k2m)→ 自动隔离
  • 留言全英文,但你的站点语言设的是中文 → 自动隔离

再打开上下文分析开关。AI 会看这句话是不是真的在回应文章内容,而不是复制粘贴的模板话术。
一个中医养生类公众号,启用 CleanTalk 后,垃圾评论从每天上百条变成偶尔一两条,而且基本不会误杀真实读者。

清理之后如何防止死灰复燃?

清完只是开始。
不堵住口子,明天早上你打开后台,又能看见新一批“恭喜中奖!”。

第一道防线:reCAPTCHA v3。
不用让用户勾选“我不是机器人”,它在后台默默分析行为轨迹——真人滚动、停留、鼠标路径都有规律;机器人直线点击、秒提、无停顿,v3 一眼识破。

第二道防线:频率锁。
同一个 IP 或 Cookie,3分钟内只能提交1条评论。机器人每秒刷几十条?直接卡死。

第三道防线:蜜罐字段。
在评论表单里加一个隐藏 <input type="hidden" name="website">,前端 CSS 设为 display:none。真人看不到、不填;机器人傻乎乎全填上。后端只要检测到这个字段有值,直接拒收。

最后别忘更新。
很多垃圾脚本专挑老版本下手——比如 WordPress 5.2 之前的评论接口漏洞,能绕过所有验证直插数据。保持程序和插件最新,等于关掉大多数后门。

今天就能执行的一个操作步骤

现在打开你的 WordPress 后台 →「评论」页面 → 点右上角「筛选」→ 选「包含链接」。
把那些只有“很好!”“谢谢!”“不错!”之类几个字、却挂着陌生域名的评论,全部勾选 → 点「移入垃圾评论」。

如果一眼扫过去超过100条:
立刻进 phpMyAdmin → 找到 wp_comments 表 → 点「SQL」→ 粘贴这句(操作前务必备份!):

DELETE FROM wp_comments WHERE comment_content REGEXP 'https?://[^[:space:]]+' AND CHAR_LENGTH(comment_content) < 10;

敲回车。
两秒钟,干净一半。
剩下的,明天花10分钟人工过一遍。