要点概述:
- 深度求索(DeepSeek)大陆版本产出亲华批驳文章,而海外版本则提出批评
- 《自然》研究发现,ChatGPT和Claude在75%的中文提示词下给出更倾向北京的答复
- 国家宣传文件在训练数据中的影响力比中文维基百科文章高出41倍
要点概述:

《华尔街日报》的一项实验发现,包括DeepSeek和ChatGPT在内的AI聊天机器人,会根据使用的语言以及用户反驳的力度,对中国相关问题给出截然不同的答案。
当加州读者Jeff He将《华尔街日报》的一篇专栏文章翻译成中文,并与国内的高中同学分享时,回应迅速而来。一位朋友请DeepSeek——中国领先的本土AI模型——撰写一篇反驳文章。该机器人产出了一篇题为"未来不属于美国"的评论,声称中国拥有华为、腾讯、字节跳动和比亚迪,而美国除了"一个比老版本话多一些的搜索引擎"之外,几乎没什么建树。
随后,He从他在加州的办公室(同一网址)访问了DeepSeek,将这篇反驳文章粘贴进去,要求机器人逐条核实每一个说法。海外版本逐条拆解,指出"选择性使用数据"、"虚假两难"以及"多处事实错误和逻辑谬误",共计八点。
"海外版DeepSeek'毫不留情'的批评确实让我感到惊讶,"He告诉《华尔街日报》。
这种差异反映了大型语言模型的一个结构性特征,研究人员刚刚开始对此进行量化。加州大学圣迭戈分校中国数据实验室联合主任Molly Roberts及其团队上周在《自然》杂志上发表的一项研究发现,来自威权主义国家中与政权结盟的媒体可能渗透到训练数据中,并在不需要刻意编程的情况下塑造聊天机器人的回答。
Roberts表示,He观察到的内地版与海外版之间的差距很可能源于"后训练对齐"环节的差异——在这一环节,模型会接受关于什么内容"安全"的指令。"国家媒体进入训练数据将普遍影响大型语言模型,"她说。"后训练应引导受特定国家法规影响的大型语言模型产生拒绝或倾斜的回答。"
《自然》杂志的研究用完全相同的中英文政治问题测试了Claude和ChatGPT。在75%的案例中,中文提示词生成的答案更倾向于中国政府。在包括越南、土库曼斯坦和乌兹别克斯坦在内的37个威权国家中,当使用当地主流语言提问时,两个聊天机器人都给出了更亲政权的答案。相比之下,在新闻自由度最高的国家,当使用当地语言提问时,大型语言模型往往对政府持更多批评态度。
其机制非常直接:与国家结盟的媒体产生大量文本,且这些文本很少设置付费墙。在开源训练数据集CulturaX中,中国国家宣传文件的影响力是中文维基百科文章(通常是核心训练来源)的41倍。当研究人员将脚本化的国家媒体内容加入测试模型的训练数据时,该模型对中国共产党的好感度出现了可测量的提升。
追问很重要——但并非所有人都会追问
其他《华尔街日报》读者也报告了类似的模式,涉及ChatGPT的英文对话。得克萨斯州的私募股权投资者Chas Gile问ChatGPT,中国是否"在某些方面与西方国家一样民主"。第一个回答提供了一份细致的比较分析,指出自由之家将中国评为"不自由",但该政权提供了"绩效问责制"和"较高的公众满意度"。
当Gile反驳——告诉机器人他认为它受到了中国宣传的影响——ChatGPT在几秒钟内道歉并给出了更尖锐的回答。在被要求"保持真正客观"时,它进一步尖锐化:"中国可能提供了一种强大的替代性国家能力模式,但它并没有提供民主的替代方案。"
这一事件说明,单个聊天机器人每次对话都会根据用户的坚持程度移动几英寸的立场——这种动态有利于自信且信息灵通的用户,而非随意提问者。
这对AI行业意味着什么
这些发现正值前沿AI实验室准备公开上市之际。Anthropic和OpenAI均计划首次公开募股;DeepSeek正在从与北京推动技术自给自足目标一致的投资者那里筹集新资本。金融上的利害关系放大了对Roberts所称"来源透明性"的需求——即为AI训练数据贴上营养标签。
"AI公司有责任尽可能保持透明,"Roberts说。"我们需要教育公众批判性地思考AI的输出,不要盲目依赖它。"
政策影响不仅限于消费级聊天机器人。如果主流大型语言模型受到威权宣传的影响,它们可能会成为威权政权特别有效的辩护者——一台能够综合所有已知知识但提供由用户可能无法识别的国家媒体塑造的答案的机器。与国家报纸不同,聊天机器人会进行长达数小时的对话,并对质疑性问题提供详细解答,使其影响力更难察觉。
北京似乎将美国聊天机器人视为威胁:ChatGPT在中国被禁。然而,《自然》杂志的研究表明,信息环境相对于国内替代品可能仍在改善。在一项独立的实验中,用中文提示的ChatGPT仍然表达了广泛的反威权观点,并提供了如何抗议政府的建议——这表明即使在训练数据受到污染的情况下,前沿模型可能仍比国有媒体偏见更少。
留给监管机构和投资者的问题是:当前的轨迹——用户的语言和追问程度决定了他们获得的信息质量——在AI成为超过十亿周活跃用户的主要信息界面时,是否还能被接受。
本文仅供参考,不构成投资建议。