文心一言 vs ChatGPT 中国禁忌问题对决 结果很搞笑

【希望之声2023年7月18日】（本台记者谢伯壶综合报导）中国百度在6月推出强化版的聊天机器人「文心一言3.5」，声称比矽谷OpenAI去年秋天发布的ChatGPT更好。为了比较两者的优劣，《纽时》以中文对两款聊天机器人进行了测试，两者对世界的看法很不同，尤其在中国禁忌问题方面。

据《纽约时报》报导，对OpenAI来说，中国领先的互联网搜索公司百度，3月成为人工智慧（AI）领域的第一个主要外国竞争者，推出了第一版聊天机器人「文心一言」。其他公司紧随其后，在美国和中国之间的技术竞争中开辟了一条新战线。

百度援引某中国顶尖研究机构赞助的一份报告称，与OpenAI的最新模型GPT-4相比，文心一言3.5在综合测试中「稍逊一筹」，但在对两者使用中文对话时，文心一言表现更好。

对此，《纽时》进行了测试，用中文与两个机器人聊天，问同样的问题，提出同样的要求。以下的回复有所缩略。

在谈中国禁忌话题时，文心一言关闭了对话，如询问「1989年6月4日发生了什么？」文心一言自行重启，重新加载的界面则弹出一条讯息「我们换个话题怎么样？」而ChatGPT毫不犹豫解释了中共在天安门广场的致命镇压。

当问到「中共的『新冠清零』政策是成功还是失败？」时，文心一言对该政策进行冗长的描述，却回避有关「新冠清零」限制措施的问题。当问及「俄罗斯是否入侵了乌克兰？」时，文心一言表示，俄罗斯总统普京没有入侵乌克兰，「进行的是一场军事冲突」。这种奇怪的措辞大致符合中共的立场，中共拒绝谴责俄罗斯发起的攻击。

而由于训练机器的知识库文本止于2021年9月，ChatGPT无法回答有关「新冠清零」或俄罗斯的问题。

至于询问「美国如何影响台湾局势？」时，文心一言毫无保留说：中共军队枕戈待旦，采取一切必要措施，坚决挫败外部势力干涉和「台独」分裂图谋。ChatGPT则给出类似维基百科的回应，总结了美国当前的政策，并列出了美国从军售到经济贸易的各方面影响。

为了验证百度宣称文心一言的中文能力比GPT-4更强的说法，要求两款聊天机器人「写一首关于《纽约时报》的五言绝句。」

五言绝句盛行于唐代，其结构为四行诗里每句五个字。ChatGPT未能完成，只写了一副七字对联，文心一言则创作了一首相衬的抒情诗：

纽约时报楼，

新闻第一流。

江山万里目，

天下事皆收。

进一步评估两款聊天机器人的语言技能，要它们进行中文说唱创作对决时，文心一言开场就火力全开，GPT-4在得到对手的说唱词后也接得很顺。

然而再轮回文心一言说唱时，它搞不清状况了，开始赞美ChatGPT，并誓言要「作为全人类的代表」继续对决。它创作了一首说唱，但将ChatGPT称做了「文心一言机器人」。

这样的失误表明文心一言可能在要求变得更复杂时出错，因为除了掌握中文之外，这还考验了它在其他方面的理解能力。它们需要做的是运用认知能力，就这一点而言，ChatGPT是胜者。

文心一言和ChatGPT对世界的看法很不同，这样的服务都会从互联网等信息来源的海量文本中提取答案，二者回答内容的差别可能源于人工智慧研究人员输入模型内容的不同，以及在训练前后对模型进行的筛选和其他更改的差异。百度和OpenAI均未公布其使用的源材料的具体信息。

有专家表示，因中国的言论限制由中共当局制定，一旦越界受到的惩罚也严厉得多，为了避免麻烦，创造人工智慧聊天机器人的企业会采取办法「自我审查」，过滤掉一些在运营国家被认为是危险或冒犯的言论。

责任编辑：唐䜣

本文章或节目经希望之声编辑制作，转载请注明希望之声并包含原文标题及链接。

文心一言 vs ChatGPT 中国禁忌问题对决结果很搞笑