训练AI？Google外包人员承认：自己很多都不懂 怎么评估

【希望之声2023年4月29日】（本台记者谢伯壶综合报导）随著 AI 聊天机器人竞争越来越激烈，科技龙头谷歌也推出了聊天机器人 Bard，而为了能够让答案更正确，除了自家员工外，还委托承包商前来测试评估，只是过程中，也被爆出训练盲点。

综合媒体报导，在 OpenAI 的聊天机器人 ChatGPT 大受欢迎，尤其是微软（Microsoft）将 ChatGPT 与自家的搜寻引擎 Bing 结合后，也逐渐变得强势起来，开始瓜分谷歌（Google）的版图。身为科技龙头的谷歌，自然不甘寂寞马上跟进，在3月推出类似的聊天机器人 Bard。

除了自家员工进行内部测试外，谷歌也请跨国 AI 训练资料服务公司 Appen 协助改进 Bard。不过有 4 名外包人员在接受采访时表示，从 1 月以来，他们在评估过程中，对聊天机器人的表现感到失望，加上没有足够的时间评估聊天机器人的回应正确与否，有时只能猜测。

例如这些外包人员被要求必须在一定时间内完成任务，时间则从 1 分钟到几分钟不等。但如果是他们不熟悉的话题，例如像区块链这类的复杂技术，就无法针对 AI 的回应评分。

一位评估人员提到，在短短 60 秒内，根本没有足够时间去了解陌生的领域，所以只能尽力猜测，以便继续工作和领取报酬。

另一位评估人员的观点也很类似，他希望能够尽量纠正聊天机器人的错误，但评估时根本没有足够的时间去进一步研究话题内容。他也承认，很多外包人员都快要崩溃了！

之前谷歌在今年 2 月 6 日时，就在自家首推广告中向大众介绍 Bard。影片里，当 Bard 被问到「我要怎么告诉我 9 岁小孩，韦伯太空望远镜（James Webb Space Telescope）新发现了什么？」时，Bard 列出许多答案，其中包括由韦伯望远镜拍下的首张太阳系外行星照片。

但这个答案并不正确，因为首张太阳系外行星照片，是由欧洲南方天文台（European Southern Observatory）的「极大望远镜」（Very Large Telescope）在 2004 年拍摄，并经美国国家航空暨太空总署（NASA）证实。

Bard 犯的这个错误，刚好在巴黎发表会前几小时被发现了。而这个失误，也导致母公司股价暴跌，市值瞬间蒸发逾 1000 亿美元。

责任编辑：林莉

本文章或节目经希望之声编辑制作，转载请注明希望之声并包含原文标题及链接。

训练AI？Google外包人员承认：自己很多都不懂怎么评估