综合媒体报导,在 OpenAI 的聊天机器人 ChatGPT 大受欢迎,尤其是微软(Microsoft)将 ChatGPT 与自家的搜寻引擎 Bing 结合后,也逐渐变得强势起来,开始瓜分谷歌(Google)的版图。身为科技龙头的谷歌,自然不甘寂寞马上跟进,在3月推出类似的聊天机器人 Bard。
除了自家员工进行内部测试外,谷歌也请跨国 AI 训练资料服务公司 Appen 协助改进 Bard。不过有 4 名外包人员在接受采访时表示,从 1 月以来,他们在评估过程中,对聊天机器人的表现感到失望,加上没有足够的时间评估聊天机器人的回应正确与否,有时只能猜测。
例如这些外包人员被要求必须在一定时间内完成任务,时间则从 1 分钟到几分钟不等。但如果是他们不熟悉的话题,例如像区块链这类的复杂技术,就无法针对 AI 的回应评分。
一位评估人员提到,在短短 60 秒内,根本没有足够时间去了解陌生的领域,所以只能尽力猜测,以便继续工作和领取报酬。
另一位评估人员的观点也很类似,他希望能够尽量纠正聊天机器人的错误,但评估时根本没有足够的时间去进一步研究话题内容。他也承认,很多外包人员都快要崩溃了!
之前谷歌在今年 2 月 6 日时,就在自家首推广告中向大众介绍 Bard。影片里,当 Bard 被问到「我要怎么告诉我 9 岁小孩,韦伯太空望远镜(James Webb Space Telescope)新发现了什么?」时,Bard 列出许多答案,其中包括由韦伯望远镜拍下的首张太阳系外行星照片。
但这个答案并不正确,因为首张太阳系外行星照片,是由欧洲南方天文台(European Southern Observatory)的「极大望远镜」(Very Large Telescope)在 2004 年拍摄,并经美国国家航空暨太空总署(NASA)证实。
Bard 犯的这个错误,刚好在巴黎发表会前几小时被发现了。而这个失误,也导致母公司股价暴跌,市值瞬间蒸发逾 1000 亿美元。