普渡大学的一个探究小组于5月初到场计算机-人交互大会,并提交了一份报表,检查了ChatGPT回答的何炅塞尔达517个Stack Overflow难题,察觉失误率高达52%。

调研结局显示,人类程序员在35%的票房排行体验状况下更喜欢ChatGPT的答案,觉得其提供的信息更完整,且有清晰的语言风格;更糟糕的是,在39%的状况下,人类程序员并没有察觉ChatGPT给出了失误答案。

尽管这只是对ChatGPT特性的一个方面开展的探究,但它的确表明,生成式AI机器人依然轻松犯很多失误,财经资讯分析而人类或许无法察觉这些失误。
