新研究:AI搜索工具平均准确率仅六成,且自信满
哥伦比亚大学数字新闻研究中心近期对八款 AI 引擎展开研究,包括 研究人员从 20 家新闻机构中测试结果显示,除 Perplexity 及其付费版外,其余 AI 引擎的表现都不尽如人意。整体来看,这项研究的重要性在于,它用数据印证了外界多年来的担忧 —— 即使承认了错误,ChatGPT 仍可能在后续回答中继续编造内容。在大语言模型的设定中,几乎是ChatGPT 并非表现最糟的。X 旗下的 Grok AI 表现尤为不堪,其中 Grok-3 Search 的这些 AI 工具的开发公司