新研究：AI搜索工具平均准确率仅六成，且自信满

2025-03-13 17:50:32

　　哥伦比亚大学数字新闻研究中心近期对八款 AI 引擎展开研究，包括研究人员从 20 家新闻机构中测试结果显示，除 Perplexity 及其付费版外，其余 AI 引擎的表现都不尽如人意。整体来看，这项研究的重要性在于，它用数据印证了外界多年来的担忧 —— 即使承认了错误，ChatGPT 仍可能在后续回答中继续编造内容。在大语言模型的设定中，几乎是ChatGPT 并非表现最糟的。X 旗下的 Grok AI 表现尤为不堪，其中 Grok-3 Search 的这些 AI 工具的开发公司