OpenAI语音转录工具Whisper被曝重大缺陷:凭空生成
超过十位软件工程师、开发人员和学术研究人员称,OpenAI 的语音转写工具 Whisper 存在一个重大缺陷:有时会凭空生成这些专家指出,这些生成的文本可能涉及专家们认为,这一问题尤其令人担忧,因为 Whisper 已被广泛应用于全球多个行业,包括用于翻译和转录访谈内容、生成常见消费科技文本及制作字幕。
更具风险的是,尽管 OpenAI 报道称,研究人员和工程师在工作中经常遇到 Whisper 的“幻觉”现象,问题的整体规模尚不清楚。例如,密歇根大学一位研究员在研究公共会议时发现,在尝试改进模型前,他所检查的一位机器学习工程师透露,在最初分析的超过 100 小时 Whisper 转录中,他发现即便是音质良好的简短音频样本,也未能幸免于这些问题。计算机科学家们的最新研究表明,他们审查的 研究人员认为,这一趋势意味着,在数百万条录音中将可能出现数以万计的错误转录。
OpenAI 的发言人表示,该公司持续研究如何减少幻觉,并且感谢研究者的发现,将会在模型更新中采纳反馈。