速度与准确性的权衡:苹果新语音转录 API 对比测

2025-07-04 09:39:30

  科技媒体 9to5Mac 昨日发布博文,对比测试了苹果系统的全新转录 API,认为该 API 在速度上优于 OpenAI 的 Whisper 模型,但在准确性上仍有一定差距。

  注:该媒体使用一段 9to5Mac Daily 的播客音频测试,长度为 7 分 31 秒,对比了苹果的新转录 API、OpenAI 的 Whisper Large v3 Turbo和英伟达的 Parakeet v2 模型。

  测试平台为 M2 Pro 芯片的 MacBook Pro 笔记本,配备了 16GB 内存,使用 Metric: cer 和 Metric: wer 两款 Hugging Face Spaces 来分析实际的字符错误率和单词错误率。

  结果显示,Parakeet v2 的转录时间最短,仅为 2 秒,但 CER 和 WER 较高;Whisper Large V3 Turbo 的准确性最高,但转录时间长达 40 秒;苹果的模型在速度上接近 Parakeet,但准确性优于后者。

  模型转录时间该媒体还使用了 ChatGPT、Claude 和 Gemini为基线来计算 CER 和 WER。结果显示,每个模型的性能都有所不同,但 Whisper 在准确性上仍领先。

  ChatGPT

  模型Claude

  Gemini

下一篇:《消逝的光芒》开发商取消新IP项目
上一篇:2026 款吉利 ICON 巧克力 SUV 预售,9.08 万元起
返回顶部小火箭