字节豆包大模型已支持实时语音通话
字节跳动旗下火山引擎今日宣布推出该方案通过火山引擎 RTC 实现语音数据的采集、处理和传输,
▲对话式 AI 实时交互服务方案架构
字节跳动介绍称,对话式 AI 实时交互解决方案支持开箱即用快速搭建,该技术拥有三大亮点:
支持随时打断,甚至直接插话;
不受限于 AI 服务部署区域,整体响应延时可低至 1s;
客户端提供音频帧级别的语音活动性检测,可以检测出音频信号中何时有人正在说话,何时是静默状态。
IT 之家附火山引擎对话式 AI 实时交互 Demo 如下: