阿里云通义千问开源语音基座模型,识别效果优
阿里云通义千问开源了两款语音基座模型 SenseVoice和 CosyVoice。
SenseVoice 专注于
与开源情感识别模型进行对比,SenseVoice-Large 模型可以CosyVoice 模型同样支持多语言、音色和情感控制,该模型在多语言语音、零样本语音生成、跨语言语音克隆和指令跟随等功能方面表现出色。
附相关链接:
SenseVoice:
CosyVoice:
阿里云通义千问开源了两款语音基座模型 SenseVoice和 CosyVoice。
SenseVoice 专注于
与开源情感识别模型进行对比,SenseVoice-Large 模型可以CosyVoice 模型同样支持多语言、音色和情感控制,该模型在多语言语音、零样本语音生成、跨语言语音克隆和指令跟随等功能方面表现出色。
附相关链接:
SenseVoice:
CosyVoice: