导航菜单

微软宣布Azure AI语音服务中的文本转语音虚拟形象全面上市

导读 Azure AI Speech 服务允许开发人员构建支持语音、多语言、生成式 AI 应用,并支持自然声音。Azure AI Speech 服务中新的文本转语音...

Azure AI Speech 服务允许开发人员构建支持语音、多语言、生成式 AI 应用,并支持自然声音。Azure AI Speech 服务中新的“文本转语音头像”功能可以将简单的文本转换为具有自然声音的逼真人类说话视频。开发人员可以使用此服务中提供的任何预建头像,也可以创建自己的自定义头像。

今天,微软宣布全面推出 Text to Speech Avatar。这项新功能使开发人员能够为用户创建个性化且引人入胜的内容。该服务的输出视频分辨率为 1920 x 1080,每秒 25 帧 (FPS)。

Azure Speech 文本转语音头像具有以下功能:

将文本转换为逼真的人声数字视频,并通过 Azure AI 文本转语音技术发出自然声音。

提供一组预建的头像。

头像的声音由 Azure AI 文本转语音生成。

使用批量合成 API 异步或实时地将文本合成为语音头像视频。

在 Speech Studio 中提供内容创建工具,无需编码即可创建视频内容。

通过语音工作室中的实时聊天头像工具实现实时头像对话。

文本转语音头像服务的定价有点复杂。正如预期的那样,费用将基于视频输出的长度,并按秒计费。此外,文本转语音、语音转文本、Azure OpenAI 或作为文本转语音头像服务解决方案一部分使用的其他 Azure 服务将单独收费。此外,此服务现已在以下 Azure 区域推出:东南亚、北欧、西欧、瑞典中部、美国中南部和美国西部 2。

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢:

最新文章: