小互: Hume AI 推出全能文本与语音引擎 OCTAVE

OCTAVE能够从简单的文本描述或5秒语音录音中生成或者克隆逼真的语音和人格特质。

包括性别、年龄、口音、情绪语调及职业特定说话风格等。

能在毫秒级别完成语音生成,实现真正的实时对话,还允许实时动态调整生成内容。

OCTAVE结合了EVI 2模型以及 OpenAI 的语音引擎、Elevenlab 的 TTS 语音设计和 Google Deepmind 的 NotebookLM 等系统的能力。

支持多个虚拟角色的语音生成,角色之间的语音风格、情绪和口音可以完全不同,可以生成完整的播客内容。

----------------------
Tue Dec 24 2024 11:06:44 GMT+0800 (China Standard Time)

via Twitter @小互
 
 
Back to Top