小互: Hume AI 推出全能文本与语音引擎 OCTAVE
OCTAVE能够从简单的文本描述或5秒语音录音中生成或者克隆逼真的语音和人格特质。
包括性别、年龄、口音、情绪语调及职业特定说话风格等。
能在毫秒级别完成语音生成,实现真正的实时对话,还允许实时动态调整生成内容。
OCTAVE结合了EVI 2模型以及 OpenAI 的语音引擎、Elevenlab 的 TTS 语音设计和 Google Deepmind 的 NotebookLM 等系统的能力。
支持多个虚拟角色的语音生成,角色之间的语音风格、情绪和口音可以完全不同,可以生成完整的播客内容。
----------------------
Tue Dec 24 2024 11:06:44 GMT+0800 (China Standard Time)
via Twitter @小互
OCTAVE能够从简单的文本描述或5秒语音录音中生成或者克隆逼真的语音和人格特质。
包括性别、年龄、口音、情绪语调及职业特定说话风格等。
能在毫秒级别完成语音生成,实现真正的实时对话,还允许实时动态调整生成内容。
OCTAVE结合了EVI 2模型以及 OpenAI 的语音引擎、Elevenlab 的 TTS 语音设计和 Google Deepmind 的 NotebookLM 等系统的能力。
支持多个虚拟角色的语音生成,角色之间的语音风格、情绪和口音可以完全不同,可以生成完整的播客内容。
----------------------
Tue Dec 24 2024 11:06:44 GMT+0800 (China Standard Time)
via Twitter @小互