🆔 项目名称:VITA

⭐️ 项目功能:开源版视频+语音模型

📁 项目简介:一个开源的多模态大语言模型,旨在实现实时的视觉和语音交互。

能够同时处理视频、图像、文本和音频数据,通过减少交互延迟、增强语音处理能力和改进多模态理解,达到了接近GPT-4o的水平。

🌐 项目地址:点击打开
📢 频道 ✈️ 群聊 📬 投稿 💵 商务

via AI绘画|AI视频 | AI音乐 - Telegram Channel
 
 
Back to Top