字节跳动发布一些列新的模型包括基于DIT的视频生成模型、音乐模型，同声传译模型等via XiaoHu.AI学院 (author: 小互) | ChatGPT / AI新闻聚合

16:38 · 2024年9月24日 · 周二

字节跳动发布一些列新的模型包括基于DIT的视频生成模型、音乐模型，同声传译模型等

via XiaoHu.AI学院 (author: 小互)

字节跳动发布一些列新的模型包括基于DIT的视频生成模型、音乐模型，同声传译模型等

基于DIT架构的视频生成模型豆包视频模型包括 PixelDance 模型和 Seaweed 模型两种。豆包视频生成模型能够实现复杂的多主体互动。这意味着多个视频中的人物可以在不同镜头中自然地完成复杂的互动动作，人物的样貌、服装和细节在不同镜头的切换下仍然保持一致，接近真实拍摄的效果。这种一致性得益于 DiT架构（融合计算单元）的应用，使得视频生成在动态和运镜之间可以灵活切换，支持多种镜头语言，如变焦、环绕、平摇、缩放、目标跟随等。精准的语义理解：模型能够理解复杂的用户指令（prompt），生成多…

免费GPT聊天

AI API中转2.8折起

Powered by BroadcastChannel & Sepia

oaibest.com 2023-2024 admin@g4f.icu | 服务状态