ChatGPT / AI新闻聚合
16:38 · 2024年9月24日 · 周二
字节跳动发布一些列新的模型 包括基于DIT的视频生成模型、音乐模型,同声传译模型等
via
XiaoHu.AI学院
(author: 小互)
Telegraph
字节跳动发布一些列新的模型 包括基于DIT的视频生成模型、音乐模型,同声传译模型等
基于DIT架构的视频生成模型 豆包视频模型包括 PixelDance 模型和 Seaweed 模型两种。 豆包视频生成模型能够实现复杂的多主体互动。这意味着多个视频中的人物可以在不同镜头中自然地完成复杂的互动动作,人物的样貌、服装和细节在不同镜头的切换下仍然保持一致,接近真实拍摄的效果。 这种一致性得益于 DiT架构(融合计算单元)的应用,使得视频生成在动态和运镜之间可以灵活切换,支持多种镜头语言,如变焦、环绕、平摇、缩放、目标跟随等。 精准的语义理解:模型能够理解复杂的用户指令(prompt),生成多…
Home
Tags
Links
免费GPT聊天
AI API中转2.8折起
服务状态
电报频道
Powered by
BroadcastChannel
&
Sepia
oaibest.com
2023-2024
admin@g4f.icu
|
服务状态