写点什么

豆包大模型发布视频生成模型,语义理解精准、画质高保真

作者:新消费日报
  • 2024-09-26
    云南
  • 本文字数:959 字

    阅读完需:约 3 分钟

1727340078712404.png


火山引擎总裁 谭待

“截至到 9 月,豆包大模型的日均 tokens 使用量已经超过 1.3 万亿,4 个月的时间里 tokens 整体增长超过了 10 倍。在多模态方面,豆包·文生图模型日均生成图片 5,000 万张,此外,豆包目前日均处理语音 85 万小时。”火山引擎总裁谭待表示。

9 月 24 日,2024 火山引擎 AI 创新巡展在深圳举办,带来豆包大模型最新进展。豆包大模型家族迎来新成员,全新发布豆包·视频生成模型以及豆包·音乐模型、豆包·同声传译模型。豆包通用模型 pro 和文生图模型、语音合成模型等垂类模型大幅升级,不断增加的各类模态以及规模化的调用量,让豆包大模型“更强模型、更低价格、更易落地”的优势持续凸显。其中,主力模型“豆包通用模型 pro”最新版本在各维度上国内领先,模型效果持续增强。


1727340224515033.png


1727340242171714.png


火山引擎正式发布豆包·视频生成模型

全面加速 AIGC 应用创新


精准的语义理解

多动作多主体交互

豆包·视频生成模型能遵从复杂 prompt,解锁时序性多拍动作指令与多个主体间的交互能力。


强大动态与酷炫运镜

告别 PPT 动画

可以让视频在主体的大动态与镜头中炫酷切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力,灵活控制视角,带来真实世界的体验。

一致性多镜头生成

10 秒讲一个完整故事

成功攻克多镜头切换时一致性的技术挑战,在一个 prompt 内实现多个镜头切换,同时保持主体、风格、氛围的一致性。

高保真高美感

多风格多比例

支持包括黑白、3D 动画、2D 动画、国画等多种风格,包含 1:1、3:4、4:3、16:9、9:16、21:9 六个比例,适配于各种终端,以及电影、手机竖屏等不同画幅。


1727340571678922.png


强大画面效果的背后,是字节跳动在视频大模型技术研发的不断投入。


1727341629465427.png


1727341645333142.png


视频生成能力,为众多企业场景带来创新。例如在电商营销场景,豆包·视频生成模型不仅快速把商品变成 3D 动态多角度展示,还能配合中秋、七夕、春节等节点替换背景和风格,生成不同尺寸快速上架;在动画教育场景,豆包·视频生成模型可以大幅降低动画的制作成本,生动的呈现童话故事情节。

此外,还有城市文旅、音乐 MV、微电影、短剧等应用场景,都可以通过豆包·视频生成模型实现降本提效和创意合规。


1727341692472520.png


1727341759744170.png


1727341810444590.png


豆包大模型家族成员更加丰富,模型能力持续升级,为大模型在多模态、多元化方面的落地应用打下了良好的基础。火山引擎将继续推进模型能力的不断升级与迭代,探索模型能力在更多场合的应用,持续为企业借助大模型实现云上智能化注入动力。

用户头像

还未添加个人签名 2022-09-22 加入

还未添加个人简介

评论

发布
暂无评论
豆包大模型发布视频生成模型,语义理解精准、画质高保真_新消费日报_InfoQ写作社区