百度绘想是百度商业研发团队推出的一款基于 MuseSteamer 大模型驱动的 AI 视频创作平台,2025 年 7 月 2 日,在百度 AI Day 开放日上正式推出,也是目前全网唯一一个可完全免费使用的高质量AI视频创作工具,下面字节律动为大家简单介绍一下:
基本介绍
-
- 核心技术
其核心是 MuseSteamer 视频生成模型,该模型采用 DIT 架构,在权威榜单 VBench I2V 中以 89.38% 的总分登顶全球第一。它基于亿级中文多模态数据训练,结合精细化视频结构化描述语言及多目标强化学习等技术,能实现中文音视频一体化生成,解决了中文语境下的多模态语义对齐问题。
-
- 功能特点
- 图生视频
:仅需上传 1 张图片,即可生成专业级视频,能帮助用户激发更多视频创意。
- 音画同步
:可一键生成画面、音效、人声台词高度协同的视频内容,打破传统 “先画面后配音” 的割裂流程。
- 画质出色
:支持生成连续 10 秒的动态视频,最高可生成分辨率为 1080P 的高清视频,画质达到电影级标准,人物微表情与运镜效果媲美专业影视团队。
- 生成速度快
:不同版本生成速度有所差异,其中 Lite 版生成速度超快,仅需 30 秒。
-
- 模型版本
- Turbo 版
:已上线绘想平台开启限时免费公测,分辨率为 720p,擅长生成人物、动漫,人物动作一致性优秀,运动幅度大,表情表现好,适合大部分创作者。
- Lite 版
:720p 分辨率,生成速度快,价格具有竞争力,适合追求极致性价比的用户。
- Pro 版
:分辨率为 1080p,具备电影级画质及运镜,能极大提升表现力,适合专业创作者、影视生产机构。
- 有声版
:各清晰度均支持一体化生成音效及台词,还支持粤语、川语等 8 种方言的即时生成,适合对同期声和画面有极致追求的用户,以及用于区域化营销内容制作等场景。
-
- 应用场景
:最初是为满足短剧投放要求而研发,主要用于解决传统富媒体广告素材制作高门槛、高成本的痛点,可生成面向广告创意的视频片段,支持搜索广告推广场景的内容生产需求。同时,也适用于动画制作、二次创作等多种场景。
- 相关活动
:平台启动了 “跨次元捏合” AI 视频创作大赛,用户通过单图输入可生成动态捏捏乐视频进行参赛,比赛于 7 月 2 日启动报名,8 月 4 日评审,8 月 14 日公布获奖名单,设置有万元大奖。
下面字节律动为大家分享一下最新版本的ai视频生成工具百度绘想的使用方法,其实它的使用超级简单:
第一步:打开浏览器输入百度绘想AI视频生成工具的官方网站;
第二步:点击视频生成或者在灵感专区找到喜欢的视频一键同款;
第三步:上传自己的参考图片或者用系统提供的都可以,输入想让视频展示的内容和镜头运动方式,最后点击【开始生成】按钮即可等待生成,目前百度绘想AI的用户量还不多,生成速度非常快,基本上1-3分钟内即可搞定,而且提示词的遵循性非常理想,如下图所示:
以下是字节律动通过百度绘想AI视频生成工具制作的创意视频,是不是相当哇塞,目前最多只支持5秒钟,后续会陆续开放生成时常以及数字人功能,大家敬请期待吧。
就有好多AI生成走路视频,会顺拐。这个很稳,走的很真实!+1分!
财神送福:元宝是送出来了,但不是递出来是扔出来的。但效果也还不错可以接受。双人飞仙:指令遵循性很好,人物形象保持的也非常棒,没有出现面部扭曲崩坏等情况。+1分。
第一张这个多人的效果,着实惊艳到了!这么多小朋友,还有拿扫把的大爷、推自行车的叔叔、远处的车,全都非常清晰稳定,没有丝毫模糊和扭曲!小朋友跳格子这个不是特别理想,因为最后跳出了格子的范围。现在还没有AI能把这么古老的游戏,生成完美的,百度这个人物稳定性、蹦蹦跳跳的感觉,已经算表现很棒的了。
第一个美女吹笛子时的手部动作、面部表情都很到位。第二个美女与鲸鱼在海底漂浮的这个感觉也超真实。
虽然360度环绕运镜失败了,但快速拉进运镜、多镜头组合效果都超赞。
上面这些全都是一次抽卡,非常稳!禾刀还是很意外的,没想到效果这么理想。于是翻出来几个之前总是做不好的场景,试试百度这个新模型是不是能解决。
吉卜力吼吼,师傅打悟空头顶3下,试了各个工具,效果都不理想,最后选了个软趴趴的片段,还有人给我留言,说这个打头打的没力气,哈哈哈。来看看百度打头有没有力气?
这个打头还有点小心机啊,自动配上了一点特效,看着打的还挺重。但是不听话,打了不止3下完成度不错,截取打三下的那一小段是能用的。
这个是之前看到有个视频博主说,所有AI都捏不死蚊子,当时用即梦试过确实捏不死。
还有个没想到的失败例子,百度这个AI竟然打不好鸡蛋
>猫妈妈轻轻拿起一枚鸡蛋,将鸡蛋在碗沿一磕,双手一掰,蛋黄蛋清流入碗中