Grok Imagine 1.5 AI 视频生成器
上传一张图,让产品、角色和广告创意立刻动起来。用 Grok Imagine 1.5 快速生成有镜头感的 AI 短视频。
深受探索快速 AI 视频方向的创作者信赖
拖放或点击上传(JPEG、PNG、WebP,最大 10MB)
暂无结果
点击上方的生成按钮开始
什么是 Grok Imagine 1.5?
Grok Imagine 1.5 是一个图片生成视频 AI 生成器,可把一张参考图转换成 1-15 秒短视频,并支持 480p / 720p、8 种画幅和可选提示词控制。它适合产品动效、人像短片、角色动画、广告样片和分镜预览。
从参考图开始,生成更稳定的短视频
Grok Imagine 1.5 更适合从一张已经确定的图片出发。你可以上传产品图、人物照、角色设定图、海报草稿或品牌视觉,让模型在保留主体的基础上补充动作、镜头和环境变化。相比完全开放的文生视频,参考图能减少跑偏,让画面身份、构图和风格更容易保持一致。
如果你正在做广告预览、社媒短片、角色动态、产品动效或分镜草稿,1.5 的价值在于快速把静态素材推到视频形态。你不需要一开始就写很长的提示词,先用清晰图片确定主体,再用一句具体描述控制运动:比如镜头缓慢推进、产品轻微旋转、背景灯光闪烁、人物回头微笑。
使用 Grok Imagine 1.5 时,建议先把参考图准备清楚,再决定时长、画幅和分辨率。短片可以从 1-3 秒开始低成本测试,确认主体动作和镜头节奏后,再拉长到 8 秒或更长版本,用于更接近发布的预览。
Grok Imagine 1.5 更适合参考图驱动的视频
Grok Imagine 1.5 的核心不是“随便写一句话”,而是让已有图片自然动起来。你控制参考图、时长、比例和分辨率,模型负责把静态画面扩展成有节奏的短视频。
参考图锁定主体
先上传图片,再让模型扩展动作。适合人物肖像、产品图、角色设定、场景气氛图和广告视觉稿,因为主体身份、构图和风格已经由图片提供。
提示词负责运动和镜头
prompt 可选,但强烈建议填写。你可以描述主体动作、镜头推进、转场节奏、光线变化、环境细节和声音氛围,让结果更接近创作意图。
短视频参数更细
1-15 秒连续时长比离散档位更适合做社媒素材、广告预览和分镜测试。默认 8 秒适合多数预览,但也可以用 1-3 秒做低成本探索。
上传策略更稳
上传图片保持 10MB 上限,适合常见产品图、人物照和角色图。较轻的文件更容易上传成功,也能减少等待和重试。
Grok Imagine Video 1.5 Preview 登上 Image-to-Video Arena 第 1
排行榜截图显示,Grok Imagine Video 1.5 Preview (720p) 在 Image-to-Video Arena 榜单中位列第 1,Arena score 为 1,473。这个信号适合放在落地页中解释为什么 1.5 值得单独做入口:它不是只多一个模型名,而是在图生视频质量、稳定性和短片可用性上有更强的用户感知。

从素材到可用短片的工作流
好的图片生成视频不是只看模型能力,还取决于输入素材是否清楚、提示词是否具体、输出参数是否匹配用途。下面这套流程适合多数用户快速得到可评估的结果。
准备清晰参考图
优先选择主体明确、边缘干净、光线稳定、没有过度遮挡的图片。产品图可以保留背景环境,人物图要避免手部和脸部被裁切太多。
写运动而不是堆形容词
描述“镜头缓慢推进、头发被风吹动、背景灯光轻微闪烁”通常比单纯写“电影感、超真实、高质量”更有效,因为模型需要知道时间维度里发生什么。
先低成本探索
第一次可以用 480p 和较短时长测试方向。确认动作、构图和节奏可用后,再把分辨率或时长提高,用于更接近发布的版本。
用历史记录复盘
历史记录会标出使用过的模型,方便你比较旧 Grok、Veo、Nano Banana 和 Grok Imagine 1.5 的效果差异。
四种适合 Grok Imagine 1.5 的视频方向
Grok Imagine 1.5 的价值不只在单个效果图,而在于它能把不同类型的参考图推成可评估的短片方向。下面这些案例覆盖动作场景、自然光人像、近景表情和故事板动画,更适合帮助用户理解上传参考图后可以得到什么类型的动态结果。
城市冒险动作
高空、运动和环境纵深,适合展示镜头运动与动作节奏。
自然光人像
人物表情、头发和微动作,更适合测试角色短片和社媒素材。
近景表情细节
脸部稳定、眼神和口型变化,适合说明参考图对身份一致性的帮助。
故事板动画
把分镜风格图变成动态片段,适合脚本、短剧和概念预演。
提示词可以这样组织
Grok Imagine 1.5 的 prompt 最大 4096 字符,但大多数情况下不需要写得很长。更好的方式是把提示词拆成几个清晰部分:主体要做什么、镜头怎么动、环境如何变化、声音或氛围是什么、哪些内容要保持稳定。
主体动作
让人物转头、产品旋转、衣料摆动、光影扫过表面。
镜头语言
使用推进、拉远、轻微环绕、手持感或稳定横移等描述。
环境变化
补充背景灯光、烟雾、雨水、街景、人群或景深变化。
声音氛围
如果需要,可写低沉环境声、轻微风声、城市噪声或安静电影感。
保持稳定
明确主体身份、脸部、logo、产品形状、服装和构图不要大幅改变。
模型参数
Grok Imagine 1.5 使用图片生成视频流程,需要参考图。它不使用旧 Grok 的 Fun / Normal / Spicy mode,时长和分辨率按 1.5 模型规格单独控制。
哪些用户最适合使用 Grok Imagine 1.5?
如果你的工作从一张确定的图开始,而不是从一段完全开放的文字开始,1.5 会更容易发挥价值。它适合快速验证方向,也适合在正式拍摄、3D 制作或剪辑前生成视觉草稿。
产品动效
把电商图、包装图或概念图转成带镜头运动的短视频,用于广告预览和详情页素材探索。
角色短片
从角色设定图、头像或风格图生成社媒片段,测试人物动作、表情和镜头节奏。
广告样片
快速比较不同灯光、运动方式和视频比例,让创意团队在正式制作前先统一方向。
内容分镜
为脚本、短剧、音乐视频或活动预热视频生成连续视觉草稿,帮助沟通画面想象。
品牌视觉
保持品牌色、产品形状和构图风格,同时加入轻微动态,让静态资产更适合视频渠道。
社媒测试
用 1-3 秒短片测试平台点击感,再把有效方向扩展成更长版本。
常见问题
Grok Imagine 1.5 是文字生成视频吗?
它走图片生成视频流程,需要上传参考图。prompt 可以不写,但如果想控制动作、镜头和声音氛围,建议写得具体一些。
为什么没有 Fun / Normal / Spicy?
这些是旧 Grok Imagine 视频模式。Grok Imagine 1.5 不使用 mode 参数,所以选择 Grok Imagine 1.5 后不会展示这些选项,避免误以为它们仍然影响输出。
默认时长为什么是 8 秒?
Grok Imagine 1.5 的默认生成时长是 8 秒。表单保留这个默认值,同时允许你在 1-15 秒之间连续选择。
为什么上传限制是 10MB?
10MB 对多数产品图、人物照和角色图已经足够,也更利于上传稳定性、等待时间和失败重试控制。建议优先上传清晰、主体明确、文件不过大的图片。
生成失败会退积分吗?
上传失败和任务创建失败会走现有退款逻辑。如果生成过程中失败,系统会根据任务状态处理结果,你也可以在历史记录里复查。
历史记录能区分 1.5 和旧 Grok 吗?
可以。历史标签会区分 Grok Imagine、Grok Imagine 1.5、Veo 和 Nano Banana,方便你回看不同模型生成的结果。
需要更多 Grok Imagine 1.5 积分?
价格
选择最适合您的付费计划
入门版
按年付 $143.3
适合刚开始使用 AI 生成的用户
- 每月 1,000 积分
- 最多 200 张图片或 50 个视频
- 文本转图像生成
- 文本转视频生成
- 图像转视频转换
- $0.06/image, $0.24~$1.02/video (6-30s)
专业版
按年付 $287.3
创作者的最佳性价比之选
- 每月 2,400 积分
- 最多 480 张图片或 120 个视频
- 文本转图像生成
- 文本转视频生成
- 图像转视频转换
- $0.05/image, $0.2~$0.85/video (6-30s)
工作室版
按年付 $575.3
为专业用户和重度使用者打造
- 每月 6,000 积分
- 最多 1,200 张图片或 300 个视频
- 文本转图像生成
- 文本转视频生成
- 图像转视频转换
- $0.04/image, $0.16~$0.68/video (6-30s)