Grok Imagine Video 1.5 Preview

Grok Imagine 1.5 AI 视频生成器

上传一张图，让产品、角色和广告创意立刻动起来。用 Grok Imagine 1.5 快速生成有镜头感的 AI 短视频。

深受探索快速 AI 视频方向的创作者信赖

选择需要的视频模型

选择模式

Reference Image 1 as identity lock. Create a gritty, ultrarealistic live-action 16:9 film montage, 9 shots, 0.2 seconds each, shot on Arri Alexa with 35mm anamorphic lenses. Use the exact same real photographed woman in every shot (mid-20s, focused eyes, short asymmetrical hair, identical face, body and silhouette throughout). Real skin texture, natural imperfections, realistic hair movement. No CGI, no AI look, no clones, no doubles, no morphing, no face changes. Practical stunts and practical effects only. Each shot is a different movie genre with different locations, costumes, lighting and framing, but always the same actress. Action highway chase in a sports car: "Let's go!" Documentary thriller pushing through a rainy protest crowd: "Keep filming." Romantic thriller close-up in blue emergency light: "Trust me." Spy film ballroom dance stealing a keycard: "Got it!" Sports drama sprinting onto a stadium field: "We're going all the way!" Horror film backing through a flashlight-lit farmhouse hallway: "Creepy." Biopic music performance singing into a microphone: "Baby, I'm yours!" Love film under fireworks reassuring a male guitarist: "Happy Fourth!" Adventure film on a city observation deck, wind in her hair: "I'm ready for my next role!" One continuous fast heroic montage score, hard cuts only, every shot looking like a different real movie while clearly featuring the exact same actress.

案例提示词

选择输出比例

选择视频风格

时长

分辨率

暂无结果

点击上方的生成按钮开始

什么是 Grok Imagine 1.5？

Grok Imagine 1.5 是一个图片生成视频 AI 生成器，可把一张参考图转换成 1-15 秒短视频，并支持 480p / 720p、8 种画幅和可选提示词控制。它适合产品动效、人像短片、角色动画、广告样片和分镜预览。

一张参考图即可开始生成视频。

支持短视频时长设置，适合快速方向测试。

Grok Imagine Video 1.5 Preview 在 Image-to-Video Arena 排名第 1。

图片生成视频

从参考图开始，生成更稳定的短视频

Grok Imagine 1.5 更适合从一张已经确定的图片出发。你可以上传产品图、人物照、角色设定图、海报草稿或品牌视觉，让模型在保留主体的基础上补充动作、镜头和环境变化。相比完全开放的文生视频，参考图能减少跑偏，让画面身份、构图和风格更容易保持一致。

如果你正在做广告预览、社媒短片、角色动态、产品动效或分镜草稿，1.5 的价值在于快速把静态素材推到视频形态。你不需要一开始就写很长的提示词，先用清晰图片确定主体，再用一句具体描述控制运动：比如镜头缓慢推进、产品轻微旋转、背景灯光闪烁、人物回头微笑。

使用 Grok Imagine 1.5 时，建议先把参考图准备清楚，再决定时长、画幅和分辨率。短片可以从 1-3 秒开始低成本测试，确认主体动作和镜头节奏后，再拉长到 8 秒或更长版本，用于更接近发布的预览。

适合创作的 1.5

Grok Imagine 1.5 更适合参考图驱动的视频

Grok Imagine 1.5 的核心不是“随便写一句话”，而是让已有图片自然动起来。你控制参考图、时长、比例和分辨率，模型负责把静态画面扩展成有节奏的短视频。

参考图锁定主体

先上传图片，再让模型扩展动作。适合人物肖像、产品图、角色设定、场景气氛图和广告视觉稿，因为主体身份、构图和风格已经由图片提供。

提示词负责运动和镜头

prompt 可选，但强烈建议填写。你可以描述主体动作、镜头推进、转场节奏、光线变化、环境细节和声音氛围，让结果更接近创作意图。

短视频参数更细

连续时长选择适合做社媒素材、广告预览和分镜测试；也可以用更短片段做低成本探索。

上传策略更稳

上传图片保持 10MB 上限，适合常见产品图、人物照和角色图。较轻的文件更容易上传成功，也能减少等待和重试。

Arena 排名

Grok Imagine Video 1.5 Preview 登上 Image-to-Video Arena 第 1

排行榜截图显示，Grok Imagine Video 1.5 Preview (720p) 在 Image-to-Video Arena 榜单中位列第 1，Arena score 为 1,473。这个信号适合放在落地页中解释为什么 1.5 值得单独做入口：它不是只多一个模型名，而是在图生视频质量、稳定性和短片可用性上有更强的用户感知。

Image-to-Video Arena

1,473

Arena score

720p

榜单模型版本

Grok Imagine Video 1.5 Preview ranked number one on Image-to-Video Arena leaderboard

创作流程

从素材到可用短片的工作流

好的图片生成视频不是只看模型能力，还取决于输入素材是否清楚、提示词是否具体、输出参数是否匹配用途。下面这套流程适合多数用户快速得到可评估的结果。

准备清晰参考图

优先选择主体明确、边缘干净、光线稳定、没有过度遮挡的图片。产品图可以保留背景环境，人物图要避免手部和脸部被裁切太多。

写运动而不是堆形容词

描述“镜头缓慢推进、头发被风吹动、背景灯光轻微闪烁”通常比单纯写“电影感、超真实、高质量”更有效，因为模型需要知道时间维度里发生什么。

先低成本探索

第一次可以用 480p 和较短时长测试方向。确认动作、构图和节奏可用后，再把分辨率或时长提高，用于更接近发布的版本。

用历史记录复盘

历史记录会标出使用过的模型，方便你比较旧 Grok、Veo、Nano Banana 和 Grok Imagine 1.5 的效果差异。

视频案例

四种适合 Grok Imagine 1.5 的视频方向

Grok Imagine 1.5 的价值不只在单个效果图，而在于它能把不同类型的参考图推成可评估的短片方向。下面这些案例覆盖动作场景、自然光人像、近景表情和故事板动画，更适合帮助用户理解上传参考图后可以得到什么类型的动态结果。

城市冒险动作

高空、运动和环境纵深，适合展示镜头运动与动作节奏。

自然光人像

人物表情、头发和微动作，更适合测试角色短片和社媒素材。

近景表情细节

脸部稳定、眼神和口型变化，适合说明参考图对身份一致性的帮助。

故事板动画

把分镜风格图变成动态片段，适合脚本、短剧和概念预演。

提示词写法

提示词可以这样组织

Grok Imagine 1.5 的 prompt 最大 4096 字符，但大多数情况下不需要写得很长。更好的方式是把提示词拆成几个清晰部分：主体要做什么、镜头怎么动、环境如何变化、声音或氛围是什么、哪些内容要保持稳定。

主体动作

让人物转头、产品旋转、衣料摆动、光影扫过表面。

镜头语言

使用推进、拉远、轻微环绕、手持感或稳定横移等描述。

环境变化

补充背景灯光、烟雾、雨水、街景、人群或景深变化。

声音氛围

如果需要，可写低沉环境声、轻微风声、城市噪声或安静电影感。

保持稳定

明确主体身份、脸部、logo、产品形状、服装和构图不要大幅改变。

参数规格

模型参数

Kie 已将 Grok Imagine Video 从 1.0 无缝升级到 1.5；本站继续使用原 Grok Imagine API 方法、参数和计费。

后端模型路径grok-imagine/text-to-video、grok-imagine/image-to-video

输入prompt；图生视频可附加 image_urls

视频模式Fun、Normal、Spicy

比例2:3、3:2、1:1、9:16、16:9

时长6、10、15、20、25、30 秒

分辨率480p、720p

哪些用户最适合使用 Grok Imagine 1.5？

如果你的工作从一张确定的图开始，而不是从一段完全开放的文字开始，1.5 会更容易发挥价值。它适合快速验证方向，也适合在正式拍摄、3D 制作或剪辑前生成视觉草稿。

产品动效

把电商图、包装图或概念图转成带镜头运动的短视频，用于广告预览和详情页素材探索。

角色短片

从角色设定图、头像或风格图生成社媒片段，测试人物动作、表情和镜头节奏。

广告样片

快速比较不同灯光、运动方式和视频比例，让创意团队在正式制作前先统一方向。

内容分镜

为脚本、短剧、音乐视频或活动预热视频生成连续视觉草稿，帮助沟通画面想象。

品牌视觉

保持品牌色、产品形状和构图风格，同时加入轻微动态，让静态资产更适合视频渠道。

社媒测试

用 1-3 秒短片测试平台点击感，再把有效方向扩展成更长版本。

常见问题

Grok Imagine 1.5 是新的独立模型入口吗？

不是按独立后端模型处理。Kie 表示 Grok Imagine Video 已无缝升级到 1.5，API 方法、参数和定价无需更改。

Grok Imagine 1.5 支持文字生成视频吗？

支持。本站继续提供原 Grok Imagine 的 text-to-video 和 image-to-video 两种生成方式。

Fun / Normal / Spicy 还会影响输出吗？

会。它们仍是原 Grok Imagine 视频接口的 mode 参数，1.5 升级不要求隐藏这些控件。

积分价格变了吗？

不变。当前处理按 Kie 的“定价无需更改”执行，沿用原 Grok Imagine 视频计费。

生成失败会退积分吗？

上传失败和任务创建失败会走现有退款逻辑；生成过程失败会根据任务状态处理。

历史记录会怎么显示？

新旧 Grok 视频任务都会按当前产品名显示为 Grok Imagine 1.5，方便用户统一理解升级后的模型。

需要更多 Grok Imagine 1.5 积分？

价格

选择最适合您的付费计划

入门版

$11.9/月

按年付 $143.3

适合刚开始使用 AI 生成的用户

每月 1,000 积分
最多 200 张图片或 50 个视频
文本转图像生成
文本转视频生成
图像转视频转换
$0.06/image, $0.24~$1.02/video (6-30s)

专业版

$23.9/月

按年付 $287.3

创作者的最佳性价比之选

每月 2,400 积分
最多 480 张图片或 120 个视频
文本转图像生成
文本转视频生成
图像转视频转换
$0.05/image, $0.2~$0.85/video (6-30s)

工作室版

$47.9/月

按年付 $575.3

为专业用户和重度使用者打造

每月 6,000 积分
最多 1,200 张图片或 300 个视频
文本转图像生成
文本转视频生成
图像转视频转换
$0.04/image, $0.16~$0.68/video (6-30s)

准备好用 Grok Imagine 1.5 做第一条视频了吗？

可以先用文字提示词快速探索，也可以上传参考图控制主体。建议沿用原 Grok Imagine 参数体系，按用途选择时长、比例和分辨率。

开始生成查看价格