星颖 发表于 2026-6-5 16:04:50

xAI发布Grok Imagine 1.5,首登视频竞技场第一且支持音画同步生成

xAI 宣布在开发者平台开放图生视频模型 Grok Imagine Video 1.5 Preview。模型在发布后登顶 Arena.ai 视频竞技场图生视频排行榜,在初步评测中以 1473 的 Elo 评分位列第一,超越了字节跳动的 dreamina-seedance-2.0。
Grok Imagine 1.5 具备一步生成音画同步视频的能力。以往的图生视频工具通常需要进行后期配音,而 Grok Imagine 1.5 在单次推理中即可同步输出视频与匹配的音频,包括人物对话、背景音乐和环境音效。用户只需输入一张起始图片并配合自然语言提示词,就能控制镜头的推拉、场景节奏与声音设计。
在技术架构上,Grok Imagine 1.5 基于 xAI 自研的 Aurora 引擎构建。不同于主流图生视频模型采用的扩散 Transformer 架构,Aurora 引擎是一个自回归混合专家(MoE)网络,在训练时将文本、图像、视频和音频视为统一的 Token 流进行联合预测。Grok Imagine 1.5 支持生成最长 15 秒、分辨率最高 720p 的视频。
https://cdn3.ldstatic.com/optimized/4X/0/4/a/04a76aa3715136450b2e583482e6cbaff1184349_2_690x473.jpeg

zyxj2024 发表于 2026-6-8 22:04:55

有没有星友在深圳的,一起出来聚聚啊

叫个鸭子 发表于 2026-6-14 03:37:32

加班加点并不等同于更好的成果,反而意味着思考创新不足。

JinMuLan3 发表于 2026-6-18 22:02:58

这个思路我先马住!

QiuYueXin2 发表于 2026-6-23 09:11:19

这种复盘内容很适合做成自己的执行清单。

TongMingLi7 发表于 2026-6-28 07:20:53

弱小和无知不是生存的障碍, 傲慢才是 。

FengBoWen1 发表于 3 天前

风向标更新的速度很赞,大家多多去顶下
页: [1]
查看完整版本: xAI发布Grok Imagine 1.5,首登视频竞技场第一且支持音画同步生成