ai影片生成新创企业luma于周四正式发布「luma agents」开发平台,主打整合文字、图像、视频与音频四大模态,实现端到端的创意内容生产。
该平台的技术根基,来自Luma自主研发的「统一智慧(Unified Intelligence)」模型家族——透过单一多模态推理架构,赋予AI类比人类设计师的逻辑推演、跨域理解与执行落地能力。

Luma Agents主要面向广告代理公司、品牌行销团队及创意设计工作室,强调可自主规划策略、即时生成适配多场景的多媒体素材。系统具备高度协同性,能无缝调用Luma自研的Ray 3.14、Google最新Veo 3与Nano Banana Pro、字节跳动旗下Seedream,以及ElevenLabs的语音合成模型。
更多科技职缺资讯请见科技专区:https://www.php.cn/link/d4b949cac7611fae5f8dee7eae4f6caf
Luma执行长暨联合创始人阿米特·贾恩(Amit Jain)指出,首发模型「Uni-1」深度融合语言理解、视觉生成与空间建模能力,他将其定义为「像素级的智能」——不仅绘制线条,更能同步解析结构逻辑、光影关系与三维动态变化。贾恩强调,客户采购的并非单一工具,而是一套重构创意工作流与商业运营模式的基础设施。目前,Publicis Groupe(阳狮集团)、Adidas(阿迪达斯)、Mazda(马自达)等国际品牌与代理机构已导入该平台。
贾恩进一步说明,相较传统AI工具需用户手动编写数百条提示词(Prompt)并反复调试不同模型,Luma Agents更像一位具备工程思维的AI协作者:它拥有自我评估、迭代优化与上下文反思能力。使用者仅需以自然对话方式设定目标与偏好,系统即自动产出大量创意变体,并持续筛选、精炼,直至交付符合标准的最终成果。
在实际案例中,Luma展现了显著的效能跃升。贾恩举例,某全球知名品牌曾耗时一年、投入1500万美元打造跨国广告系列;改用Luma Agents后,仅用40小时、成本低于2万美元,便完成涵盖多国语言、文化适配与合规要求的本地化版本,并一次性通过客户严苛的品质审核与事实准确性验证。
现阶段,Luma Agents已开放API接入。为保障系统稳定性与任务链路连续性,Luma将采取分阶段、渐进式开放策略,依序扩大开发者与企业用户的接入规模。
延伸阅读:
鸿海2026年营收挑战9兆 刘扬伟透漏:GTC大会将致赠黄仁勋「特别礼物」










