先识别任务目标与输入缺口
主控智能体先判断是卖点分析、25 宫格分镜、详情页,还是脚本生成,再决定走哪条工作流。
Workflow
主控智能体先判断是卖点分析、25 宫格分镜、详情页,还是脚本生成,再决定走哪条工作流。
卖点、材质、风格、镜头位都应该先结构化,再交给图像生成、脚本生成或详情页模块继续消费。
用户先选入口,再得到对应结果,而不是在一个输入框里自己猜该怎么提需求。
Agent Entry
Agent Workspace
上传产品图后,在这里选择比例并生成对应的 25 宫格分镜总图。
当前状态
这条工作流还没接入线上接口,但入口和输出目标已经按产品架构预留。
等待上传图片。
结果会在这里展示,包括 provider、双语字段和核心卖点。
上传参考图后即可自动生成。
提交后会先返回 task_id,再自动轮询直到拿到图片地址。
等待生成视频。
生成出 25 分镜总图后,可以继续生成 15 秒视频。
Capability Matrix
产品分析层
从视觉线索反推商业表达,为详情页、视频脚本和口播文案提供基础层结果。
视觉资产层
不是裁切,而是按平台语法重做镜头组织、主体占比和安全区适配。
视觉资产层
把单图补全成可复用的产品资产,而不是简单换几个角度。
视频脚本层
把静态镜头资产转成镜号、时长、视觉提示词、音效和旁白都齐全的执行脚本。
视频脚本层
更偏广告导演逻辑,让画面自己说话,而不是靠解说兜底。
商业化层
同时处理人、货、场、口播、CTA 和购物车引导,最接近直接变现。
Deliverables
Structured Output
先拿到 product brief、style bible、shot spec,再把它们交给图像、脚本或详情页模块。
Visual Assets
镜头板、主视觉、场景参考图和详情页画面,应该先成为稳定资产,再进入视频阶段。
Execution Pack
后续继续往视频脚本、口播文案、购物车引导和详情页结构延展,才像完整产品。