先识别任务目标与输入缺口
主控智能体先判断是卖点分析、25 宫格分镜、详情页,还是脚本生成,再决定走哪条工作流。
Workflow
主控智能体先判断是卖点分析、25 宫格分镜、详情页,还是脚本生成,再决定走哪条工作流。
卖点、材质、风格、镜头位都应该先结构化,再交给图像生成、脚本生成或详情页模块继续消费。
用户先选入口,再得到对应结果,而不是在一个输入框里自己猜该怎么提需求。
Agent Entry
Agent Workspace
上传一张产品图,直接生成横版广告片方向的视觉参考图。
当前状态
这条工作流还没接入线上接口,但入口和输出目标已经按产品架构预留。
等待上传图片。
结果会在这里展示,包括 provider、双语字段和核心卖点。
上传参考图后即可自动生成。
提交后会先返回 task_id,再自动轮询直到拿到图片地址。
Capability Matrix
产品分析层
从视觉线索反推商业表达,为详情页、视频脚本和口播文案提供基础层结果。
视觉资产层
不是裁切,而是按平台语法重做镜头组织、主体占比和安全区适配。
视觉资产层
把单图补全成可复用的产品资产,而不是简单换几个角度。
视频脚本层
把静态镜头资产转成镜号、时长、视觉提示词、音效和旁白都齐全的执行脚本。
视频脚本层
更偏广告导演逻辑,让画面自己说话,而不是靠解说兜底。
商业化层
同时处理人、货、场、口播、CTA 和购物车引导,最接近直接变现。
Deliverables
Structured Output
先拿到 product brief、style bible、shot spec,再把它们交给图像、脚本或详情页模块。
Visual Assets
镜头板、主视觉、场景参考图和详情页画面,应该先成为稳定资产,再进入视频阶段。
Execution Pack
后续继续往视频脚本、口播文案、购物车引导和详情页结构延展,才像完整产品。