Project 01 · AI 工程化实践

AI MV 创作项目

两代工作流，一套持续深化的方法论。从验证 AI 降本可行性，到用工程化思维解决一致性、故事性与镜头合理性——把创意生产变成一个可复现的系统。

// 两代工作流

第一代GPT · Midjourney · Runway

核心目标：验证降本可行性

99%

¥2,000 → ¥15 / 首

建立了 AI 全链路制作 MV 的基础流程，证明了批量化、低成本的可行性。工具链相对分散，一致性和叙事质量有限。

第二代Claude + WorkBuddy + Seedance 2.0

核心目标：质量跃迁 + 方法论沉淀

30+镜头

3专属 Skill

49事件拆解

以《晴天》为创作载体，系统性解决人物/场景一致性、故事性、镜头合理性四大核心问题，沉淀出可复用的 AI 创作工程化方法论。

// 三层 Skill 体系

不是一个 AI 做所有事，而是三个专职 Agent 各司其职，职责边界清晰。

编剧 Skill

编剧狗狗负责「说什么」

故事本体 + 情感弧线设计
49 个镜头事件拆解
平行蒙太奇 + 转场策略
角色 Want / Need / Stakes 建立

导演 Skill

导演即墨负责「怎么拍」

四层 Prompt 架构（主体/动作/摄影机/风格）
资产分层：人物/场景/道具/风格
Coverage 回退方案机制
场景批量生成 + 连贯性控制

布场 Skill

布场负责「看起来是什么」

角色三视图生成（Seedream img2img）
场景锚定图生成
道具视觉描述锁定
资产入库（私域素材体系）

// 四大技术难点

人物一致性

解决方案

为每个角色生成正面、3/4侧、侧面三视图，每次生成视频必须垫入对应参考图；配合 Prompt 锁定面部骨骼特征（单眼皮+高眉骨、丹凤眼+右侧酒窝），negative prompt 加入「面部漂移」。

结果

陈阳与林晴跨 30+ 个镜头保持高度稳定

场景一致性

解决方案

出现 3 次以上的场景（修理店、走廊等）生成锚定图，i2v 模式下作为 env-file 传入，场景内光线/摄影机短语逐字复用，不在 prompt 中重复描述已有内容。

结果

同场景多镜头无割裂，光线连续性通过

故事性

解决方案

建立编剧 Skill（编剧狗狗），完整输出故事本体、情感弧线、49 个事件拆解和平行蒙太奇设计。画面不图解歌词，而是用对位叙事——两条时间线交叉剪辑，情绪叠加放大。

结果

画面推动叙事而非堆砌素材，整体有情感弧线

镜头与布景合理性

解决方案

导演 Skill（导演即墨）升级为四层 Prompt 架构（主体 / 动作 / 摄影机 / 风格），删除速度词只写动作质感，节奏交给模型；布场 Skill 锁定道具描述（如透明雨伞的伞面材质、伞柄细节），防止道具凭空消失。

结果

镜头语言有目的，物理自洽问题大幅减少

// 成品 MV

周杰伦《晴天》· AI MV · Claude + WorkBuddy + Seedance 2.0

// AI 工程化洞察

做 AI MV 本质上是一个工程化问题：你需要像设计系统一样设计工作流——输入标准化、中间层可复现、输出可评估。三层 Skill 体系和垫图机制，是我给这个创作流水线建的「接口规范」。

这让我真正理解了 AIGC 工具产品的核心问题不是「能不能生成」，而是「用户能不能把创作意图准确传达给 AI，并在多轮迭代后收敛到想要的结果」。一致性管理、版本控制、Prompt 工程——这些不是技术问题，是用户体验问题。

// 方法论持续迭代中

返回首页下一个：车载业务