返回首页AI MV 创作项目
Project 01 · AI 工程化实践

AI MV 创作项目

两代工作流,一套持续深化的方法论。从验证 AI 降本可行性,到用工程化思维解决一致性、故事性与镜头合理性——把创意生产变成一个可复现的系统。

// 两代工作流

第一代GPT · Midjourney · Runway

核心目标:验证降本可行性

99%
¥2,000 → ¥15 / 首

建立了 AI 全链路制作 MV 的基础流程,证明了批量化、低成本的可行性。工具链相对分散,一致性和叙事质量有限。

第二代Claude + WorkBuddy + Seedance 2.0

核心目标:质量跃迁 + 方法论沉淀

30+镜头
3专属 Skill
49事件拆解

以《晴天》为创作载体,系统性解决人物/场景一致性、故事性、镜头合理性四大核心问题,沉淀出可复用的 AI 创作工程化方法论。

// 三层 Skill 体系

不是一个 AI 做所有事,而是三个专职 Agent 各司其职,职责边界清晰。

编剧 Skill

编剧狗狗负责「说什么」
  • 故事本体 + 情感弧线设计
  • 49 个镜头事件拆解
  • 平行蒙太奇 + 转场策略
  • 角色 Want / Need / Stakes 建立

导演 Skill

导演即墨负责「怎么拍」
  • 四层 Prompt 架构(主体/动作/摄影机/风格)
  • 资产分层:人物/场景/道具/风格
  • Coverage 回退方案机制
  • 场景批量生成 + 连贯性控制

布场 Skill

布场负责「看起来是什么」
  • 角色三视图生成(Seedream img2img)
  • 场景锚定图生成
  • 道具视觉描述锁定
  • 资产入库(私域素材体系)

// 四大技术难点

01

人物一致性

解决方案

为每个角色生成正面、3/4侧、侧面三视图,每次生成视频必须垫入对应参考图;配合 Prompt 锁定面部骨骼特征(单眼皮+高眉骨、丹凤眼+右侧酒窝),negative prompt 加入「面部漂移」。

结果

陈阳与林晴跨 30+ 个镜头保持高度稳定

02

场景一致性

解决方案

出现 3 次以上的场景(修理店、走廊等)生成锚定图,i2v 模式下作为 env-file 传入,场景内光线/摄影机短语逐字复用,不在 prompt 中重复描述已有内容。

结果

同场景多镜头无割裂,光线连续性通过

03

故事性

解决方案

建立编剧 Skill(编剧狗狗),完整输出故事本体、情感弧线、49 个事件拆解和平行蒙太奇设计。画面不图解歌词,而是用对位叙事——两条时间线交叉剪辑,情绪叠加放大。

结果

画面推动叙事而非堆砌素材,整体有情感弧线

04

镜头与布景合理性

解决方案

导演 Skill(导演即墨)升级为四层 Prompt 架构(主体 / 动作 / 摄影机 / 风格),删除速度词只写动作质感,节奏交给模型;布场 Skill 锁定道具描述(如透明雨伞的伞面材质、伞柄细节),防止道具凭空消失。

结果

镜头语言有目的,物理自洽问题大幅减少

// 成品 MV

周杰伦《晴天》· AI MV · Claude + WorkBuddy + Seedance 2.0

// AI 工程化洞察

做 AI MV 本质上是一个工程化问题:你需要像设计系统一样设计工作流——输入标准化、中间层可复现、输出可评估。三层 Skill 体系和垫图机制,是我给这个创作流水线建的「接口规范」。

这让我真正理解了 AIGC 工具产品的核心问题不是「能不能生成」,而是「用户能不能把创作意图准确传达给 AI,并在多轮迭代后收敛到想要的结果」。一致性管理、版本控制、Prompt 工程——这些不是技术问题,是用户体验问题。

// 方法论持续迭代中