AI MV 创作项目
两代工作流,一套持续深化的方法论。从验证 AI 降本可行性,到用工程化思维解决一致性、故事性与镜头合理性——把创意生产变成一个可复现的系统。
// 两代工作流
核心目标:验证降本可行性
建立了 AI 全链路制作 MV 的基础流程,证明了批量化、低成本的可行性。工具链相对分散,一致性和叙事质量有限。
核心目标:质量跃迁 + 方法论沉淀
以《晴天》为创作载体,系统性解决人物/场景一致性、故事性、镜头合理性四大核心问题,沉淀出可复用的 AI 创作工程化方法论。
// 三层 Skill 体系
不是一个 AI 做所有事,而是三个专职 Agent 各司其职,职责边界清晰。
编剧 Skill
编剧狗狗负责「说什么」- 故事本体 + 情感弧线设计
- 49 个镜头事件拆解
- 平行蒙太奇 + 转场策略
- 角色 Want / Need / Stakes 建立
导演 Skill
导演即墨负责「怎么拍」- 四层 Prompt 架构(主体/动作/摄影机/风格)
- 资产分层:人物/场景/道具/风格
- Coverage 回退方案机制
- 场景批量生成 + 连贯性控制
布场 Skill
布场负责「看起来是什么」- 角色三视图生成(Seedream img2img)
- 场景锚定图生成
- 道具视觉描述锁定
- 资产入库(私域素材体系)
// 四大技术难点
人物一致性
解决方案
为每个角色生成正面、3/4侧、侧面三视图,每次生成视频必须垫入对应参考图;配合 Prompt 锁定面部骨骼特征(单眼皮+高眉骨、丹凤眼+右侧酒窝),negative prompt 加入「面部漂移」。
结果
陈阳与林晴跨 30+ 个镜头保持高度稳定
场景一致性
解决方案
出现 3 次以上的场景(修理店、走廊等)生成锚定图,i2v 模式下作为 env-file 传入,场景内光线/摄影机短语逐字复用,不在 prompt 中重复描述已有内容。
结果
同场景多镜头无割裂,光线连续性通过
故事性
解决方案
建立编剧 Skill(编剧狗狗),完整输出故事本体、情感弧线、49 个事件拆解和平行蒙太奇设计。画面不图解歌词,而是用对位叙事——两条时间线交叉剪辑,情绪叠加放大。
结果
画面推动叙事而非堆砌素材,整体有情感弧线
镜头与布景合理性
解决方案
导演 Skill(导演即墨)升级为四层 Prompt 架构(主体 / 动作 / 摄影机 / 风格),删除速度词只写动作质感,节奏交给模型;布场 Skill 锁定道具描述(如透明雨伞的伞面材质、伞柄细节),防止道具凭空消失。
结果
镜头语言有目的,物理自洽问题大幅减少
// 成品 MV
周杰伦《晴天》· AI MV · Claude + WorkBuddy + Seedance 2.0
// AI 工程化洞察
做 AI MV 本质上是一个工程化问题:你需要像设计系统一样设计工作流——输入标准化、中间层可复现、输出可评估。三层 Skill 体系和垫图机制,是我给这个创作流水线建的「接口规范」。
这让我真正理解了 AIGC 工具产品的核心问题不是「能不能生成」,而是「用户能不能把创作意图准确传达给 AI,并在多轮迭代后收敛到想要的结果」。一致性管理、版本控制、Prompt 工程——这些不是技术问题,是用户体验问题。
// 方法论持续迭代中