上次分享了古风短剧的3条指令,今天说都市短剧。
都市短剧比古风更火,因为受众更广——职场、情感、逆袭,都是短剧平台流量最大的品类。但用AI做都市短剧也比古风更难,因为涉及多角色互动和多场景切换,一致性控制是最大的坑。
一、5条核心指令
指令1:角色群像"帮我设计3个都市短剧角色:角色A:30岁男,创业公司CEO,西装偏休闲,表情自信但眼底疲惫角色B:27岁女,公司运营总监,职业装利落短发,说话快走路快角色C:35岁男,投资人,深色西装戴眼镜,永远微笑但看不出真实想法风格:现代都市职场,参考《猎场》视觉调性"
为什么3个角色一起设定?因为updream的Agent在同时处理多个角色时会自动对齐画风。如果你分3次设定,第一次是写实风,第二次偏动漫,第三次偏广告片,拼在一起就是大杂烩。
另外注意每个角色写了3层信息:外观(穿什么)、行为(说话快走路快)、内心(眼底疲惫/看不出真实想法)。AI能根据这3层信息生成更立体的人物,不只是"一个穿西装的男人"。
指令2:场景设定"场景1:深夜办公室,落地窗城市灯光,桌上散落咖啡杯和文件场景2:白天咖啡厅,自然光,角落位置场景3:会议室,投影屏幕亮着,3人围坐整体风格:冷暖光对比,电影感,偏蓝灰色调"
每个场景写清楚3个要素:时间+光线+情绪基调。深夜办公室是冷的孤独的,咖啡厅是暖的私密的,会议室是紧张的对峙的。这样AI在生成画面时会自动匹配光线和色调,不用你手动调。
指令3:核心冲突"三人在会议室讨论融资方案,角色A提出激进扩张计划,角色C微笑提出对赌条款,角色B发现条款里的隐藏风险,当场指出。气氛从合作转向对抗"
写冲突的公式:谁做了什么→谁反对→反转在哪。
很多人写冲突只写"三人开会讨论",没有对抗没有反转,出来的就是三个人坐着说话,观众3秒划走。
指令4:分镜设计7个分镜,每个写景别+动作+情绪。具体指令见小红书版。
关键是景别的节奏:中景入→近景推→特写聚焦→中景拉远→远景留白。这个节奏模拟了电影的剪辑逻辑,观众才会觉得"像真的"。
指令5:风格定调控制整体节奏、BGM、色调变化、结尾悬念。都市短剧的结尾一定要留钩子,不然观众看完就走了,不会追下一集。
二、5条指令能出什么效果?
在updream里大约15-20分钟能生成一部2-3分钟的都市短剧片段。画面质量不错,叙事基本连贯,冲突感够。
但离"能发出去赚钱的短剧"还有一段距离。
三、都市短剧最大的坑:角色一致性
古风短剧一般1个主角+1-2个配角,场景相对固定(宅院里来回走),一致性相对好控制。
都市短剧3个主角在3个场景里来回切换,一致性崩塌的概率非常高:
- 角色A在办公室里是方脸,到了咖啡厅变圆脸了
- 角色B的短发在会议室里是齐耳,下一个镜头变到肩膀了
- 角色C的西装颜色在3个场景里深浅不一
怎么解决?我试了很多方法,最后总结了一个"全能参考+首尾帧控制"的三步法:
步骤1:全能参考图用指令1生成3个角色各自最满意的那张图,保存下来。后续每次生成新镜头时,上传3个角色的参考图,加上"严格参照参考图的角色外观,不得偏移"。
步骤2:首尾帧定义每个镜头定义一个起始画面和结束画面。比如分镜4"特写-文件上的对赌条款":起始帧是角色C的手推过文件,结束帧是镜头推近到条款文字。这样AI不需要猜镜头怎么过渡,衔接就自然了。
步骤3:一致性校验每生成2-3个镜头,暂停一下,跟参考图对比。如果跑偏了,重新生成这2-3个镜头,不要等全部生成完了再改——越往后偏得越远。
这三步说起来简单,但实际操作中每一步都有具体的参数设置和技巧。不同场景的光线条件、不同角色的服装细节,都会影响一致性的效果。
完整的参数设置和每一步的实操细节,我在AI工作陪跑里整理了完整的教程。想学的来找我。