【Sora2教程】如何为Sora2编写高质量的视频提示词
AIHub代理API
国内直连企业级中转,600+全模型支持
讲解如何为 Sora2(或其他同类文本到视频模型)编写高质量的视频提示词(prompts),并配有大量实例与逐步拆解。全文将覆盖提示词的结构、风格控制、摄像与镜头语言、时间连贯性、负面提示、常见参数与调参策略,以及不同题材的示例与优化思路。文章以中文编写,便于直接套用和改写为你的实际生成请求。

为什么提示词(Prompt)对视频生成至关重要
- 文本到视频模型的输出高度依赖输入提示词的细节程度与结构。提示词不仅决定画面内容(人物、道具、环境),还可以间接影响构图、光线、动作、镜头运动、风格与色调。
- 与静态图像不同,视频需要考虑时间维度:动作的起承转合、相机移动、节奏、镜头切换、时间尺度(慢动作/快进)等。因此提示词中需明确时序与运动信息。
- 好的提示词可以减少反复试错,提高生产效率。
提示词的基本构成(Prompt Anatomy)
一个完整的视频提示词通常包含以下模块(可按需增删):
- 场景/主题(Scene/Concept)—— 一句话概括主要画面与意图
- 主体描述(Subject)—— 主角/物体的外观、服装、表情、动作
- 环境与细节(Environment/Props)—— 场景类型、季节、时间、道具
- 摄影/镜头(Cinematography)—— 机位、镜头焦段(如广角/中焦/长焦)、推拉/摇移/跟随
- 灯光与色彩(Lighting/Color)—— 光源方向、氛围光、色调、白平衡
- 风格与参考(Style/References)—— 电影风格、导演/摄影师、电影名、画家名、摄影棚风格、胶片/数字、分辨率
- 动画/时间(Motion/Timing)—— 动画类型(平滑/抖动/卡通)、动作节奏、时长、关键帧提示
- 后期/特效(Post-process)—— 调色(LUT)、颗粒、模糊、散景、镜头光晕
- 负面提示(Negative prompts)—— 要避免的元素或风格
- 参数建议(Parameters)—— 帧率、时长、分辨率、随机种子、生成步骤等(根据使用平台)
编写提示词的原则与技巧
- 由宽到窄:先给出整体概念,再逐渐添加细节,以控制自由度。
- 重要信息靠前:模型通常更重视前半句,因此主体与关键风格应放在开头。
- 使用逗号分隔短描述:每个短句描述一个要素(如“古典舞台,暖色主光,低对比”)。
- 控制长度与权重:太短可能含糊,太长可能导致冲突,必要时使用括号或权重语法(若平台支持)。
- 使用参照与比喻:提到具体导演/电影/摄影风格能快速建立风格基调(如“电影感,类似诺兰式灰蓝色调”)。
- 明确时间维度:描述具体动作顺序与持续,例如“镜头从远景慢慢推进到特写,约5秒内完成”。
- 对运动做量化:使用“平滑、速度慢、匀速、加速、减速”等词汇,或者明确“1秒内完成一次抬手动作”。
- 列出禁止内容:用负面提示排除模型可能混入的不希望元素(例如“无水印、无文字、无多余人物”)。
常见参数与其含义(示例性,具体以你的平台为准)
- 时长(duration):视频总长,通常以秒为单位(例如 3s、10s、30s)。短片更容易获得高质量、连贯性好。
- 帧率(fps):常见 24/30/60。较高帧率对慢动作更有帮助,但计算成本高。
- 分辨率(resolution):如 512×512、768×1024、1920×1080 等。更高分辨率质量更佳但耗时。
- 采样步数(steps):影响图像质量和细节,步数越高越细腻(代价是时间)。
- 引导强度 / Guidance scale:控制模型对提示的遵循程度,数值越高越贴近提示(但可能损失多样性)。
- 随机种子(seed):用于复现同一输出。
- 采样器(sampler):不同采样器的风格与速度可能不同。
- 模型版本(model):选择最新或擅长视频一致性的模型版本。
- 运动平滑(temporal consistency / motion smoothness):控制帧间一致性,越高越连贯但可能牺牲微妙变化。
摄像与镜头语言在提示词中的写法
- 指定镜头类型:wide shot(远景)、medium shot(中景)、close-up(特写)、extreme close-up(极特写)。
- 指定焦段与视角:35mm(自然)、24mm(广角,夸张透视)、85mm(人像压缩)。
- 指定相机动作:dolly in(推进)、dolly out(拉远)、pan left/right(平移)、tilt up/down(俯仰)、handheld(手持摇摄)、steadycam(稳定跟拍)。
- 指定镜头长度与衔接:single continuous shot(单镜头长镜头)、cut to black(切黑屏)、match cut(匹配切换)。
示例句式: “中景,35mm,自然浅景深,镜头从左向右平滑移动(pan right)持续3秒,最后在主角脸部停住成特写。”
时间与动作的写法
- 明确动作顺序:用短句或序号说明前后动作。例如:“1. 女主坐下 2. 镜头推进 3. 她敲桌子”
- 用时间单位量化:例如“镜头在0-2秒内从远景推进到中景,在2-4秒做一个慢速360度环绕”。
- 动作属性:速度(慢速、匀速、急速)、节奏(平稳、抖动)、力度(轻柔、猛力)、风格(流畅、卡点)。
负面提示(Negative prompts)
- 明确列出不想出现的元素,如“无文字、无水印、无畸变、无多余人物、无模糊的面部细节”。
- 可以排除特定风格或颜色:“不使用霓虹色、不使用超饱和红色”。
调试流程(从草稿到成片)
- 初始草稿:编写一个简洁的Prompt(5–20词),快速生成低分辨率短片以检验方向。
- 加细节:根据问题加入主体、光线、镜头动作、时长等。
- 增加负面提示与参数:排除不想要的元素,调高引导强度与时间一致性参数。
- 分段生成与拼接:若长片困难,可把视频分成若干镜头分别生成(确保接缝处的动作/构图一致性)。
- 后期校正:用视频编辑软件进行轻度修正(色彩、稳定、节奏剪辑)。
- 迭代:记录有效的提示与参数,形成模板库。
常见问题与解决方案
- 问:人物面部变形/多余手指? 答:在负面提示里加入“无多余手指、手指解剖正确、面部对称、真实面部”并增加步数与引导强度。
- 问:帧间跳跃/不连贯? 答:降低随机性、使用固定种子、提高 temporal consistency 参数或使用专门的帧间插值方法,分镜头生成并用后期稳定。
- 问:细节模糊? 答:提高分辨率与采样步数,指定“超高细节”或“8k纹理”等关键词(若平台支持)。
- 问:生成时间过长? 答:先用低分辨率/低步数试验,再在确定方向后放大或加步数生成最终版。
丰富的案例示例(按题材分组,每个案例包含提示词与拆解说明)
说明:下面的提示词为示例模板,可直接拷贝到你的 Sora2 平台或根据平台语法微调。若平台支持参数,可在提示词之外配置“duration=5s, fps=30, resolution=1280×720, guidance=7.5”,此处不一一列出参数,文章后有参数建议。
电影级剧情片段(情绪化夜景对话,2镜头,合计8秒)
Prompt(示例):
“夜晚城市屋顶,两名年轻人面对面坐着,女主穿深色外套,男主抽烟,微弱路灯在他们背后形成轮廓光;镜头1:广角远景(24mm),夜色蓝调,全景展示城市霓虹,镜头缓慢推进2米到中景,持续3秒;镜头2:切换到35mm中近景,浅景深,聚焦女主眼神,温暖主光打在面部,表情复杂,轻微呼吸可见,持续5秒;整体风格:电影感,暗沉蓝橙对比,柔和颗粒,平滑镜头运动,真实皮肤质感;负面:无文字,无水印,无漫画风格,无畸变人脸。”
拆解:
- 场景与时间:“夜晚城市屋顶”
- 人物与动作:“两名年轻人面对面坐着,男主抽烟”
- 镜头1/镜头2的分镜描述明确了镜头运动与时长
- 风格与色调:“蓝橙对比、柔和颗粒”
- 负面排除了不想要的风格与瑕疵
动作短片(城市追逐,高速手持镜,6秒)
Prompt(示例):
“白天都市街道,跑动追逐场景,一名女跑者穿运动外套向镜头奔来,镜头手持跟拍,轻微抖动,快速推进并在最后0.5秒进行跳跃动作慢动作切换,镜头在5秒时俯冲到她脚下到空中回旋;风格:电影手持、曝光略高、动感模糊、鲜明对比,色彩偏冷;负面:无静态构图、无卡通、无水印。”
拆解:
- 强调手持跟拍与抖动来营造紧张感
- 指定慢动作时刻以突出动作细节
- 动感模糊与曝光控制加强速度感
音乐视频(浪漫慢镜头,华彩灯光,12秒)
Prompt(示例):
“室内舞池环境,五颜六色聚光灯缓慢扫过,男女舞者缓慢双人舞,镜头采用长镜头单次拍摄,平滑环绕拍摄一圈,持续12秒,镜头由中景移到特写,光晕与散景明显,整体画面带柔软发光,色彩饱和,梦幻氛围,节奏与慢歌拍点同步,风格类似梦幻流行MV;负面:无硬切、不出现摄像头反光、不出现字幕。”
拆解:
- 指明“长镜头单次拍摄”避免频繁切换
- 灯光与色彩设定营造音乐MV氛围
- 节奏与音乐拍点同步为生成动作参考(可在平台上附加音频或节拍提示)
产品宣传(白底商品旋转,4s)
Prompt(示例):
“白色无缝背景,高光柔和,产品为深灰色便携蓝牙音箱,慢速360度旋转,镜头固定中景,浅景深轻微景深渐变,阴影自然,镜面高光精细,材质真实,适合电商宣传,持续4秒;负面:无文字、无人物、无杂乱背景、无反光条纹。”
拆解:
- 商业用途强调“白色无缝背景、材质真实、阴影自然”
- 通过“慢速360度旋转”明确动作
科幻短片(外太空舱内部,冷光,8s)
Prompt(示例):
“太空飞船内部,窗外可见星云与行星,主角穿轻质宇航服在控制台前操作,镜头从控制台过渡到窗外宇宙景观并回到主角面部,光线以冷蓝为主,仪表板发出霓虹绿光,风格:高对比科幻电影感,微颗粒,细节丰富,动作缓慢有张力,持续8秒;负面:无文字覆盖、无卡通风格。”
拆解:
- 场景复合环境(窗外星空+舱内控制台)
- 灯光强调颜色对比(冷蓝+霓虹绿)
动画/卡通风格(二次元校园小品,5s)
Prompt(示例):
“日系二次元风格,午后校园樱花大道,少女穿校服打伞,微风吹散樱花瓣,镜头平稳推向特写,色彩明亮温暖,线条清晰,可爱的角色表情,镜头慢速停住在少女笑容处,整体风格:Studio Ghibli 温柔画风与精致线稿融合;负面:无写实质感、无过度高光。”
拆解:
- 明确“二次元风格”并给出艺术参考(吉卜力风格)
- 描述自然元素(樱花、微风)以增强动态感
纪录片风格(采访片段,静态两镜头,10s)
Prompt(示例):
“室内自然光采访场景,受访者坐在窗边,光线柔和侧光,镜头1:中景,35mm,记录整体氛围,镜头2:特写,85mm,人像压缩感好,捕捉面部细节与情绪,剪辑节奏中等,色彩真实不过度饱和,风格:纪录片真实自然;负面:无过度动感、无夸张滤镜。”
拆解:
- 强调“自然光”与“纪录片真实”
- 指定两镜头风格与焦段,便于分镜拍摄与剪辑
