release: opensource snapshot 2026-02-27 19:25:00

This commit is contained in:
saturn
2026-02-27 19:25:00 +08:00
commit 5de9622c8b
1055 changed files with 164772 additions and 0 deletions

View File

@@ -0,0 +1,31 @@
# Character Image To Description Prompt
Analyze the provided character image and write one detailed English visual description for image generation.
## Required content
Include all of the following:
1. Gender and approximate age range
2. Hair style and hair color
3. Face shape and facial features
4. Body build and silhouette
5. Clothing style and clothing details
6. Accessories and signature details
7. Overall style keywords
## Missing-part completion
If the image only shows part of the body, infer the missing parts consistently.
- Missing lower body: infer matching pants/skirt style
- Missing shoes: infer shoes that fit the outfit
- Missing accessory details: infer a few reasonable accessories
## Forbidden content
Do not mention:
- Skin color
- Eye color
- Facial expression
- Pose or action
- Background
## Output format
Return one plain English paragraph only (about 120-220 words).
Do not return markdown, bullets, titles, or JSON.

View File

@@ -0,0 +1,36 @@
# 图片反推角色描述提示词
请分析这张角色图片,生成一段详细的角色外貌描述(用于 AI 图片生成)。
## 输出要求
生成一段完整的角色视觉描述,包含以下要素:
1. 性别和年龄段(如:约二十五岁的男性)
2. 发型发色(如:黑色短发、微卷的棕色长发)
3. 脸型五官特征(如:剑眉星目、高鼻梁、薄唇)
4. 体态身材(如:身形修长、体格健壮)
5. 服装风格(如:深蓝色西装、白色衬衫、皮质腰带)
6. 配饰特征(如:左手戴银色手表、胸前别金色胸针)
7. 整体气质关键词(如:精英气质、禁欲系、高冷、温柔暖男)
## 缺失内容补齐规则
如果参考图只展示了部分身体(如上半身、头像),请根据已有信息合理推断并补全:
- **缺少下半身**:根据上衣风格推断裤装/裙装类型(如西装上衣配深蓝色西裤、休闲上衣配牛仔裤)
- **缺少鞋子**:根据整体穿搭风格推断鞋款(如正装配皮鞋、休闲装配运动鞋或帆布鞋)
- **缺少配饰细节**:根据角色气质合理添加配饰(如商务风配手表、休闲风配手环)
## 禁止描写
- 皮肤颜色
- 眼睛颜色
- 表情
- 动作
- 背景
- 姿势
## 输出格式
一段连贯的描述文字约200-300字直接可用于图片生成提示词。
只返回描述文字,不要有任何标题、序号或其他格式。

View File

@@ -0,0 +1,24 @@
# Reference Image To Character Sheet Prompt (img2img)
Use the provided reference image to extract face traits, hairstyle, body shape, and outfit structure.
## Style consistency
Keep the original visual style:
- Real photo -> realistic style
- Anime -> anime style
- Realistic illustration -> realistic illustration style
- Any other style -> preserve that style
## Generation rules
1. Ignore the original image color cast and lighting defects
2. Use clean, soft studio lighting
3. Keep natural, aesthetically correct body proportions
4. Do not copy blur, noise, compression artifacts, or defects
5. Output must be clear, sharp, and production-quality
6. Character expression should be neutral and calm, looking at camera
## Missing-part completion
If only half body or partial body is visible, infer and complete hidden parts consistently:
- Infer matching lower-body clothing
- Infer suitable footwear
- Infer missing hands/arms in a natural way

View File

@@ -0,0 +1,28 @@
# 参考图转角色设定图提示词(图生图模式)
基于提供的参考图片,提取角色的面部五官特征、发型、体型和服装款式作为参考。
## 画风保持规则
保持原图的画风和艺术风格:
- 真人照片风格 → 生成真人风格
- 动漫风格 → 生成动漫风格
- 写实插画 → 生成写实插画风格
- 其他风格 → 保持一致
## 生成规则
1. 忽略原图的具体色调和光线
2. 使用自然柔和的摄影棚灯光
3. 绘制正常美观的人体比例
4. 不要复制原图的画质、模糊、噪点或瑕疵
5. 生成的图像必须清晰锐利、细节丰富、专业品质
6. 角色表情应为自然平静的中性表情,目光正视镜头
## 缺失部位自动补齐
如果参考图是半身或部分身体,请根据服装风格和人物特征合理补全未露出的部位:
- **缺少下半身**:根据上衣风格推断并绘制匹配的裤装/裙装
- **缺少脚部**:根据整体穿搭风格添加合适的鞋款
- **缺少手部/手臂**:根据姿态合理补全
- 保持整体风格一致,确保补全的部分与可见部分协调统一

View File

@@ -0,0 +1,38 @@
You are an experienced Acting Director.
Your task is to generate acting notes for each character in each panel.
Core input:
- Total panel count: {panel_count}
- Panels JSON:
{panels_json}
- Character info:
{characters_info}
Requirements:
1. Treat each panel independently. The same character can have different emotional states across panels.
2. Adapt performance style to panel.scene_type (daily / emotion / action / epic / suspense).
3. For each character, write one concise visual acting instruction including:
- emotional state (visible, not abstract)
- facial expression details
- body language / posture
- micro action and gaze direction
4. Use only observable descriptions. Avoid abstract words like "sad" without visual evidence.
Output format (JSON array only):
[
{
"panel_number": 1,
"characters": [
{
"name": "Character Name",
"acting": "One-sentence visual acting direction"
}
]
}
]
Strict constraints:
1. Return JSON only, no markdown.
2. Array length must equal {panel_count}.
3. Each character object must contain only "name" and "acting".
4. Keep character names exactly consistent with panel input.

View File

@@ -0,0 +1,90 @@
你是一位经验丰富的表演指导(Acting Director)。你的任务是为一组分镜中的**每个镜头**设计角色的表演细节。
【核心职责】
分析整组分镜后,为每个镜头中的角色用一句话描述完整的表演指令,包含:
- 情绪状态与强度
- 面部表情细节
- 肢体语言与姿态
- 微动作与视线
【重要】每个镜头的表演必须是独立的!
- 同一角色在不同镜头可能有不同情绪变化
- 表演风格匹配 scene_type日常/情感/动作/史诗/悬疑)
【表演风格匹配 scene_type】
**daily日常**:自然松弛,微表情为主,动作幅度小
**emotion情感**:细腻层次,眼神戏份重,情绪渐进
**action动作**:爆发力强,动作干脆,表情夸张
**epic史诗**:庄重仪式感,姿态端正,动作缓慢有力
**suspense悬疑**:紧绷警觉,肢体僵硬,眼神游移
【表演描述词库】
**表情**:眼眶泛红、眉头紧锁、嘴角上扬、目光闪躲、瞳孔收缩、嘴唇颤抖、咬紧牙关
**肢体**:握紧拳头、身体前倾、双手交握、肩膀耸起、转身背对、后退一步
**微动作**:轻轻眨眼、咽口水、深呼吸、手指轻颤、舔嘴唇、胸口起伏
【⚠️ 禁止规则】
1. 禁止抽象情绪词:悲伤、愤怒、紧张 → 改用可见表现
2. 禁止身份称呼:母亲、父亲 → 改用角色名
【输出格式】
返回JSON数组每个镜头一个对象每个角色只有 name + acting 两个字段:
[
{
"panel_number": 1,
"characters": [
{
"name": "李凤华",
"acting": "嘴角微扬眼神柔和地看向景笙,身体微微前倾,双手自然垂放,轻轻眨眼"
},
{
"name": "景笙",
"acting": "面带微笑但眼神略显疏离,站姿笔直双手背后,轻轻点头"
}
]
},
{
"panel_number": 2,
"characters": [
{
"name": "李凤华",
"acting": "眉头轻皱嘴唇紧抿,双手交握在身前肩膀微耸,目光低垂看向地面,手指轻微交缠"
}
]
},
{
"panel_number": 3,
"characters": [
{
"name": "李凤华",
"acting": "眼眶泛红泪水打转嘴唇颤抖,身体微微发抖双手攥紧衣角,快速眨眼忍住泪水转头避开对方视线"
}
]
}
]
【输入数据】
分镜数据(共 {panel_count} 个镜头):
{panels_json}
角色信息:
{characters_info}
【严格要求】
1. 只返回JSON数组不要有markdown代码块标记
2. 数组长度必须等于输入的镜头数量({panel_count}个)
3. 每个角色只有 name 和 acting 两个字段
4. acting 用一句话描述完整表演(表情+肢体+微动作+视线)
5. 角色名必须与输入分镜中的 characters 完全一致
6. 所有描述必须是可视化的,禁止抽象情绪词
7. 根据 scene_type 调整表演风格
8. 情绪弧线连贯,前后镜头有合理递进

View File

@@ -0,0 +1,86 @@
You are a casting and character-asset analyst.
Analyze the input text and produce structured character profiles for visual production.
Input text:
{input}
Existing character library info:
{characters_lib_info}
Goals:
1. Identify characters that should appear visually.
2. Exclude pure background extras and abstract entities.
3. Build profile fields needed for downstream visual generation.
4. Capture naming/alias mapping, especially first-person references.
Extraction rules:
1. Include characters that speak, act, or significantly drive plot.
2. Exclude one-off nameless background people unless visual identity is required.
3. Resolve aliases/titles (e.g., "my husband", "boss", "I") to canonical names when possible.
4. For first-person narrative, explicitly document who "I" maps to in introduction.
Field rules:
- role_level: one of S/A/B/C/D based on narrative importance
- costume_tier: 1-5 based on social identity (not role_level)
- expected_appearances: always include at least one initial appearance
- introduction: include identity, relationship mapping, and common address mapping
Output format (JSON only):
{
"characters": [
{
"name": "Canonical Name",
"aliases": ["alias 1", "alias 2"],
"introduction": "Role, perspective mapping, relationships, and naming aliases",
"gender": "male/female/other",
"age_range": "young adult",
"role_level": "S",
"archetype": "character archetype",
"personality_tags": ["tag1", "tag2"],
"era_period": "modern/fantasy/historical/sci-fi",
"social_class": "elite/middle/common",
"occupation": "occupation or none",
"costume_tier": 3,
"suggested_colors": ["color1", "color2"],
"primary_identifier": "signature visual marker",
"visual_keywords": ["keyword1", "keyword2"],
"expected_appearances": [
{ "id": 1, "change_reason": "initial appearance" }
]
}
],
"new_characters": [
{
"name": "Canonical Name",
"aliases": ["alias 1", "alias 2"],
"introduction": "Role, perspective mapping, relationships, and naming aliases",
"gender": "male/female/other",
"age_range": "young adult",
"role_level": "S",
"archetype": "character archetype",
"personality_tags": ["tag1", "tag2"],
"era_period": "modern/fantasy/historical/sci-fi",
"social_class": "elite/middle/common",
"occupation": "occupation or none",
"costume_tier": 3,
"suggested_colors": ["color1", "color2"],
"primary_identifier": "signature visual marker",
"visual_keywords": ["keyword1", "keyword2"],
"expected_appearances": [
{ "id": 1, "change_reason": "initial appearance" }
]
}
],
"updated_characters": [
{
"name": "Existing Canonical Name",
"updated_introduction": "Updated intro with newly discovered mapping",
"updated_aliases": ["new alias 1", "new alias 2"]
}
]
}
Strict constraints:
1. JSON only.
2. If no valid character is found, return empty arrays.
3. Keep all strings in English.

View File

@@ -0,0 +1,244 @@
你是专业的"选角指导"。请基于提供的文本(小说、剧本或混合格式),分析并输出所有需要制作形象的角色档案信息。
【你的职责】
- 识别需要在画面中出现的角色
- 根据剧情发展和角色身份判断每个角色的重要性层级
- 分析角色的性格和背景
- 输出结构化的角色档案(供后续视觉生成使用)
- ⚠️ 分析角色之间的关系、称呼映射生成角色介绍introduction
【筛选规则 - 精准提取模式】
✅【必须提取的角色】:
- 剧本人物行中列出的角色
- 有台词且参与剧情互动的角色
- 贯穿故事主线的核心人物
- 对剧情有实际推动作用的配角
- 在画面中需要出镜的角色
❌【不提取的角色】:
- 无名无特征的纯路人(如"人群中的某人"
- 仅被提及但从未出场的角色
- 没有台词也没有互动的背景人物
- 意境描述中的虚构存在(如"命运"、"死神的化身"
📋【判断标准】:
问自己:这个角色是否需要制作形象图?是否在画面中有实际出镜?
如果答案是否定的,则不提取。
【角色介绍 introduction 规则 ⭐重要】
每个角色必须有 introduction 字段,用于帮助后续 AI 正确识别角色。包含:
1. **叙述视角映射**
- 如果是第一人称叙述,明确说明"我"对应此角色
- 示例:"本角色是故事主角,小说以第一人称'我'叙述"
2. **角色身份定位**
- 描述角色在故事中的身份(主角/配角/反派等)
- 示例:"女主角,公司秘书"
3. **角色关系**
- 与其他主要角色的关系
- 示例:"林墨的妻子,张三的女儿"
4. **称呼映射**
- 其他角色对此角色的常用称呼
- 示例:"被林墨称呼为'老婆'、'晴晴',被张三称呼为'闺女'"
示例 introduction
"故事主角,小说以第一人称'我'叙述,真名林墨。苏晴的丈夫,张三的女婿。被苏晴称呼为'老公'、'墨哥',被下属称呼为'林总'。"
【角色重要性层级判断规则】
⚠️ 重要:根据角色在剧情中的戏份和身份地位来判断,不是根据外表华丽程度!
S级绝对主角
- 故事的核心视角人物,剧情围绕其展开
- 第一人称叙述中的"我"通常是S级
- 判断依据:戏份最重、出场最多、剧情主线与其紧密相关
A级核心配角
- 与主角有大量互动的重要角色
- 男二号、女二号、主要反派等
- 判断依据:对主线剧情有重大影响、戏份仅次于主角
B级重要配角
- 多次出场、有名有姓、推动某条支线剧情
- 判断依据:有一定戏份、对剧情有贡献
C级次要角色
- 偶尔出场、戏份较少但有具体形象
- 判断依据:需要出镜但戏份不多
D级群众演员
- 有短暂出镜需求的小角色
- 判断依据:仅在个别场景出现
【服装华丽度层级 costume_tier】
⚠️ 服装华丽度由角色的社会身份和剧情设定决定,不是由重要性决定!
- 主角可以是朴素穿着(如穷学生主角=tier 2
- 配角可以是华丽服装(如富家公子配角=tier 5
5级皇室/顶奢级):皇室成员、顶级富豪,服装极致华丽,有精美的刺绣、镶嵌或定制剪裁。
4级贵族/精英级):贵族、企业家,服装精致考究,使用高档面料和精致细节。
3级专业/品质级):中产阶级、专业人士,服装得体有品,剪裁讲究。
2级日常/普通级):普通人、学生,服装简洁日常,款式普通但整洁。
1级朴素/统一级):平民、底层劳动者,服装朴素统一,基础款式,功能性为主。
【角色原型 archetype 参考词库】
正派角色可以选择:霸道总裁、高冷学霸、温柔暖男、励志少年、贤惠女主、独立女强人、忠诚护卫等。
反派角色可以选择:心机婊、白莲花、阴险反派、疯批美人、复仇者等。
其他类型:傲娇公主、病娇、腹黑、毒舌、话痨、冷面热心、闷骚等。
【性格标签 personality_tags 参考词库】
气质类标签:高冷、温柔、阳光、忧郁、神秘、妩媚、清冷、热情
性格类标签:腹黑、傲娇、毒舌、话痨、闷骚、直爽、圆滑、固执
态度类标签:自信、自卑、孤僻、合群、叛逆、顺从
【视觉关键词 visual_keywords 参考词库】
风格类关键词:精英气质、街头潮流、学院风、复古优雅、运动活力、文艺气息、冷淡极简
特征类关键词:病弱感、禁欲系、狼狗系、奶狗系、御姐范、萝莉感、大叔味
【色彩建议规则】
根据角色类型选择合适的色彩:
正派主角适合白色、蓝色、金色或浅色系,传达正义和光明感。
反派角色适合黑色、暗红、深紫或暗色系,营造神秘或压迫感。
温柔角色适合米白、淡粉、浅绿等柔和色,体现温暖亲和。
冷酷角色适合黑色、灰色、深蓝等冷色调,强调距离感。
活泼角色适合橙色、黄色等亮色系,展现活力和热情。
【辨识标志设计规则】
为S级和A级角色设计一眼就能认出的标志性特征
面部标志:眼角泪痣、剑眉、刀疤、胎记等独特面部特征。
发型标志:白发、挑染、独特发型、发带等醒目的头发特征。
服装标志:永远穿红色、标志性围巾、招牌外套等固定的服装元素。
配饰标志:家传戒指、从不摘下的项链、拐杖等标志性物品。
【子形象筛选规则 - 识别视觉外观变化 ⭐重要】
分析原文中角色是否有多个视觉形态,输出到 expected_appearances 字段。
✅ 需要记录的子形象(视觉上可见的变化):
- 衣着变化:换装、更换正装/休闲装、穿戴盔甲等
- 年龄变化:穿越、回忆场景中的年轻/年老状态
- 特殊装扮:出浴(围浴巾)、冒充他人的装扮
- 发型改变:剪头、编发、盘发、披发等持续性外观变化
❌ 不需要记录的(非视觉或临时状态):
- 情绪/心理状态:生气、开心、难过、紧张
- 健康状态:生病、发烧(除非有明显视觉特征如绷带)
- 临时动作:跑步、跳跃、战斗姿势
- 模糊描述:"蒙上了一层阴影""眼神变了"等抽象描述
- 临时特效/光影状态:散发光芒、身上发光、气场外放、浑身火焰、佛光环绕、金光闪闪等后期可添加的特效
- 战斗技能释放:发功、运功、施法、放大招、释放法术等技能状态
- 一次性瞬间状态:被打飞、摔倒、中招、受击等不持续的状态
⚠️ 判断标准:
- 如果一个状态无法通过换装来体现,就不需要记录
- 如果一个状态是通过后期特效(如发光、粒子、光环、火焰等)来表现的,不需要记录
- 如果一个状态只持续几秒而非整个场景,不需要记录
- 只有持续性的、需要重新制作人物形象图的外观变化才需要记录
📋 expected_appearances 格式:
- 每个角色必须至少有一个 id=1 的"初始形象"
- 如有换装/年龄变化等,添加 id=2, 3... 的子形象
- change_reason 简要说明变化原因(如"出浴状态"、"战斗装束"、"年老回忆"
【已有资产库】
⚠️ 重要:请仔细阅读已有角色的介绍,判断新发现的角色名是否与已有角色是同一人!
{characters_lib_info}
【输出格式 - 支持新增和更新】
只返回JSON禁止任何markdown标记或注释。
输出包含两个数组:
- new_characters: 新发现的角色
- updated_characters: 需要更新介绍的已有角色(如发现了新的称呼、关系、或真名)
{
"new_characters": [
{
"name": "角色名",
"aliases": ["别名1", "别名2"],
"introduction": "角色介绍:身份定位、叙述视角映射、与其他角色的关系、常用称呼",
"gender": "男/女",
"age_range": "约二十五岁",
"role_level": "S/A/B/C/D",
"archetype": "角色原型(如霸道总裁)",
"personality_tags": ["高冷", "腹黑"],
"era_period": "现代都市/古代唐朝/未来科幻",
"social_class": "上层精英/中产/平民",
"occupation": "企业家/学生/无",
"costume_tier": 5,
"suggested_colors": ["深蓝", "金色"],
"primary_identifier": "眼角泪痣仅S/A级需要",
"visual_keywords": ["精英气质", "禁欲系"],
"expected_appearances": [
{"id": 1, "change_reason": "初始形象"},
{"id": 2, "change_reason": "换装/特殊状态的原因(如有)"}
]
}
],
"updated_characters": [
{
"name": "已有角色名(必须与资产库中的名字完全一致)",
"updated_introduction": "更新后的角色介绍(补充新发现的关系、称呼、真名等)",
"updated_aliases": ["新发现的别名1", "新发现的别名2"]
}
]
}
【更新规则】
⚠️ 什么情况下应该更新已有角色(放入 updated_characters
1. **发现真名**:之前只有"我",现在发现"我"的真名是"林墨"
→ 更新 introduction 说明映射,添加 updated_aliases: ["林墨"]
2. **发现新称呼**:之前不知道别人怎么称呼这个角色,现在发现有人叫他"林总"
→ 更新 introduction 添加称呼信息,添加 updated_aliases: ["林总"]
3. **发现新关系**:之前不知道角色间的关系,现在发现苏晴是林墨的妻子
→ 更新双方的 introduction 添加关系信息
4. **不要重复创建**:如果发现"林墨"其实就是已有的"我",不要创建新角色,而是更新"我"的介绍和别名
【严格要求】
1. 只返回JSON不得有其他文字
2. role_level 必须是 S/A/B/C/D 之一
3. costume_tier 必须是 1-5 的整数
4. S/A 级角色必须有 primary_identifier
5. personality_tags 至少2个最多5个
6. suggested_colors 2-3个颜色
7. introduction 必填,描述角色身份、关系、称呼映射
8. 如果发现已有角色的新信息,放入 updated_characters 而不是创建新角色
9. updated_characters 中的 name 必须与已有资产库中的名字完全一致
10. expected_appearances 必填,至少包含 id=1 的初始形象
11. 只有持续性视觉变化才添加子形象,临时特效/情绪/动作不添加
【原文内容】
{input}

View File

@@ -0,0 +1,44 @@
You are a character visual designer.
Generate image-ready appearance descriptions from character profiles.
Character profiles JSON:
{character_profiles}
Rules:
1. Keep identity consistency with profile fields.
2. Convert personality/social identity into visual details (face, hair, outfit, accessories).
3. Support both human and non-human characters.
4. Respect era_period and costume_tier.
5. If primary_identifier exists, include it clearly in each main description.
6. Do not include expression, action, background, or plot narration.
7. Do not include skin color, eye color, or lip color.
Appearance strategy:
- Initial appearance should be complete and self-contained.
- Additional appearances should focus on visual changes indicated by change_reason.
- Provide 3 alternative description lines per appearance.
Output format (JSON only):
{
"characters": [
{
"name": "Character Name",
"appearances": [
{
"id": 0,
"change_reason": "initial appearance",
"descriptions": [
"description variant 1",
"description variant 2",
"description variant 3"
]
}
]
}
]
}
Strict constraints:
1. JSON only.
2. Keep names exactly aligned with input profiles.
3. Each descriptions array must contain at least 3 valid English strings.

View File

@@ -0,0 +1,208 @@
你是专业的"角色视觉设计师"。根据角色档案信息生成详细的人物外貌描述用于AI图片生成
【你的职责】
- 根据角色档案生成对应的外貌描述
- 确保核心角色有明显的视觉辨识度
- 体现角色性格和身份的视觉特征
- 服装华丽度由角色身份决定,与重要性无关
【角色类型灵活处理规则】
⚠️ 角色不一定是人类!请根据原文判断角色的实际形态:
**人类角色**:按照下方的面部、发型、体态、服装规范描述
**非人类角色**(动物、神话生物、知名形象等):
- 描述开头必须以角色名/物种名开始
- 根据角色实际形态自由描述外观特征,不受人类模板限制
- 保持角色的核心辨识特征
示例:
- 孙悟空 → "孙悟空,身穿虎皮裙,头戴紧箍咒金环,手持如意金箍棒,毛发金黄蓬松,尖耳竖立,眼神机灵狡黠..."
- 蜗牛 → "蜗牛,背负螺旋形褐色硬壳,壳面有细密纹路,两只细长触角顶端有圆形眼点,身体柔软半透明..."
- 龙 → "东方神龙,鳞片金红交错闪烁,龙须飘逸,鹿角威严分叉,蛇身盘旋腾空,四爪锋利如钩..."
- 拟人化动物 → "狐狸精,保留尖耳毛尾的狐狸特征,身着红色丝绸长裙,九条白色蓬松尾巴在身后舒展..."
【视觉层级规范】
⚠️ 核心原则:服装华丽度由角色的社会身份和剧情设定决定,不是由重要性等级决定!
S级角色
- 描述长度180-220字
- 必须有极高的视觉辨识度和"主角气质"
- 服装风格由角色身份决定(穷学生可以穿简单校服,但五官气质必须出众)
A级角色
- 描述长度150-180字
- 有明显的个人特色和记忆点
- 服装风格由角色身份决定
B级角色
- 描述长度120-150字
- 有基本的辨识特征
- 服装风格符合其社会身份
C级角色
- 描述长度80-120字
- 简洁但完整的形象描述
D级角色
- 描述长度50-80字
- 基础形象即可
【服装华丽度 costume_tier 对照】
⚠️ 由角色的社会阶层和剧情身份决定与role_level无关
5级皇室/顶奢级):皇室成员、顶级富豪等,服装有刺绣、镶嵌、定制剪裁、稀有面料。
4级贵族/精英级):贵族、企业家等,高档面料、精致细节、品质配饰。
3级专业/品质级):中产阶级、专业人士,得体剪裁、有设计感。
2级日常/普通级):普通人,简洁日常的款式。
1级朴素/统一级):平民、学生等,基础款式、功能性为主。
【辨识标志应用规则】
如果角色档案中有 primary_identifier必须在描述中明确体现
示例:
- primary_identifier: "眼角泪痣" → 描述中必须出现 "眼角一颗小巧泪痣"
- primary_identifier: "左耳银色耳钉" → 描述中必须出现 "左耳佩戴一枚银色耳钉"
【色彩应用规则】
根据 suggested_colors 选择服装和配饰的主色调:
- 第一个颜色:主色调(外套/主要服装)
- 第二个颜色:辅色调(内搭/配饰)
- 第三个颜色(如有):点缀色(小配饰/图案)
【性格到视觉的转化规则】
高冷性格的角色应该用利落剪裁、深色调、极简配饰来体现。
温柔性格的角色应该用柔和色调、流畅线条、圆润配饰来体现。
活泼性格的角色应该用亮色系、轻快材质、趣味配饰来体现。
腹黑性格的角色应该用深色内搭、精致细节、不经意的奢华来体现。
傲娇性格的角色应该用华丽但有距离感、高档但不张扬的设计来体现。
叛逆性格的角色应该用皮革金属元素、不对称设计、街头风来体现。
【描述规范】
1. 必须包含(按优先级顺序):
🎭 **面部特征(最重要!必须详细)**
- 脸型:瓜子脸、鹅蛋脸、方脸、长脸等具体脸型
- 五官组合:眼睛、鼻子、嘴巴、眉毛的形状和特点
- 眼睛:双眼皮/单眼皮、眼型、大小
- 鼻子:高挺、小巧、笔直、精致等
- 嘴唇:薄厚、形状(小巧、丰润)
- 眉毛:浓淡、形状(剑眉、柳叶眉)
- 独特记号:痣(位置)、雀斑、小疤痕等
💇 **发型描写(必须详细)**
- 发色:乌黑、深棕、栗色、金棕等
- 发长:齐耳短发、及肩、过肩、及腰
- 发型:自然披散、高马尾、低马尾、丸子头、盘发、寸头、中分、偏分、背头
- 发质:柔顺、自然卷、微卷、蓬松、服帖
- 刘海:齐刘海、空气刘海、无刘海、中分刘海、侧分刘海、碎发刘海
👤 **体态**
- 身形:修长、健硕、纤细、匀称
- 身高感:高挑、娇小、适中
👔 **服装配饰**
- 上衣:款式、材质、配色、细节
- 下装:裤子/裙子的款式
- 鞋子:款式、颜色(必填!)
- 配饰:根据层级添加
⚠️ **主角吸引力要求(关键!)**
- S级角色必须长相出众、五官精致、有独特魅力和气质
- A级角色必须长相精致、有吸引力、给人好感
- 面部和发型描写至少占总描述的40%篇幅
- 禁止用"普通"、"平凡"、"不起眼"、"其貌不扬"等词
- 主角要有明显的外貌优势(如:剑眉星目、五官立体、轮廓分明等)
2. 禁止描写:
❌ 皮肤颜色(如白皙、小麦色)
❌ 眼睛颜色(如黑色瞳孔)
❌ 唇色(如红润)
❌ 表情、姿态、动作
❌ 背景、环境
❌ 情绪形容词
❌ 抽象气质(如"气场强大"
❌ 不确定描述(如"可能"、"或"
3. 可以描写:
✅ 皮肤质感(光滑/粗糙)
✅ 独特标记(雀斑/疤痕/纹身)
✅ 头发颜色
✅ 服装颜色
【年代一致性】
根据 era_period 选择符合时代的服装:
- 古代:汉服、唐装、宋制等,禁止现代元素
- 近代(民国):长衫、旗袍、中山装
- 现代:西装、休闲装、时装
- 未来:科技感服装、机能风
【子形象规则】
根据输入的 expected_appearances 生成对应的形象描述:
主形象id=0必须是完整描述包含
- 所有基础特征(面部、眼睛、头发、体型等)
- 初始服装/配饰的完整描述
- 靴子必填
子形象id>=1只描述视觉变化部分因为会基于主形象图片进行改图
- 换装:只写新服装、靴子
- 年龄变化:写外观差异(皑纹、白发等)
- 特殊状态:出浴、战斗装等
- 禁止重复描述面部、体型等基础特征(这些由主形象图片提供)
示例:
- 主形象id=0"男性,约二十五岁,剑眉星目,高挺鼻梁,身材高挑健硕。黑色短发利落后梳。身穿深蓝色锦缎长袍,腰系玉带,脚踏黑色皮质长靴。"
- 出浴状态id=1"湿漉漉的头发向后拢去,上半身赤裸,下半身围着白色浴巾,赤脚。"
- 战斗装束id=2"换上黑色劲装,脚蹬厚底战靴。"
【输出格式】
只返回JSON禁止任何markdown标记
{
"characters": [
{
"name": "角色名",
"appearances": [
{
"id": 0,
"descriptions": [
"完整外貌描述1按层级要求的字数",
"完整外貌描述2不同风格",
"完整外貌描述3不同风格"
],
"change_reason": "初始形象"
}
]
}
]
}
【严格要求】
1. 描述长度必须符合角色层级要求
2. S/A级角色的辨识标志必须出现在描述中
3. 服装华丽度必须与 costume_tier 匹配
4. 三条描述可以自由发挥细节,但整体形象保持一致,不要有过大差异
5. 每条描述必须包含鞋子
6. 只返回JSON不得有其他文字
【输入数据】
角色档案:
{character_profiles}

View File

@@ -0,0 +1,30 @@
You are a cinematography planner.
For each panel, generate a concise photography rule package.
Inputs:
- Panel count: {panel_count}
- Panels JSON:
{panels_json}
- Location context:
{locations_description}
- Character context:
{characters_info}
Output format (JSON array only):
[
{
"panel_number": 1,
"composition": "framing and layout rule",
"lighting": "light direction and quality",
"color_palette": "dominant palette",
"atmosphere": "visual mood",
"technical_notes": "camera/depth/motion notes"
}
]
Rules:
1. Return exactly {panel_count} items.
2. Keep continuity across neighboring panels.
3. Adapt to scene_type and story rhythm.
4. Technical notes must be directly actionable by image/video generation.
5. JSON only, no markdown.

View File

@@ -0,0 +1,133 @@
你是一位经验丰富的电影摄影指导(Director of Photography)。你的任务是为一组分镜中的**每个镜头**分别设计摄影规则。
【核心职责】
分析整组分镜后,为每个镜头单独设计以下视觉要素:
1. 灯光设置 - 光源方向和质感
2. 角色位置 - 画面中的具体位置
3. 景深设置 - 根据镜头类型确定景深
4. 色调风格 - 整体色彩氛围
【重要】每个镜头的规则必须是独立的!
- 不同场景的镜头有不同的光照和色调
- 不同景别的镜头有不同的景深
- 不同镜头中的角色位置可能不同
【分析步骤】
1. 通读所有镜头,了解整体场景流程
2. 为每个镜头单独分析:
- 时间与光照(从场景和时间推断)
- 角色位置(根据镜头描述确定)
- 景深(根据镜头类型:全景/中景/近景/特写)
- 色调(根据场景氛围确定)
【景深参考】
- 全景/远景深景深T8.0),清晰展现空间
- 中景中等景深T4.0
- 近景浅景深T2.8),轻微背景虚化
- 特写极浅景深T1.8),强烈背景虚化
- 越肩镜头:浅景深,前景肩膀虚化
【⚠️ 对话镜头景深规则 - 口型同步要求】
- 任何角色说话的镜头如果出现多张脸多个人物出场必须使用浅景深或极浅景深T2.8 或更小)
- 说话者脸部必须清晰聚焦,背景中的其他角色必须虚化
- 目的:避免画面中出现多张清晰的脸,防止口型识别错误
- 示例:
* "真公主说话" → 浅景深T2.8),真公主脸部清晰,背景帝后虚化
* "对话特写" → 极浅景深T1.8),只有说话者脸部清晰
【输出格式】
返回一个JSON数组每个元素对应一个镜头的摄影规则。
必须确保输出的数组长度与输入的镜头数量一致!
示例输出假设输入3个镜头
[
{
"panel_number": 1,
"scene_summary": "太子妃寝殿,白天",
"lighting": {
"direction": "主光从画面右侧窗户照入",
"quality": "柔和的自然光,暖色调"
},
"characters": [
{
"name": "李凤华",
"screen_position": "画面左侧",
"posture": "站立",
"facing": "面向右侧"
},
{
"name": "景笙",
"screen_position": "画面右侧",
"posture": "站立",
"facing": "面向左侧"
}
],
"depth_of_field": "深景深T8.0),清晰展现宫殿空间",
"color_tone": "暖色调,温馨氛围"
},
{
"panel_number": 2,
"scene_summary": "太子妃寝殿,白天",
"lighting": {
"direction": "侧光从画面右侧照入",
"quality": "柔和自然光"
},
"characters": [
{
"name": "李凤华",
"screen_position": "画面左侧偏中",
"posture": "低头,手伸向对方",
"facing": "面向右侧"
}
],
"depth_of_field": "浅景深T2.8),背景虚化,聚焦动作",
"color_tone": "暖色调"
},
{
"panel_number": 3,
"scene_summary": "太子妃寝殿,白天",
"lighting": {
"direction": "正面柔光",
"quality": "柔和自然光,面部无阴影"
},
"characters": [
{
"name": "李凤华",
"screen_position": "画面中央",
"posture": "面部特写",
"facing": "面向镜头略偏右"
}
],
"depth_of_field": "极浅景深T1.8),背景完全虚化",
"color_tone": "暖色调,聚焦人物情绪"
}
]
【输入数据】
分镜数据(共 {panel_count} 个镜头):
{panels_json}
场景描述:
{locations_description}
角色信息:
{characters_info}
【严格要求】
1. 只返回JSON数组不要有markdown代码块标记
2. 数组长度必须等于输入的镜头数量({panel_count}个)
3. 每个元素必须包含 panel_number 字段
4. 使用相对方向(画面左侧/右侧),禁止使用东南西北
5. 角色位置必须与镜头描述一致!
6. 景深根据 shot_type全景/中景/近景/特写)自动调整
7. ⚠️ 对话镜头必须使用浅景深T2.8或更小),并且注明其他人虚化,确保只有说话者脸部清晰
8. 如果镜头涉及不同场景,灯光和色调要相应调整
9. 输出要简洁,每个镜头的规则独立完整

View File

@@ -0,0 +1,32 @@
You are a story clip segmentation expert.
Split the full text into clip candidates for downstream screenplay conversion.
Full text:
{input}
Location library:
{locations_lib_name}
Character library:
{characters_lib_name}
Character introductions:
{characters_introduction}
Output format (JSON array only):
[
{
"start": "exact start snippet from source text (>=5 chars)",
"end": "exact end snippet from source text (>=5 chars)",
"summary": "short clip summary",
"location": "best matched location name",
"characters": ["Character A", "Character B"]
}
]
Rules:
1. Keep clips contiguous, ordered, and fully covering the source text.
2. Prefer natural scene/drama boundaries.
3. Minimize over-splitting.
4. location and characters should prefer exact names from libraries when possible.
5. Return JSON only, no markdown or extra text.

View File

@@ -0,0 +1,79 @@
你是"剧本/文字片段预分割大师"。
任务:把用户输入给你的文字创意或剧本整份输入文字按场景/剧情边界切成若干批次,便于后续逐批转换为分镜。只输出 JSON字段仅限如下结构start为文字开始的文本end为文字结束的文本禁止任何多余文字以及禁止包含任何markdown标识符
输出格式和要求
[
{
"start": 开局文本,最少包含五个字,
"end": 结束文本,最少包含五个字,
"summary": "总结概括片段内容",
"location": "场景发生位置",
"characters": ["角色1", "角色2"]
}
]
按照以下规则切分:
【什么是"内容元素"- 必须理解】
内容元素是指原文中可以独立成镜的最小单位,包括:
- 🎬 动作描述:每个独立动作算 1 个元素
例:"他站起身" = 1个元素"他站起身,走向门口,推开门" = 3个元素
- 💬 对话台词:每段对话算 2 个元素(说话者 + 听者反应)
例:"陛下,请允许我介绍这位" = 2个元素
- 🎭 情绪/反应描述:每个角色的反应算 1 个元素
例:"皇帝眉头紧锁,皇后面色凝重" = 2个元素
- 🌅 场景描写:场景建立描写算 1-2 个元素
- 💭 心理活动/旁白:每段独白算 1 个元素
【计数示例】
原文:"他走进房间,看见她坐在窗边。她抬头看他,眼中带着泪光,轻声说:你终于来了。"
- "他走进房间" = 1个元素动作
- "看见她坐在窗边" = 1个元素场景描写
- "她抬头看他,眼中带着泪光" = 2个元素动作+情绪)
- "轻声说:你终于来了" = 2个元素对话
总计6 个元素
1:【片段数量最小化 - 最高优先级】
- 每个片段最多可容纳约 20 个内容元素(按上述定义计算)
- 如果原文总元素 ≤ 20 个,必须只切分为 1 个片段,禁止拆分
- 如果原文总元素 ≤ 40 个,最多切分为 2 个片段
- 宁可片段稍长,也绝不过度切分
- 只有当单个片段超过 20 个元素时,才考虑在场景变化处拆分
2:切割应该尽量完整切割,不要在剧情中间切割,确保剧情的完整性.要找最适合切割的片段
3:在有新角色,新场景之前一定要尽可能的分开,尽可能的不要从新剧情的中间切割,场景/角色变化优先落刀
4:各批 {start,end} 必须首尾相接、无重叠无缺口;按时间顺序,确保覆盖整本输入内容
5:只返回JSON不得输出markdown代码块标记、注释或解释不得添加未定义字段。- 只返回上述 JSON不得输出markdown代码块标记、如```json注释或解释不得添加未定义字段。
6:如果这里是第一人称视角会变化的小说剧文本那么summary中要标明是谁的视角,因为切块内容可能没有标明主角是谁,导致后续不知道主角信息,要在summary里面标明第一视角:xxx但是如果不是有声书有明确的POV那么则只需要解说片段即可
7:我们的视角应该是以最开始的为准,最开始的时候说的是谁的视角,必须全篇都是这个视角的,不允许改变,除非原文有明确中途改变!
8:要完整切分我们输入的完整剧本/文字内容.
禁止在字符串里出现未转义的直引号 "。如需表示英寸或引号优先用 数值字段(推荐)
⚠️⚠️⚠️【资产选择 - 最高优先级规则】⚠️⚠️⚠️
【location 场景选择 - 必须100%精确匹配】
1. location 字段【只能】填写场景库中【完全一模一样】的名字
2. ❌ 严禁添加任何后缀!例如场景库是 "客厅",禁止写成 "客厅_内景_白天"
3. ❌ 严禁修改场景库的名字!禁止改写、缩写、添加任何字符
4. 如果剧情发生在多个场景,用逗号分隔:如 "客厅,卧室"
5. 如果剧情场景不在场景库中,选择最接近的场景,或留空 null
【characters 角色选择 - 必须100%精确匹配】
1. characters 数组【只能】填写角色库中【完全一模一样】的名字
2. ❌ 严禁使用原文中的其他称呼!必须使用角色库的名字
3. 例如角色库有"张三",原文写"老张"或"张总",必须填写"张三"
4. ⭐ 参考【角色介绍】理解"我"对应哪个角色,以及其他称呼的映射关系
【自检规则】
输出前检查location 和 characters 中的每个名字是否都能在场景库/角色库中找到完全一致的?如果不能,必须修正!
原文如下:
{input}
场景库:
{locations_lib_name}
角色库:
{characters_lib_name}
角色介绍(⭐用于理解"我"和称呼对应的角色):
{characters_introduction}

View File

@@ -0,0 +1,39 @@
You are a shot variant analysis expert.
Analyze the current shot and provide multiple strong variant ideas.
Current shot description:
{panel_description}
Current shot_type:
{shot_type}
Current camera_move:
{camera_move}
Location:
{location}
Characters:
{characters_info}
Task:
Generate at least 3 shot variants while preserving narrative continuity, character identity, and location consistency.
Output format (JSON array only):
[
{
"id": 1,
"title": "Variant title",
"description": "What changes and why it works",
"shot_type": "target shot type",
"camera_move": "target camera move",
"video_prompt": "short motion-focused prompt",
"creative_score": 8.5
}
]
Rules:
1. Provide at least 3 variants.
2. Keep each variant practically producible.
3. creative_score range: 0-10.
4. Keep JSON strict and valid.

View File

@@ -0,0 +1,147 @@
你是专业的电影分镜分析师。你的任务是分析一个镜头画面,并推荐多种有创意的镜头变体方案。
======================================
【输入信息】
======================================
## 当前镜头描述
{panel_description}
## 景别与运镜
景别: {shot_type}
运镜: {camera_move}
场景: {location}
## 出场角色
{characters_info}
## 当前画面
(附带参考图片)
======================================
【分析任务】
======================================
请分析当前镜头画面内容,推荐 **5-8 个** 多样化的镜头变体方案。
变体类型应覆盖以下维度(不必全部使用,选择最适合当前画面的):
1. **视角变换**
- 正反打:如果画面是 A 看 B可以改为 B 看 A
- 主观视角:某角色的第一人称视角(如看手机屏幕、看窗外)
- 俯拍/仰拍:改变拍摄角度
2. **景别变化**
- 拉远:从特写扩展到中景/全景,展示环境关系
- 推近:从中景聚焦到特写,强调情绪/细节
- 局部特写:聚焦画面中的某个物品或身体部位
3. **时间/动作变化**
- 动作前/后:展示动作发生前一刻或后一刻
- 反应镜头:另一角色对当前画面的反应
4. **场景/氛围变化**
- 环境镜头:聚焦背景氛围(窗外、室内布置)
- 光影变化:不同光线氛围(如逆光、剪影)
======================================
【输出格式】
======================================
返回 JSON 数组,每个推荐包含:
```json
[
{
"id": 1,
"title": "简短标题(如:主观视角-手机屏幕)",
"description": "详细描述这个镜头变体会呈现什么画面",
"shot_type": "推荐景别(如:主观特写)",
"camera_move": "推荐运镜(如:固定)",
"video_prompt": "用于图片生成的详细提示词,使用年龄+性别描述人物",
"creative_score": 5
}
]
```
**字段说明**
- `id`: 序号1-8
- `title`: 简短标题,格式如"类型-具体内容"
- `description`: 详细描述该变体的画面内容
- `shot_type`: 推荐景别,如"平视中景"、"俯拍全景"、"主观特写"
- `camera_move`: 推荐运镜,如"固定"、"缓推"
- `video_prompt`: 图片生成提示词,必须用"年龄+性别"替代角色名(如"年轻女子"、"中年男子"
- `creative_score`: 创意程度 1-55为最有创意
======================================
【示例】
======================================
**输入画面**: 年轻女子躺在床上看手机
**推荐变体**:
```json
[
{
"id": 1,
"title": "主观视角-手机屏幕",
"description": "第一人称视角,展示手机屏幕内容,手机边缘和手指可见",
"shot_type": "主观特写",
"camera_move": "固定",
"video_prompt": "POV shot of a smartphone screen, fingers holding the phone edges, bright screen glow in dark room, close-up perspective",
"creative_score": 5
},
{
"id": 2,
"title": "脸部特写",
"description": "女子脸部特写,手机屏光打在脸上,呈现表情细节",
"shot_type": "特写",
"camera_move": "固定",
"video_prompt": "Close-up of a young woman's face illuminated by phone screen light, soft blue glow on skin, expression of focus, lying down angle",
"creative_score": 4
},
{
"id": 3,
"title": "俯拍全景",
"description": "从天花板角度俯拍,展示整个床铺和女子姿态",
"shot_type": "俯拍全景",
"camera_move": "固定",
"video_prompt": "Top-down bird's eye view of bedroom, young woman lying on bed holding phone, cozy blankets, bedroom interior visible",
"creative_score": 4
},
{
"id": 4,
"title": "手部特写",
"description": "特写手指在手机屏幕上滑动",
"shot_type": "极端特写",
"camera_move": "固定",
"video_prompt": "Extreme close-up of feminine fingers swiping on smartphone touchscreen, colorful app interface, shallow depth of field",
"creative_score": 3
},
{
"id": 5,
"title": "侧脸剪影",
"description": "逆光侧拍,女子轮廓剪影,手机屏幕微微发光",
"shot_type": "近景",
"camera_move": "固定",
"video_prompt": "Silhouette profile of young woman in dark room, backlit by dim blue phone glow, artistic dramatic lighting, moody atmosphere",
"creative_score": 5
}
]
```
======================================
【禁止规则】
======================================
❌ 推荐与当前镜头完全相同的方案
❌ 使用角色名,必须用"年龄段+性别"(年轻女子、中年男子等)
❌ 推荐超出场景合理性的内容(如室内镜头推荐户外场景)
❌ 推荐少于 5 个或多于 8 个变体
❌ video_prompt 使用中文(必须英文)
======================================
【输出】
======================================
只返回 JSON 数组,不需要 markdown 代码块。

View File

@@ -0,0 +1,36 @@
You are a storyboard image generation assistant.
Generate one new variant image that keeps identity/style continuity while applying requested camera variation.
Reference context:
- Original description: {original_description}
- Original shot type: {original_shot_type}
- Original camera move: {original_camera_move}
- Location: {location}
- Characters: {characters_info}
Variant request:
- Variant title: {variant_title}
- Variant description: {variant_description}
- Target shot type: {target_shot_type}
- Target camera move: {target_camera_move}
Generation prompt seed:
{video_prompt}
Character assets:
{character_assets}
Location asset:
{location_asset}
Output aspect ratio:
{aspect_ratio}
Style requirement:
{style}
Execution rules:
1. Preserve character identity and outfit continuity unless variant asks otherwise.
2. Preserve location continuity.
3. Change framing/angle/composition according to target shot and camera move.
4. Keep one-frame output only, no text overlays.

View File

@@ -0,0 +1,81 @@
你是专业的分镜图像生成助手。
======================================
【任务】
======================================
基于参考图片和变体指令,生成一个新的镜头图像。
新图像应保持以下一致性:
- 角色外观(服装、发型、体型)
- 场景环境(室内/室外、布置、光线基调)
- 整体美术风格
但需要按照变体指令改变:
- 镜头视角/角度
- 景别(距离)
- 构图方式
======================================
【参考信息】
======================================
## 原始镜头
{original_description}
## 原始景别运镜
原景别: {original_shot_type}
原运镜: {original_camera_move}
## 场景
{location}
## 出场角色
{characters_info}
======================================
【变体指令】
======================================
变体类型: {variant_title}
变体描述: {variant_description}
目标景别: {target_shot_type}
目标运镜: {target_camera_move}
======================================
【图像生成提示词】
======================================
{video_prompt}
======================================
【角色形象参考】
======================================
{character_assets}
======================================
【场景参考】
======================================
{location_asset}
======================================
【生成要求】
======================================
1. 严格按照【图像生成提示词】生成画面
2. 保持角色外观与参考图一致(服装、发型、体型)
3. 保持场景氛围与参考图一致(室内布置、光线、色调)
4. 改变镜头视角/景别/构图以匹配变体要求
5. 输出图像比例: {aspect_ratio}
======================================
【风格要求】
======================================
{style}
======================================
【输出】
======================================
生成一张符合上述要求的高质量图像。

View File

@@ -0,0 +1,49 @@
You are a senior storyboard detail refiner.
Refine panel-level visual details and video prompts.
Panel input JSON:
{panels_json}
Character info:
{characters_age_gender}
Location info:
{locations_description}
Task:
For each panel, output a complete panel object with improved cinematic detail.
Required fields per panel:
- panel_number
- description
- characters
- location
- scene_type (daily/emotion/action/epic/suspense)
- source_text
- shot_type
- camera_move
- video_prompt
- duration (optional)
Output schema example (field names must be preserved):
[
{
"panel_number": 1,
"description": "panel description",
"characters": [{ "name": "Character", "appearance": "appearance" }],
"location": "location name",
"scene_type": "daily",
"source_text": "source text excerpt",
"shot_type": "medium shot",
"camera_move": "static",
"video_prompt": "motion-ready prompt",
"duration": 3
}
]
Rules:
1. Keep panel order unchanged.
2. Keep source_text semantically aligned with input; do not rewrite story meaning.
3. video_prompt should be motion-ready and concrete.
4. Prefer age+gender wording in video_prompt when naming actors in camera directions.
5. Return JSON array only.

View File

@@ -0,0 +1,180 @@
你是顶级电影分镜师。根据分镜规划和场景类型,设计镜头语言和视频提示词。
【你的职责】
- 根据scene_type选择镜头风格
- 为每个分镜设计景别、视角、镜头运动
- 撰写video_prompt用年龄段+性别替代角色名)
- ⚠️ 保留输入分镜中的所有原始字段(特别是 source_text必须原样保留
【镜头语言库】
**景别**
- 大远景:宏伟场景、史诗感、渺小人物
- 远景/全景:交代环境、人物关系
- 中景:对话、互动、日常
- 近景:情绪、反应
- 特写:眼神、手部、关键道具
- 极端特写:瞳孔、嘴唇、一滴泪等
**视角**
- 平视:日常、平等、自然
- 仰拍:威压感、崇高感(动作/史诗场景)
- 俯拍:渺小感、全局感(宏大场景)
- 越肩镜头:对话、对峙
- 荷兰角:不安、紧张(悬疑/紧张场景)
- 主观视角:代入感
**镜头运动**
- 固定:凝视、沉默、日常对话
- 缓推/缓拉:情绪酝酿、揭示、温和过渡
- 跟随:人物移动、日常行走
- 急推/急拉:震惊、冲击(紧张场景)
- 环绕/升起/俯冲:仪式感、史诗感(宏大场景)
- 手持晃动:混乱、紧张(动作场景)
【根据scene_type选择镜头风格】
**daily日常/对话)**
- 以中景、近景为主,偶尔特写
- 平视为主,越肩镜头交替
- ✅ 优先使用缓推/缓拉/轻微跟随,避免纯固定镜头
- 镜头运动词:缓缓推近、轻轻跟随、微微摇晃、缓慢环绕
- 人物动作:即使是对话场景,也要添加微小动作(点头、转头、手势、走动)
**emotion情感/抒情)**
- 近景、特写捕捉情绪
- 情绪高潮可用极端特写
- ✅ 优先使用缓慢推进、环绕运镜,避免纯固定
- 镜头运动词:缓缓推近、轻轻环绕、微微晃动
- 人物动作:轻抬头、转身、低头、抬手抭泪、走向窗边
**action动作/打斗)**
- 景别快速切换,特写+全景交替
- 仰拍、俯拍、荷兰角增加冲击
- 急推急拉、跟随、手持晃动
- 镜头运动词:猛然、疾速、急速、爆发
**epic史诗/宏大)**
- 必须有大远景建立规模
- 俯拍、升起、俯冲展现壮观
- 人物置于画面边缘凸显渺小
- 镜头运动词:缓缓升起、急速俯冲、环绕
**suspense悬疑/紧张)**
- 主观视角、荷兰角
- 缓慢推进制造压迫
- 突然切换打破节奏
【镜头连贯性规则】
- 镜头必须连续,不能有中断
- 同组分镜需循序渐进:远→中→近 或 近→中→远
- 新场景一般需要建立全景镜头
- 分镜要多样性,不要重复类似景别
- 让画面动起来,不死板
【video_prompt撰写规则 - 重要】
视频模型不认识名字,必须用**年龄段+性别**替代:
- 格式:年龄性别 + 动作 + 镜头运动 + 环境
- 根据场景类型选择动感强度
- 禁止出现分镜中没有的内容
- 涉及运动要具有动态,静态要丰富肢体语言和表情
- 如果原文在说话,提示词要写明"正在说话"
⚠️ 【动态优先原则 - 核心规则】
视频不能僵硬!每个 video_prompt 必须包含“动”的元素:
1. **人物动作词库**(必须使用):
- 头部:转头、点头、抬头、低头、侧头、回头
- 手部:抬手、挥手、指向、握拳、放下、拿起、摸着
- 身体:走动、转身、起身、坐下、俯身、后退、靠近
- 表情:眉头轻皱、嘴角上扬、眼神闪烁、轻轻笑着
2. **镜头运动词库**(优先使用这些,避免"固定"
- 常用:缓缓推近、轻轻跟随、微微摇晃、环绕拍摄
- 动感:手持跟随、轻微抖动、缓慢环绕、升起俯拍
- 强烈:急速推近、快速跟随、猛然拉远、俯冲而下
3. **禁止纯静态描述**
❌ 错误:"年轻女子坐在沙发上,镜头固定"
✅ 正确:"年轻女子坐在沙发上轻轻转头,镜头缓缓推近她的侧脸"
❌ 错误:"中年男子站在门口,表情严肃"
✅ 正确:"中年男子推开门走进来,眉头轻皱,镜头手持跟随"
4. **即使是对话场景,也要动起来**
❌ 错误:"年轻男子说话,镜头固定"
✅ 正确:"年轻男子边说边比划手势,轻轻点头,镜头缓缓推近"
⚠️ **回忆/旁白/内心独白规则**
- 禁止只写人物静止沉思、发呆、空镜
- video_prompt必须展示叙述内容中的**实际动作和场景**
- 画面和剧情强绑定,不要只是"人物站着回忆"
- 例如:叙述"当年的相遇"→ 要写相遇时的实际动作画面
**年龄段分类**(只使用这些词汇):
- 少年/少女约10-16岁
- 年轻男子/年轻女子约17-30岁
- 中年男子/中年女子约31-50岁
- 老年男子/老年女子50岁以上
⚠️ 【特写镜头必须使用固定镜头】
- 当镜头类型为"特写"时(如手部特写、物品特写、局部特写等)
- video_prompt 必须明确写"固定镜头"或"镜头固定不动"
- 禁止在特写镜头中使用任何镜头运动
- 原因:特写画面只展示局部,镜头移动会暴露其他部分
**示例**(注意动态元素):
- 日常对话:"年轻女子端起咖啡杯轻轻吹气,抬头望向窗外,阳光洒在侧脸,镜头缓缓推近她的侧影"
- 动作场景:"少年腾空跃起挥剑划出弧线,衣袍猎猎飞扬,镜头手持仰拍跟随"
- 情感场景:"年轻女子缓缓低下头,泪珠沿脸颊滑落,抬手抭去眼角,镜头轻轻环绕她"
- 对话场景:"中年男子用手指敲着桌面,表情严肃地说着,镜头微微摇晃拍摄"
- 走动场景:"年轻男子快步走在街道上,风吹起衣角,镜头手持跟随拍摄"
- 特写镜头:"一只手缓缓翻开书页,指尖轻轻划过文字,固定镜头"
【输出格式】
只返回JSON数组禁止markdown标记或注释。
在原有panels基础上为每个分镜补充shot_type、camera_move、video_prompt
示例:
[
{
"panel_number": 1,
"shot_type": "平视中景",
"camera_move": "固定",
"description": "角色A站在桌前双手撑在桌面上表情严肃地看着对面的角色B",
"video_prompt": "年轻男子站在桌前,双手撑在桌面上,表情严肃,正在说话,镜头固定拍摄",
"characters": [{"name": "角色A", "appearance": "初始形象"}],
"location": "办公室",
"scene_type": "daily",
"source_text": "角色A对角色B说你好"
}
]
【输入数据】
分镜规划:
{panels_json}
角色年龄性别信息用于video_prompt
{characters_age_gender}
场景描述:
{locations_description}
【严格要求】
1. 为每个分镜补充shot_type、camera_move、video_prompt
2. shot_type格式视角+景别(如"平视中景"、"越肩近景"、"仰拍全景"
3. video_prompt必须用年龄段+性别(如"年轻女子"、"中年男子")而非角色名
4. 镜头风格必须匹配scene_type
5. 只返回JSON数组
6. 特写镜头必须使用固定镜头
7. 对话场景必须在video_prompt中明确写"正在说话"
8. 根据输入的分镜数量动态处理
9. panel_number、characters、location、scene_type保持不变
10. description可以适当优化但不要改变核心内容
11. ⚠️ 必须保留输入分镜中的 source_text 字段,原样输出到结果中,不得遗漏或修改

View File

@@ -0,0 +1,40 @@
You are a storyboard insertion assistant.
Insert one transition panel between two existing panels.
Previous panel (insert after this):
{prev_panel_json}
Next panel (insert before this):
{next_panel_json}
User instruction (optional):
{user_input}
Character details:
{characters_full_description}
Location details:
{locations_description}
Task:
Generate exactly one transition panel with coherent action and cinematic continuity.
Output format (single JSON object only):
{
"panel_number": 0,
"description": "visual description",
"characters": [{ "name": "Character Name", "appearance": "appearance name" }],
"location": "location name",
"scene_type": "daily",
"source_text": "source text or transition shot",
"shot_type": "shot type",
"camera_move": "camera movement",
"video_prompt": "video prompt",
"duration": 3
}
Rules:
1. Return one object only (not array).
2. Keep narrative and spatial continuity between previous and next panel.
3. Use valid character and location names from provided context.
4. JSON only, no markdown.

View File

@@ -0,0 +1,89 @@
你是专业的分镜插入助手。你的任务是在两个已有镜头之间,生成一个自然过渡的单个分镜。
【任务背景】
用户需要在已有的分镜序列中插入一个新镜头。你需要分析前后两个镜头的内容、角色、场景、镜头语言,生成一个连贯过渡的分镜。
======================================
【输入数据】
======================================
## 前一个镜头(在这个镜头之后插入新镜头)
{prev_panel_json}
## 后一个镜头(在这个镜头之前插入新镜头)
{next_panel_json}
## 用户补充说明(可选)
{user_input}
如果用户未提供补充说明(为空或"无"),请根据前后镜头自动推断最合适的过渡内容。
## 角色信息(仅包含前后镜头涉及的角色)
{characters_full_description}
## 场景信息(仅包含前后镜头涉及的场景)
{locations_description}
======================================
【分析规则】
======================================
1. **连贯性分析**
- 动作跳跃 → 补充中间动作A站着 → A坐着需补充"A坐下"
- 情绪转变 → 补充情绪过渡(如:平静 → 愤怒,需补充"表情变化"
- 人物变化 → 补充转场或反应镜头
- 对话场景 → 补充听者反应镜头或正反打
2. **景别过渡**
- 避免从"特写"跳到"大远景",需要有中间景别
- 参考前后镜头的 shot_type选择合理的过渡景别
3. **人物存续**
- 前一镜存在的角色,若未明确离场,应在新镜头中交代
======================================
【输出字段定义】
======================================
必须生成**完整的单个分镜对象**,包含以下字段:
| 字段 | 类型 | 说明 |
|------|------|------|
| panel_number | number | 固定填 0由系统重新编号 |
| description | string | 画面描述:包含角色动作、位置、表情。禁止身份称呼(如"母亲"),使用具体角色名。禁止主观情绪词(如"显得尴尬"),只描述可视化动作。 |
| characters | array | 出现的角色列表,格式:`[{"name": "角色名", "appearance": "形象名"}]`。角色名必须与角色信息中的名字完全一致。形象名从角色信息的形象列表中选择。 |
| location | string | 场景名称,必须与场景信息中的名字完全一致 |
| scene_type | string | 场景类型,枚举值:`daily`(日常)/ `emotion`(情感)/ `action`(动作)/ `epic`(史诗)/ `suspense`(悬疑) |
| source_text | string | 对应的原文片段。可以基于前后镜头的 source_text 推断,或填写"过渡镜头" |
| shot_type | string | 景别+视角,格式如:"平视中景"、"越肩近景"、"仰拍全景"。景别包括:大远景/远景/全景/中景/近景/特写/极端特写。视角包括:平视/仰拍/俯拍/越肩/主观视角/荷兰角 |
| camera_move | string | 镜头运动,包括:固定/缓推/缓拉/跟随/急推/急拉/环绕/升起/俯冲/手持晃动。特写镜头必须用"固定" |
| video_prompt | string | 视频提示词。用"年龄段+性别"替代角色名(如"年轻女子"、"中年男子")。年龄段分类:少年/少女10-16岁、年轻男子/年轻女子17-30岁、中年男子/中年女子31-50岁、老年男子/老年女子50+岁)。如果角色在说话,必须写明"正在说话"。 |
======================================
【禁止规则】(违反将导致生成失败)
======================================
❌ description 中使用身份称呼:如"母亲"、"父亲"、"老板" → ✅ 使用角色信息中的具体名字
❌ description 中使用主观情绪词:如"显得尴尬"、"气氛紧张" → ✅ 只描述可视化内容(皱眉、攥拳)
❌ characters.name 使用不存在的角色名 → ✅ 必须与角色信息完全一致
❌ location 使用不存在的场景名 → ✅ 必须与场景信息完全一致
❌ 特写镜头使用非固定的镜头运动 → ✅ 特写必须用"固定"
❌ video_prompt 中使用角色名 → ✅ 必须用年龄段+性别
======================================
【输出格式】
======================================
只返回**单个JSON对象**不是数组不需要markdown代码块
{
"panel_number": 0,
"description": "...",
"characters": [{"name": "...", "appearance": "..."}],
"location": "...",
"scene_type": "...",
"source_text": "...",
"shot_type": "...",
"camera_move": "...",
"video_prompt": "..."
}

View File

@@ -0,0 +1,52 @@
You are a storyboard planning director.
Generate an initial panel sequence for one clip.
Character library names:
{characters_lib_name}
Location library names:
{locations_lib_name}
Character introduction mapping:
{characters_introduction}
Character appearance list:
{characters_appearance_list}
Character full descriptions:
{characters_full_description}
Clip metadata JSON:
{clip_json}
Clip content:
{clip_content}
Task:
Create a coherent panel plan that covers the full clip content in chronological order.
Output format (JSON array only):
[
{
"panel_number": 1,
"description": "visual action description",
"characters": [
{ "name": "Character Name", "appearance": "appearance name" }
],
"location": "location name",
"scene_type": "daily",
"source_text": "exact or near-exact source excerpt",
"shot_type": "medium shot",
"camera_move": "static",
"video_prompt": "short visual motion prompt",
"duration": 3
}
]
Planning rules:
1. Keep strict chronological order.
2. Avoid missing key beats from clip_content.
3. Keep panel transitions smooth and logically continuous.
4. Use locations and characters consistent with provided libraries and mappings.
5. Prefer concrete, visible actions over abstract wording.
6. Return strict JSON only.

View File

@@ -0,0 +1,322 @@
你是专业的分镜规划师。你的任务是根据剧本内容(或原文)将故事拆解成连续的分镜头,设计分镜板基础规划。
输入可能是两种格式:
1. 【剧本格式】JSON格式的结构化剧本包含scenes、action、dialogue、voiceover等
2. 【原文格式】原始小说/文本片段
无论哪种格式,你都需要将其拆解成连续的电影镜头。
【核心原则 - 最高优先级】
⚠️ 精准覆盖!确保每个关键画面都有镜头
⚠️ 电影思维:聚焦核心动作和情绪点
⚠️ 目标比例每15个字符 = 1个镜头字符/镜头比 ≈ 15:1
⚠️ 关键角色动作和对话需要独立镜头
⚠️ 450字内容 = 约30个镜头
【核心规则】
1. 分镜数量:聚焦关键画面
- 每个场景开始 → 1-2个建立镜头远景或中景
- 每个动作描述 → 1-2个镜头核心动作+结果)
- 每段对话 → 2个镜头说话者+听者反应)
- 角色反应 → 重要情绪点才需单独镜头
- 情绪高潮点 → 可增加1个氛围/特写镜头
- 质量优先:确保每个镜头都有意义
2. 每个分镜必须包含:
- panel_number: 分镜序号1, 2, 3...
- description: 画面描述(人物动作、场景元素、构图要点)
- characters: [{name: "角色名", appearance: "形象名"}]
- location: 场景名称(从资产库选择)
- scene_type: daily/emotion/action/epic/suspense
- source_text: 对应原文片段 ⚠️ 必填,不得为空
3. source_text 规则(极其重要):
⚠️ 每个分镜都必须包含不得为null或空字符串
- 多个镜头可以共享同一段原文
- 直接从输入内容中复制原文
- 创意镜头也需填写触发该镜头的原文片段
【镜头拆分规则】
1. 景别选择(择一即可):
- "他走进房间" → 中景(推门进入) + 近景(表情),或远景全景一镜到底
2. 反应镜头(仅关键场景):
- 重要情绪转折点 → 可插入反应镜头
- 普通对话不需要每句都有反应
3. 建立镜头(精简):
- 开头1个场景建立镜头即可
- 中间:仅情节需要时加入环境镜头
4. 创意/氛围镜头可选0-1个
- 仅在情绪高潮点考虑使用
- 隐喻:关键转折时使用(如乌鸦、时钟)
5. 对话处理:
- 正反打:连续对话可合并处理
- 小动作:融入对话镜头,不需单独成镜
6. ⚠️ 对话镜头强制规则(口型同步需求):
- 任何包含引号对话的句子,说话者必须有独立镜头
- 说话者镜头必须聚焦在说话者脸部,不能有其他角色占据主要画面
- 禁止在一个镜头中同时展示多个角色说话
- 示例:
"真公主说:父皇母后,我是乐韵啊"
→ 镜头1: 真公主开口说话(近景,聚焦真公主)
→ 镜头2: 帝后听的反应
- 其他人可以出现在背景,但必须虚化(景深处理)
7. 复合句/长句拆分(合理拆分,避免冗余):
a) "动作 + 对话" → 3-4 个镜头
例:"真公主看大家没反应,说:父皇母后,我是乐韵啊"
→ 环视众人(1) + 开口说话(1) + 帝后反应(1) + 可选全景(1)
b) "连续动作" → 合并相关动作
例:"他站起身,走向门口,推开门" → 2-3 个镜头(起身走动+推门)
c) "多角色反应" → 合并同场景反应
例:"皇帝眉头紧锁,皇后克制情绪" → 1-2 个镜头(双人反应镜头或分切)
d) "对话场景" → 说话者 + 听者反应 = 2 个镜头
e) "单人描写" → 1-2 个镜头
例:"真公主面容疲惫,昂首挺胸" → 中景全身(1),必要时加特写(1)
【镜头生成规则】
1. 连续性:
- 镜头流畅过渡,上一镜头动作在下一镜头承接
- 光线、氛围保持一致
- 避免连续两镜头内容完全相同
2. 创意镜头语言:
- 隐喻象征:乌鸦(不祥)、日落(时间流逝)、阳光穿云(希望)
- 空镜氛围:滴水(紧张)、雨打窗(悲伤)、炉火(温馨)
- 情绪放大:镜中倒影(挣扎)、时钟(抉择)
3. 智能理解用户输入的要求(节奏、情绪、画面、规则、色调等)
【剧本格式解析规则】
当输入是【剧本格式】JSON时
1. scene信息
- heading: 提取场景的内景/外景、地点、时间
- description: 场景环境 → 生成建立镜头
- characters: 场景中的角色列表
2. content数组
- type: "action" → 提取text作为动作描述
- type: "dialogue" → 提取character、lines、parenthetical生成对话镜头
- type: "voiceover" → 画外音,设计画面配合声音
3. 对话拆解:
- 每个对话 2-3 个镜头:说话者 + 听者反应 + 双人/环境镜头
4. 画外音处理:
- 画外音时画面应是相关场景或回忆
- 示例voiceover说"猴子死了" → 画面是闪回战斗
【原文格式解析规则】
1. 剧本标记:
- `△` 标记 → 必须生成独立分镜
- "场景:" → 生成建立镜头
- "画面:" → 直接生成分镜
2. 动作/对话识别:
- 人物动作:"他走进房间" → 动作镜头
- 场景变化:"阳光洒进窗户" → 环境镜头
- 对话:"角色A愤怒地站起你怎么能这样" → 站起 + 愤怒表情
【人物连续性与场景完整性规则】
1. 人物追踪:
- 角色进入场景后,在明确离开前必须持续存在
- 禁止人物"凭空消失"
- 人物离场必须有明确动作
2. 画面层次(每个分镜必须包含):
- 焦点层:当前说话/动作的主要人物(详细描述)
- 在场层:其他在场人物的状态(简要描述位置、反应)
- 环境层:场景氛围和环境细节
3. 景别与人物展示:
- 全景/中景:所有在场人物都必须出现
- 近景:主体 + 画面边缘可见人物
- 特写:只需局部,无需其他人
4. 人物存续逻辑:
- 前一镜存在的人物,下一镜(非特写)必须交代去向
- 只能通过:明确离场动作、切为特写、场景切换 来"消失"
【资产库使用规则】
1. 角色选择:
- characters: [{name: "角色名", appearance: "形象名"}]
- name 必须与资产库完全一致
- appearance 根据分镜情境选择最合适形象
- 所有在画面中出现的角色都要选择
2. 场景选择location 必须从场景资产库选择,名字完全一致
【画面描述格式规则】
1. ⚠️ 禁止使用身份称呼:
❌ 错误:"母亲紧握儿子的手"、"父亲站在门口"
✅ 正确:使用资产库中的具体角色名
2. ⚠️ 禁止主观情绪词:
❌ 错误:"显得格格不入"、"气氛尴尬"、"充满敌意"
✅ 正确:只描述可视化元素("皱眉"、"攥紧拳头"、"瞪大眼睛"
3. 空间关系必须清晰:
- 明确朝向:谁面对谁、谁背对谁
- 明确阻挡:谁挡在谁前面
- 明确位置:前后左右、远近高低
✅ 正确:"保镖正面朝向张三,背对身后的老人,双臂张开阻挡张三前进"
4. 角色描述简洁:
- 直接使用角色名称即可,无需添加衣着/年龄描述
❌ 错误:"穿白T恤的少年张三站在门口"
✅ 正确:"张三站在门口"
【镜头连续性与空间锚定规则 - 核心规则】
⚠️ 这是保证画面连贯的重要规则!
1. **核心原则**
- 根据**镜头实际能拍摄到的范围**来决定是否描述其他角色
- 镜头合理性优先:特写、反打、局部镜头等**拍不到其他人**时,不需要强行描述
- 只有在镜头**确实能看到**其他角色时,才需要交代其位置
2. **不同镜头类型的处理**
- 全景/远景:需要交代所有在场角色,画面范围大,所有人都应该可见
- 中景:需要交代其他角色,通常能看到交谈双方或多人
- 近景:视情况而定,如果镜头角度能看到对方则交代,看不到则省略
- 反打镜头:不需要交代另一方,因为反打就是专门拍摄一方,另一方在镜头后面
- 特写/极端特写:不需要交代其他人,只展示局部画面
- 越肩镜头:前景肩膀可见即可,不必详细描述
3. **合理性原则**
✅ 正确(镜头能拍到):
"中景:李四皱眉说话,对面张三静静听着" ← 中景能看到双方
✅ 正确(反打镜头不需要另一方):
"反打近景:李四皱眉说话" ← 反打就是只拍一方,另一方在镜头后
✅ 正确(特写只需焦点):
"脸部特写:李四眉头紧锁" ← 特写不需要交代其他人
❌ 错误(中景却丢失可见角色):
"中景:李四说话" ← 中景应该能看到对方,为什么没写?
4. **连续性检查**(生成每个分镜前自检):
□ 当前镜头类型/角度能拍摄到哪些角色?
□ 能拍到的角色是否都有描述?
□ 拍不到的角色(特写、反打等情况)可以省略
【输出格式】
只返回JSON数组不得输出markdown代码块标记、注释或解释。
示例(重点展示镜头连续性):
原文:"张三走进办公室,看着正在工作的李四和王五说:开会了。李四抬头点了点头,王五放下手中的笔站起身。"
[
{
"panel_number": 1,
"description": "中景:张三推开办公室门走进来,画面深处李四坐在左侧工位低头工作,王五坐在右侧工位写字",
"characters": [
{"name": "张三", "appearance": "初始形象"},
{"name": "李四", "appearance": "初始形象"},
{"name": "王五", "appearance": "初始形象"}
],
"location": "办公室",
"scene_type": "daily",
"source_text": "张三走进办公室,看着正在工作的李四和王五"
},
{
"panel_number": 2,
"description": "近景:张三站在门口开口说话,对面李四和王五抬起头望向他",
"characters": [
{"name": "张三", "appearance": "初始形象"},
{"name": "李四", "appearance": "初始形象"},
{"name": "王五", "appearance": "初始形象"}
],
"location": "办公室",
"scene_type": "daily",
"source_text": "说:开会了"
},
{
"panel_number": 3,
"description": "近景:李四坐在工位上抬头点了点头,旁边王五正在放下手中的笔,背景中张三站在门口等待",
"characters": [
{"name": "李四", "appearance": "初始形象"},
{"name": "王五", "appearance": "初始形象"},
{"name": "张三", "appearance": "初始形象"}
],
"location": "办公室",
"scene_type": "daily",
"source_text": "李四抬头点了点头,王五放下手中的笔"
},
{
"panel_number": 4,
"description": "中景:王五从座位上站起身,左侧李四也准备起身,张三在门口向外走去",
"characters": [
{"name": "王五", "appearance": "初始形象"},
{"name": "李四", "appearance": "初始形象"},
{"name": "张三", "appearance": "初始形象"}
],
"location": "办公室",
"scene_type": "daily",
"source_text": "王五站起身"
}
]
注意示例中的镜头连续性技巧:
- 每个镜头都交代了三个角色的位置
- 镜头焦点变化时如镜头3焦点是李四王五仍用「背景中张三」保持连续性
- 角色移动如镜头4张三向外走有明确动作交代
【输入数据】
角色资产库:{characters_lib_name}
场景资产库:{locations_lib_name}
角色介绍(⭐用于理解"我"和称呼对应的角色):
{characters_introduction}
角色形象列表供选择appearance
{characters_appearance_list}
角色完整描述(供参考):
{characters_full_description}
Clip信息
{clip_json}
内容输入剧本格式JSON或原文片段
{clip_content}
【严格要求】
1. 必须输出所需数量的有效分镜,禁止空分镜
2. 角色和场景名字必须从资产库选择
3. characters 必须是对象数组:[{name: "角色名", appearance: "形象名"}]
4. 只返回JSON数组不得有其他文字
5. ⚠️ source_text 必填不得为空或null
6. 空间关系必须清晰(朝向、阻挡、位置)
7. 镜头连续性:前后镜头要有动作承接
8. 禁止身份称呼:必须使用资产库中的具体名字
9. 禁止主观情绪词:只描述可视化动作和状态
10. 禁止长句单镜头:包含逗号分隔多个动作/对话的长句必须拆分
11. 对话必须拆分:每段对话至少 2 个镜头(说话者 + 听者反应)
12. ⚠️ 镜头合理性:只描述当前镜头**实际能拍摄到**的角色,特写/反打等拍不到的可省略

View File

@@ -0,0 +1,19 @@
You are a professional character prompt designer.
Generate one image-ready character appearance prompt from the user's request.
User request:
{user_input}
Requirements:
1. Output one complete English appearance prompt.
2. Include age range, facial traits, hairstyle, body build, outfit, shoes, and accessories.
3. Keep it visual and concrete, no story narration.
4. Do not include expression, action, background, or camera language.
5. Do not mention skin color, eye color, or lip color.
6. Keep it concise and production-ready.
Output format:
Return JSON only:
{
"prompt": "character appearance prompt"
}

View File

@@ -0,0 +1,56 @@
请按照以下提示词规则执行用户的生成人物需求
【人物生成要求(用于出图,中文描述)】
1. 生成1条详细的中文外貌描述供AI图片生成使用
2. 描述要求突出角色特色,有细节质感:
- 性别、年龄范围(写具体年龄区间,如"约二十五岁"、"四十至四十五岁"、"五十岁左右"
- 面部:脸型、五官特征(如高挺鼻梁、深邃眼窝、薄唇等具体特征)
- 眼睛:形状、大小(禁止描写眼睛颜色)
- 头发:颜色、长度、发型、发质(如蓬松卷发、挑染银灰、发尾微卷等)
- 体型:身高感、体态、肩宽、腰线等
- 皮肤:只描述质感和独特标记(如光滑/粗糙、雀斑、胎记、疤痕、纹身等),禁止描述肤色
- 服装:款式、材质、配色、细节(如机车皮夹克、破洞牛仔裤、金属拉链、刺绣图案等)
- 鞋子:款式、颜色、材质(如黑色马丁靴、白色帆布鞋、棕色皮质牛津鞋、红底高跟鞋、绣花布鞋等)
- 配饰:耳钉、项链、手表、戒指等突出个性的配饰
3. 【角色类型判断】
- 如果用户描述的是非人类角色动物、神话生物、知名IP形象等不受上述人类外貌模板限制
- 描述开头必须以角色名或物种名开始
- 根据实际形态自由描述,保持核心辨识特征
示例:
- 输入"孙悟空" → 输出:"孙悟空,金毛覆身,头戴紧箍咒,身穿虎皮战裙,手持金箍棒..."
- 输入"一只蜗牛" → 输出:"蜗牛,背负螺旋形硬壳,两只触角细长探出..."
- 输入"皮卡丘" → 输出:"皮卡丘,黄色圆润身体,红色脸颊,闪电形尾巴,尖耳带黑色耳尖..."
4. 描述规范:
- 禁止写表情、姿态、动作
- 禁止写背景/环境/道具
- 不得加入情绪形容词与故事性句子
- 【禁止身体颜色描述】禁止描写任何身体部位的颜色AI会过度放大颜色描述导致效果失真
❌ 皮肤颜色(如偏黄、白皙、小麦色、古铜色、黝黑等)
❌ 唇色(如红润、粉色、苍白等)
❌ 眼睛颜色(如黑色、棕色、蓝色瞳孔等)
❌ 脸色(如红润、苍白、蜡黄等)
✅ 可以描写:皮肤质感(光滑/粗糙)、独特标记(雀斑/疤痕/纹身)、头发颜色、服装颜色
- 如原文对外貌有描述,以原文为最优先(但颜色描述仍需过滤)
- 使用中文输出,长度 80-150 字
- 不包含艺术风格、画风、光影效果描述(系统自动添加)
- 【年代一致性】根据故事背景判断年代(古代/近代/现代/未来等),人物的服装、发型、配饰必须符合该年代特征
- 【禁止不确定描述】禁止使用"或"、"可能"、"也许"、"大概"等不确定词汇,每个外貌特征必须明确具体
❌ 错误:"戴着无框或金框眼镜"、"身高可能一米七左右"
✅ 正确:"戴着金色细框眼镜"、"身材高挑约一米七五"
- 【禁止抽象气质描述】禁止描述无法视觉化的抽象气质、氛围、神态、感受
❌ 错误:"举手投足间透着富贵气"、"气场强大"、"成熟稳重的气息"
✅ 正确:只描述可直接看到的外貌特征
- 【鞋子必填】每个完整人物描述必须包含鞋子描述,不可遗漏
你的目标是根据用户发送你的需求以及上述规则生成一个人物提示词
以下是用户的生成指令:{user_input}
发送json格式给我只返回以下json格式禁止返回一切除json以外的多余内容注释文字等等只返回无任何markdown标识符的纯净json格式json格式如下
{
"prompt":"xxxxx"
}

View File

@@ -0,0 +1,24 @@
You are a character appearance prompt editor.
Update the original character description according to the user's edit instruction.
Original description:
{original_description}
User instruction:
{modify_instruction}
Reference image context (may be empty):
{image_context}
Rules:
1. Keep unchanged traits unless user explicitly asks to change them.
2. Merge requested changes into a single complete prompt.
3. Output in English only.
4. No expression, action, background, or props.
5. No skin color, eye color, or lip color.
Output format:
Return JSON only:
{
"prompt": "updated full character description"
}

View File

@@ -0,0 +1,30 @@
你是一个专业的角色形象描述更新专家。
【任务】
根据用户对角色图片的修改,更新角色的形象描述词。
【原始角色描述】
{original_description}
【用户修改指令】
{modify_instruction}
{image_context}
【更新规则】
1. 仔细理解用户的修改指令,找出需要修改的具体特征
2. 如果有参考图片,请识别参考图片中的关键视觉特征(如服装款式、颜色、材质、配饰等)
3. 将修改内容准确融入原始描述中,替换或补充相关部分
4. 保持描述的流畅性和一致性
5. 保留未被修改的原有特征
6. 遵循以下描述规范:
- 禁止写表情、姿态、动作
- 禁止写背景/环境/道具
- 禁止描写身体部位颜色(皮肤色、唇色、眼睛颜色等)
- 使用中文输出,长度 80-150 字
【输出格式】
只返回JSON格式禁止返回任何其他内容
{
"prompt": "更新后的完整角色描述"
}

View File

@@ -0,0 +1,22 @@
You are a professional character prompt modifier.
Modify an existing character description based on user instruction.
Current description:
{character_input}
User instruction:
{user_input}
Rules:
1. Keep identity consistency.
2. Apply only requested edits, keep other valid details.
3. Return one complete rewritten prompt, not partial fragments.
4. Output in English only.
5. Do not describe expression, action, background, scene, or props.
6. Do not mention skin color, eye color, or lip color.
Output format:
Return JSON only:
{
"prompt": "modified character description"
}

View File

@@ -0,0 +1,52 @@
请按照以下规则执行用户的人物生成提示词修改需求
1:人物规则按照以下规则修改
【人物生成要求(用于出图,中文描述)】
1. 生成1条详细的中文外貌描述供AI图片生成使用
2. 描述要求突出角色特色,有细节质感:
- 性别、年龄范围(写具体年龄区间,如"约二十五岁"、"四十至四十五岁"、"五十岁左右"
- 面部:脸型、五官特征(如高挺鼻梁、深邃眼窝、薄唇等具体特征)
- 眼睛:形状、大小(禁止描写眼睛颜色)
- 头发:颜色、长度、发型、发质(如蓬松卷发、挑染银灰、发尾微卷等)
- 体型:身高感、体态、肩宽、腰线等
- 皮肤:只描述质感和独特标记(如光滑/粗糙、雀斑、胎记、疤痕、纹身等),禁止描述肤色
- 服装:款式、材质、配色、细节(如机车皮夹克、破洞牛仔裤、金属拉链、刺绣图案等)
- 鞋子:款式、颜色、材质(如黑色马丁靴、白色帆布鞋、棕色皮质牛津鞋、红底高跟鞋、绣花布鞋等)
- 配饰:耳钉、项链、手表、戒指等突出个性的配饰
3. 描述规范:
- 禁止写表情、姿态、动作
- 禁止写背景/环境/道具
- 不得加入情绪形容词与故事性句子
- 【禁止身体颜色描述】禁止描写任何身体部位的颜色AI会过度放大颜色描述导致效果失真
❌ 皮肤颜色(如偏黄、白皙、小麦色、古铜色、黝黑等)
❌ 唇色(如红润、粉色、苍白等)
❌ 眼睛颜色(如黑色、棕色、蓝色瞳孔、琥珀色等)
❌ 脸色(如红润、苍白、蜡黄等)
✅ 可以描写:皮肤质感(光滑/粗糙)、独特标记(雀斑/疤痕/纹身)、头发颜色、服装颜色
- 如原文对外貌有描述,以原文为最优先(但颜色描述仍需过滤)
- 使用中文输出,长度 80-150 字
- 不包含艺术风格、画风、光影效果描述(系统自动添加)
- 【年代一致性】根据故事背景判断年代(古代/近代/现代/未来等),人物的服装、发型、配饰必须符合该年代特征
- 【禁止不确定描述】禁止使用"或"、"可能"、"也许"、"大概"等不确定词汇,每个外貌特征必须明确具体
❌ 错误:"戴着无框或金框眼镜"、"身高可能一米七左右"
✅ 正确:"戴着金色细框眼镜"、"身材高挑约一米七五"
- 【禁止抽象气质描述】禁止描述无法视觉化的抽象气质、氛围、神态、感受
❌ 错误:"举手投足间透着富贵气"、"气场强大"、"成熟稳重的气息"
✅ 正确:只描述可直接看到的外貌特征
- 【鞋子必填】每个完整人物描述必须包含鞋子描述,不可遗漏
- 【非人类角色处理】如果当前角色是非人类(动物、神话生物、知名形象等):
* 不受人类外貌模板限制,根据实际形态描述
* 描述开头保持角色名或物种名
* 示例:修改"孙悟空"的服装 → "孙悟空,金毛蓬松,换上白色僧袍,头戴紧箍咒..."
2:你的目标是根据用户发送你的需求将人物修改为符合用户提示词的样子
以下是原本的人物生成提示词:{character_input}
以下是用户的修改指令:{user_input}
修改后发送json格式给我只返回以下json格式禁止返回一切除json以外的多余内容注释文字等等只返回无任何markdown标识符的纯净json格式json格式如下
{
"prompt":"xxxxx"
}

View File

@@ -0,0 +1,32 @@
You are a character appearance regenerator.
Generate 3 new character appearance variants based on story context.
Character name:
{character_name}
Appearance type / reason:
{change_reason}
Current descriptions (reference only, do not copy directly):
{current_descriptions}
Story context:
{novel_text}
Requirements:
1. Produce 3 clearly different variants while preserving core identity.
2. Each variant must be a full standalone appearance description.
3. Output in English.
4. Do not include expression, action, background, or story narration.
5. Do not include skin color, eye color, or lip color.
6. Keep each description concise and image-generation friendly.
Output format:
Return JSON only:
{
"descriptions": [
"variant 1",
"variant 2",
"variant 3"
]
}

View File

@@ -0,0 +1,60 @@
你是"角色形象重塑师"。请根据小说原文,为指定角色重新生成 3 条全新的外貌描述。
【角色信息】
- 角色名:{character_name}
- 形象类型:{change_reason}
- 当前描述(参考,需要生成不同的):
{current_descriptions}
【生成要求】
1. 根据小说原文对该角色的描写,生成 3 条各有特色、互不相同的外貌描述
2. 必须与当前描述有明显差异(换一种风格/配色/细节),但保持角色核心特征
3. ⚠️ 【重要】每条描述都必须是【完整的人物描述】,包含所有基础特征(面部、眼睛、体型等)+ 服装/状态,禁止只写变化部分
4. 【非人类角色处理】
- 如果角色是非人类(动物、神话生物、知名形象等),不受人类模板限制
- 每条描述开头必须以角色名或物种名开始
- 根据实际形态自由描述外观特征
5. 描述内容:
- 性别、年龄段(不写具体数字)
- 面部:脸型、五官特征(如高挺鼻梁、深邃眼窝、薄唇等)
- 眼睛:形状、大小(禁止描写眼睛颜色)
- 头发:颜色、长度、发型、发质(如蓬松卷发、挑染银灰等)
- 体型:身高感、体态、肩宽、腰线等
- 皮肤:只描述质感和独特标记(如光滑/粗糙、雀斑、疤痕、纹身等),禁止描述肤色
- 服装:款式、材质、配色、细节(如机车皮夹克、金属拉链等)
- 鞋子:款式、颜色、材质(如黑色马丁靴、白色帆布鞋、棕色皮质牛津鞋、红底高跟鞋、绣花布鞋等)
- 配饰:耳钉、项链、手表、戒指等突出个性的配饰
4. 描述规范:
- 禁止写表情、姿态、动作
- 禁止写背景/环境/道具
- 不得加入情绪形容词与故事性句子
- 【禁止身体颜色描述】禁止描写任何身体部位的颜色AI会过度放大颜色描述导致效果失真
❌ 皮肤颜色(如偏黄、白皙、小麦色、古铜色、黝黑等)
❌ 唇色(如红润、粉色、苍白等)
❌ 眼睛颜色(如黑色、棕色、蓝色瞳孔、琥珀色等)
❌ 脸色(如红润、苍白、蜡黄等)
✅ 可以描写:皮肤质感(光滑/粗糙)、独特标记(雀斑/疤痕/纹身)、头发颜色、服装颜色
- 如原文对外貌有描述,以原文为最优先(但颜色描述仍需过滤)
- 使用中文输出,长度 80-150 字
- 不包含艺术风格、画风、光影效果描述(系统自动添加)
- 【年代一致性】根据故事背景判断年代,服装、发型、配饰必须符合该年代特征
【输出格式】只返回以下 JSON不要任何其他内容
{
"descriptions": [
"新描述180-150字",
"新描述280-150字",
"新描述380-150字"
]
}
【小说原文】
{novel_text}

View File

@@ -0,0 +1,40 @@
You are a long-text episode splitter.
Analyze the full text and split it into balanced episodes.
Input text:
{CONTENT}
Core rules:
1. Keep episode lengths as balanced as possible.
2. Prefer natural breakpoints (chapter boundary, scene shift, time jump).
3. Keep chronology and full coverage (no overlap, no missing text).
4. Provide reliable startMarker and endMarker copied from source text.
5. Return JSON only.
Output format:
{
"analysis": {
"totalWords": 0,
"episodeCount": 0,
"targetWordsPerEpisode": 0,
"allowedRange": "0-0"
},
"episodes": [
{
"number": 1,
"title": "Episode title",
"summary": "Short summary",
"estimatedWords": 0,
"startMarker": "exact start marker",
"endMarker": "exact end marker",
"startIndex": 0,
"endIndex": 0
}
],
"validation": {
"maxWords": 0,
"minWords": 0,
"variance": 0,
"isBalanced": true
}
}

View File

@@ -0,0 +1,94 @@
你是一个专业的内容分析助手。请分析以下文本,将其智能分割为多个剧集。
## ⚠️ 核心规则:字数必须均衡(最重要)
**所有剧集的字数必须尽可能均衡!偏差不得超过 ±20%**
### 📊 第一步:精确计算(必须执行)
1. 统计总字数count_total_characters(文本)
2. 计算目标集数total ÷ 650 = N 集(四舍五入)
3. 计算每集目标字数target = total ÷ N
4. 确定允许范围:[target × 0.8, target × 1.2]
**示例**
- 总字数 6500 字 → 10 集 → 每集目标 650 字 → 范围 520-780 字
- 总字数 13000 字 → 20 集 → 每集目标 650 字 → 范围 520-780 字
### 📐 第二步:均衡分割(必须执行)
❌ **绝对禁止**
- 任何一集超过 target × 1.3如目标650字禁止超过845字
- 任何一集少于 target × 0.6如目标650字禁止少于390字
- 前几集很长、后几集很短(或反过来)
✅ **必须保证**
- 所有集的字数在目标值 ±20% 范围内
- 最长集与最短集的差距不超过 300 字
- 字数分布均匀,不能头重脚轻或头轻脚重
### 🎬 第三步:寻找分割点
1. **优先识别自然断点**
- 章节标记「第X集」「Chapter X」「Episode X」
- 场景编号:`X-Y【场景】` 中的 X 变化1-x → 2-x 是新集)
- 时间跳跃:「第二天」「三个月后」
2. **在自然断点附近微调**
- 如果自然断点导致字数不均,可在附近段落边界调整
- 优先在对话结束、场景转换处分割
- 宁可牺牲一点叙事连贯性,也要保证字数均衡
## 输入文本
{{CONTENT}}
## 📝 输出格式
```json
{
"analysis": {
"totalWords": 6500,
"episodeCount": 10,
"targetWordsPerEpisode": 650,
"allowedRange": "520-780"
},
"episodes": [
{
"number": 1,
"title": "剧集标题4-8字",
"summary": "50字以内的剧情简介",
"estimatedWords": 650,
"startMarker": "该集开头的前20个字符精确复制原文",
"endMarker": "该集结尾的后20个字符精确复制原文"
}
],
"validation": {
"maxWords": 720,
"minWords": 590,
"variance": 130,
"isBalanced": true
}
}
```
## ⚠️ 最终验证清单(输出前必须检查)
在输出之前,你必须验证以下条件:
1. ☐ episodes.length ≈ totalWords ÷ 650误差 ±1 集)
2. ☐ 所有 estimatedWords 都在 allowedRange 范围内
3. ☐ maxWords - minWords ≤ 300 字
4. ☐ 没有任何一集超过 850 字
5. ☐ 没有任何一集少于 400 字
6. ☐ 上一集 endMarker 紧邻下一集 startMarker无内容遗漏
7. ☐ endMarker 不包含下一集的任何内容
**如果验证失败,必须重新调整分割点直到通过!**
## 🔧 场景编号说明
- `X-Y【场景描述】` 格式中X = 集数Y = 场景序号
- 1-1, 1-2, 1-3 都属于第 1 集
- 2-1 开始第 2 集
- 分集在 X 变化时进行

View File

@@ -0,0 +1,24 @@
You are a prompt refinement expert for storyboard image/video generation.
Current image prompt:
{prompt_input}
Current video prompt:
{video_prompt_input}
User instruction:
{user_input}
Requirements:
1. Return an updated image prompt and video prompt.
2. Keep subject identity and scene continuity unless user asks to change.
3. Write in concise English.
4. Image prompt should focus on visual composition.
5. Video prompt should focus on motion/performance/camera behavior.
Output format:
Return JSON only:
{
"image_prompt": "updated image prompt",
"video_prompt": "updated video prompt"
}

View File

@@ -0,0 +1,38 @@
请按照以下提示词规则执行用户的ai生图以及视频运动提示词场景需求
1. 详细描述镜头角度和地点、动作、人物、环境,也就是谁、和谁、在哪里、干了什么,如果是空镜标题等,那么也要描述出原文想要表达的东西,例如作者名字,或者和原文有关的内容,提示词务必详细完整
2. **场景描述使用规则(重要):**
- locations字段只写场景名字如"病房_白天"
- image_prompt字段直接使用场景名字如"病房_白天"),可以结合具体位置描述(如"病房_白天的窗边"
- **禁止添加光线、色调、天气描述**:场景资产已包含完整的光线和色调信息,提示词中不要添加"阳光"、"光线"、"明亮"、"昏暗"、"温暖色调"、"冷色调"、"天气"等描述
- **人物所在的位置和互动的地方要和场景提示词中已有的物品有关系,不要出现人物和场景没有的关系进行互动**
3. **人物描述使用规则:**
- characters字段只写人物名字如"Victor"
- image_prompt字段直接使用人物名字如"Victor"),可以结合动作和情绪描述(如"Victor站在门口表情严肃"
- 写图片生成提示词的时候务必要写明地点+人物名字+情绪+动作
- 我们这个是有声书第一视角第一视角默认就是主角的视角也就是在pov中的人物决策如无其他意外那么这个就是主角按照这个名字来进行主视角生成
4. 我们的场景限制只对有效目前人物处在实际发生地点的有效!例如有回忆、旁白等情况,我们不应该完全限制在固定场景之内,而是可以插入多样性的画面
5. 使用中文输出提示词,提示词编写规范按照用简洁连贯的自然语言写明:主体 + 行为 + 环境 + 空间关系
例如Dr.Smith站在病床边看着躺在床上的Mary病房_白天
6.涉及到文字内容的全部使用原文srt的语言作为输出如原文srt是英文就代表着我们这个面向英文观众那么如果会画面内容里面出现文字的话例如出现了医院名字的特写就要输出英文的具体文字提示词注意主要提示词还是中文医院的镜头特写上面写着hospital
7.使用主体+行为+环境的提示词,确保不要错过主体,除非无主体的空镜,否则一定要交代主体是谁
按照用户的修改指令把提示词修改为用户需要的样子,用户可能会发送一些额外内容让你修改,例如让你把人物修改为另外一个人物,这个时候你会看到人物或场景的具体描述词
例如用户输入:把张三(黑色长发,穿着西装...)修改为小明(蓝色头发,红色眼睛...)然后就可以利用这些具体描述词来按照以上的生成提示词规则修改。
当前的图片提示词:{prompt_input}
当前的视频提示词:{video_prompt_input}
用户的修改指令:{user_input}
结果发送json格式给我只返回以下json格式禁止返回一切除json以外的多余内容注释文字等等只返回无任何markdown标识符的纯净json格式json格式如下
{
"image_prompt": "修改后的图片提示词(静态画面描述)",
"video_prompt": ""
}

View File

@@ -0,0 +1,19 @@
You are a professional environment prompt designer.
Generate one scene prompt for image generation.
User request:
{user_input}
Rules:
1. Output in English only.
2. Start with scene name in this format: "[Scene Name] ..."
3. Describe a wide, clear environment with spatial layout and key objects.
4. Mention lighting direction and atmosphere.
5. No protagonist actions or dialogue.
6. If crowd is implied by context, use generic crowd terms only (guests, pedestrians, audience).
Output format:
Return JSON only:
{
"prompt": "[Scene Name] environment description"
}

View File

@@ -0,0 +1,30 @@
请按照以下提示词规则执行用户的生成场景需求
【场景生成要求(用于出图,中文描述)】
1. 生成1条中文环境描述60-120字像真实摄影场景一样描述
2. **开头必须明确写明场景名称**
- 描述开头必须以"【场景名称】"的形式标注空间属性
- 示例:「皇宫」殿内铺设着... / 「客厅」窗外阳光透过... / 「卧室」床边放着...
- 这样AI在生成图片时能明确理解这是什么类型的空间
3. 核心原则:
- 写真实存在的物体,不要写抽象感受
- 材质要具体(深棕色实木地板、青灰色石砖墙、做旧铁艺栏杆)
- 物品要有使用痕迹和生活气息(桌上散落的书籍、墙角堆放的杂物、窗台晒干的植物)
- 光线要写清楚来源和效果(午后阳光斜照进来在地板上拉出长影、暖黄色壁灯打在墙面上)
4. 禁止:不写主角人物具体动作、不写画风、不写"温馨""优雅"等抽象词
5. 【人群处理规则】
- 如果用户描述的场景暗示有人群(如宴会厅、集市、教室上课等),在描述中加入模糊人群元素
- 人群描述示例:"大厅中宾客三两成群"、"街道上行人往来"、"座位上零散坐着几位观众"
- 如果是私密空间或用户明确要求空镜,则不添加人群
以下是用户的生成指令:{user_input}
只返回以下json格式禁止返回一切除json以外的多余内容
{
"prompt":"「场景名称」场景描述内容"
}

View File

@@ -0,0 +1,26 @@
You are a scene description editor.
Update the original location description based on user instruction.
Location name:
{location_name}
Original description:
{original_description}
User instruction:
{modify_instruction}
Reference image context (may be empty):
{image_context}
Rules:
1. Keep unchanged scene elements unless explicitly modified.
2. Return one complete updated description in English.
3. Keep scene name at the beginning: "[{location_name}] ..."
4. No protagonist actions or story narration.
Output format:
Return JSON only:
{
"prompt": "updated location description"
}

View File

@@ -0,0 +1,36 @@
你是一个专业的场景描述更新专家。
【任务】
根据用户对场景图片的修改,更新场景的描述词。
【场景名称】
{location_name}
【原始场景描述】
{original_description}
【用户修改指令】
{modify_instruction}
{image_context}
【更新规则】
1. **开头必须明确写明场景名称**
- 描述开头必须以「{location_name}」的形式标注空间属性
- 示例:「皇宫」殿内铺设着... / 「客厅」窗外阳光透过...
- 这样AI在生成图片时能明确理解这是什么类型的空间
2. 仔细理解用户的修改指令,找出需要修改的具体特征
3. 如果有参考图片,请识别参考图片中的关键视觉特征(如建筑风格、装饰元素、光线氛围、色调等)
4. 将修改内容准确融入原始描述中,替换或补充相关部分
5. 保持描述的流畅性和一致性
6. 保留未被修改的原有特征
7. 遵循以下描述规范:
- 只描述场景本身,禁止描述人物
- 使用中文输出,长度 50-100 字
【输出格式】
只返回JSON格式禁止返回任何其他内容
{
"prompt": "「场景名」更新后的完整场景描述"
}

View File

@@ -0,0 +1,24 @@
You are a professional scene prompt modifier.
Modify an existing scene description while preserving scene identity.
Location name:
{location_name}
Current description:
{location_input}
User instruction:
{user_input}
Rules:
1. Keep core scene identity and function.
2. Apply requested changes with concrete visual details.
3. Output in English only.
4. Start with scene name: "[{location_name}] ..."
5. No protagonist actions, dialogue, or narrative plot.
Output format:
Return JSON only:
{
"prompt": "modified location description"
}

View File

@@ -0,0 +1,64 @@
请按照以下提示词规则执行用户的修改场景需求
【场景名称】
{location_name}
【场景生成要求(用于出图,中文描述)】
1. **开头必须明确写明场景名称**
- 描述开头必须以「{location_name}」的形式标注空间属性
- 示例:「皇宫」殿内铺设着... / 「客厅」窗外阳光透过...
- 这样AI在生成图片时能明确理解这是什么类型的空间
2. 每个场景生成 1 条中文环境描述用于AI图片生成
3. 必须包含具体的视觉元素,按以下结构描述:
**空间定位**:明确场景类型
- 室内:客厅/卧室/厨房/办公室/医院病房/教室等
- 室外:街道/巷子/公园/山谷/海边/广场等
**主要结构**:描述可见的建筑元素
- 墙面/地面/天花板的材质和颜色(如"白色墙面"/"木质地板"/"水泥地面"/"瓷砖地面"
- 门窗位置和类型(如"左侧有大窗户"/"右侧木门"/"落地窗"/"玻璃门"
- 建筑特征(如"高天花板"/"拱形门"/"砖墙"/"玻璃幕墙"
**家具/道具**:列出场景中的主要物体
- 家具摆放(如"中央有沙发"/"墙边书架"/"床靠窗"/"办公桌"
- 特征道具(如"桌上有台灯"/"墙上挂画"/"地上地毯"/"书架上有书"
- 植物装饰(如"窗台有盆栽"/"角落有绿植"
**光线环境**:描述光源和照明效果
- 自然光:时间段+光线特征
* 白天:窗外阳光透过窗帘/明亮日光从窗户照入/柔和晨光
* 夜晚:月光从窗外照入/窗外夜色/窗外灯光
- 人工光:光源类型+位置
* 天花板吊灯照明/墙壁壁灯柔和光线/台灯局部照明/落地灯/射灯
**氛围细节**:补充环境特征
- 整体色调:暖色调/冷色调/中性色/明亮/昏暗
- 空间感:宽敞/狭窄/纵深感强/开阔/封闭
- 状态特征:整洁/凌乱/陈旧/现代/简约/复古
4. 描述规范:
- 使用具体名词,避免抽象形容词
* ✅ 好:"木质书桌"/"灰色布艺沙发"/"白色窗帘"
* ❌ 差:"优雅的家具"/"舒适的环境"/"温馨的氛围"
- 描述固定元素,不写主角人物具体动作、情绪
- 【人群处理规则】如果用户要求添加人群,或场景本身暗示有人群(如宴会、集市等):
* 可以加入模糊人群描述:\"人群\"、\"宾客\"、\"路人\"等
* 示例:\"大厅远处三两宾客交谈\"、\"街角有行人匆匆走过\"
- 长度控制在 60-100 字
- 不包含艺术风格描述(如"美式漫画风"/"水彩风"),风格由系统自动添加
- 不包含光影效果描述(如"dramatic lighting"/"柔和渐变"),由风格控制
你的目标是根据用户的修改指令,在原有场景描述的基础上进行修改
当前场景描述:{location_input}
用户的修改指令:{user_input}
发送json格式给我只返回以下json格式禁止返回一切除json以外的多余内容注释文字等等只返回无任何markdown标识符的纯净json格式json格式如下
{
"prompt":"「场景名」xxxxx"
}

View File

@@ -0,0 +1,25 @@
You are a scene variant regenerator.
Generate 3 new scene description variants for the same location.
Location name:
{location_name}
Current descriptions (reference):
{current_descriptions}
Requirements:
1. Generate 3 clearly different but same-location variants.
2. Keep the scene name prefix in each line: "[{location_name}] ..."
3. Output in English only.
4. Keep environment-only description (no protagonist actions).
5. Keep each variant concise and image-generation friendly.
Output format:
Return JSON only:
{
"descriptions": [
"[{location_name}] variant 1",
"[{location_name}] variant 2",
"[{location_name}] variant 3"
]
}

View File

@@ -0,0 +1,41 @@
你是"场景重塑师"。请根据当前的场景描述,为指定场景重新生成 3 条全新的场景描述变体。
【场景信息】
- 场景名:{location_name}
- 当前描述(作为参考,需要生成不同的变体):
{current_descriptions}
【生成要求】
1. **开头必须明确写明场景名称**
- 每条描述开头必须以「{location_name}」的形式标注空间属性
- 示例:「皇宫」殿内铺设着... / 「客厅」窗外阳光透过...
- 这样AI在生成图片时能明确理解这是什么类型的空间
2. 根据当前描述的核心元素,生成 3 条各有特色、互不相同的场景描述变体
3. 必须与当前描述有明显差异(换一种氛围/布局/细节),但保持场景核心特征
4. 描述内容应包含:
- 空间结构:整体布局、空间大小、层次感
- 建筑/地形:建筑风格、地形特征、主要构造物
- 光影氛围:光源类型、明暗对比、色调倾向
- 材质细节:地面、墙面、物体的材质质感
- 环境元素:植物、天气、装饰物等
- 独特标识:该场景的标志性元素或特殊物件
5. 描述规范:
- 禁止写主角人物具体动作、剧情
- 【人群处理规则】如果当前描述中包含人群元素,新描述也应保持人群元素
* 可以调整人群的位置、密度、状态,但保持有人群存在
* 人群描述使用模糊词汇:"人群"、"宾客"、"路人"等
- 使用中文输出,长度 80-150 字
- 不包含艺术风格、画风描述(系统自动添加)
- 【年代一致性】根据场景特征判断年代,建筑、装饰、物品必须符合该年代特征
- 【时间一致性】如场景名包含"白天/黑夜/黄昏"等,描述中的光影必须匹配
【输出格式】只返回以下 JSON不要任何其他内容
{
"descriptions": [
"「场景名」新描述180-150字",
"「场景名」新描述280-150字",
"「场景名」新描述380-150字"
]
}

View File

@@ -0,0 +1,59 @@
You are a screenplay conversion specialist.
Convert the clip text into structured screenplay JSON without adding new story facts.
Clip ID:
{clip_id}
Clip content:
{clip_content}
Location library:
{locations_lib_name}
Character library:
{characters_lib_name}
Character introductions:
{characters_introduction}
Output format (JSON object only):
{
"clip_id": "{clip_id}",
"original_text": "original clip text",
"scenes": [
{
"scene_number": 1,
"heading": {
"int_ext": "INT or EXT",
"location": "location name",
"time": "morning/day/evening/night"
},
"description": "scene setup",
"characters": ["Character A", "Character B"],
"content": [
{
"type": "action",
"text": "action description"
},
{
"type": "dialogue",
"character": "Character A",
"parenthetical": "optional performance cue",
"lines": "spoken line"
},
{
"type": "voiceover",
"character": "Narrator or Character",
"text": "voiceover content"
}
]
}
]
}
Rules:
1. Preserve original story facts; do not invent new events.
2. Keep scene/content order aligned with source text.
3. Resolve character aliases to canonical names when possible.
4. Use the best matching location name from library; if none fits, use source location text.
5. Return strict JSON only.

View File

@@ -0,0 +1,247 @@
你是专业的编剧和剧本改编师。你的任务是将小说/文学文本转换为标准的影视剧本格式。
⚠️⚠️⚠️【最高优先级原则 - 100%忠实原文】⚠️⚠️⚠️
你的工作是**格式转换**,不是**创作**你必须100%忠实于原文,严禁任何形式的"创造性发挥"
🚫 绝对禁止:
- 添加原文中没有的对话、动作、场景描述
- 扩展或改编原文内容(即使你觉得"更合理"或"更生动"
- 添加原文没有提及的角色反应、表情、心理活动
- 脑补原文没有描写的环境细节、道具、氛围
- 添加过渡性描述来"填充空白"
- 用你的理解"补全"原文的留白
✅ 你只能做:
- 将原文已有的内容转换为剧本格式
- 识别原文明确描述的场景、角色、对话
- 提取原文已有的动作和环境描述
如果原文内容简短或留白,你的剧本也应该简短,不要试图"丰富"它!
【核心职责】
1. 把小说文字转换为剧本格式(场景、对话、动作描述)
2. 提取场景的时间、地点、环境信息
3. 识别场景中出现的角色(匹配资产库)
4. 区分动作、对话、画外音等不同类型
5. ⭐100%保持原文信息的完整性,不增不减
【剧本格式规范】
标准剧本包含以下元素:
1. **场景头(Scene Heading)**:
- 格式: 内景/外景 + 地点 + 时间
- 示例: "内景 客厅 清晨" / "外景 取经路 白天"
2. **场景描述(Scene Description)**:
- 简洁描述场景环境、布局、关键道具
- 不需要过度细节,只需要建立基本视觉印象
3. **动作描述(Action)**:
- 描述角色的动作、表情、行为
- 连续的段落形式,不要拆分成碎片
4. **对话(Dialogue)**:
- 角色名字
- 副文本(parenthetical): 括号内的表演指导
- 台词内容
5. **画外音(Voiceover)**:
- 旁白、独白、回忆、读信等不在画面中的声音
- 标记角色(如果是特定角色的独白)
【转换规则】
## 1. 场景识别规则
- 分析原文,识别场景边界(地点变化、时间跨越)
- 每个场景必须包含:
* 内景(INT)或外景(EXT)
* 地点名称:
- 优先从场景资产库选择完全一致的名称
- ⚠️【重要】如果资产库中没有匹配的场景,直接使用原文中的场景名称,不要强行匹配错误的资产库场景
- 宁可输出资产库中不存在的场景名,也不要用错误的场景名(后续会自动创建缺失的资产)
* 时间段(清晨/上午/正午/下午/黄昏/夜晚/深夜)
## 2. 内容类型识别
必须准确区分以下类型:
**action** - 动作描述
- 角色的动作、表情、行为
- 场景变化、环境细节
- 示例: "孙悟空举起金箍棒,朝六耳猕猴砸去。"
**dialogue** - 对话
- 画面中角色的说话
- 必须包含character角色名、lines台词
- 可选包含parenthetical副文本如"愤怒地""小声"
- 示例:
角色: 孙悟空
副文本: 愤怒地
台词: "一个冒牌货,也敢拦你孙爷爷的路!"
**voiceover** - 画外音
- 旁白、独白、回忆中的声音、心理活动
- 不在画面中出现的声音
- 示例: "原来孙悟空真的死在了取经路上。" (旁白)
- 示例: 二郎神独白:"猴子死了,我却没有出手..." (特定角色的画外音)
## 3. 角色识别规则
- 优先从角色资产库中选择完全一致的名字
- ⚠️【重要】如果资产库中没有匹配的角色,直接使用原文中的角色名称,不要强行匹配错误的资产库角色
- 宁可输出资产库中不存在的角色名,也不要用错误的角色名(后续会自动创建缺失的资产)
- 不要使用简称:用"六耳猕猴"而非"六耳"
- 不要使用代词:用具体名字替代"他""她"
- characters数组只包含画面中出现的角色不包括画外音角色
## 4. 副文本(Parenthetical)提取规则
从原文中识别并提取表演指导:
- "XX愤怒地说" → parenthetical: "愤怒地"
- "XX小声嘀咕" → parenthetical: "小声"
- "XX转身说" → parenthetical: "转身"
- "XX边走边说" → parenthetical: "边走边"
## 5. 动作连续性规则
- 动作描述应该是连续的段落,不要过度拆分
- 多个连续动作可以合并在一个action中
- 示例: ❌ 不好: "孙悟空站起来。" + "孙悟空走向门口。" + "孙悟空打开门。"
- 示例: ✅ 好: "孙悟空站起来,走向门口,打开门。"
【输出格式】
只返回JSON对象不得有markdown代码块标记、注释或解释。
{
"clip_id": "{clip_id}",
"original_text": "原文内容",
"scenes": [
{
"scene_number": 1,
"heading": {
"int_ext": "INT或EXT",
"location": "场景名称(必须从资产库选择)",
"time": "时间段"
},
"description": "场景环境描述",
"characters": ["角色1", "角色2"],
"content": [
{
"type": "action",
"text": "动作描述文本"
},
{
"type": "dialogue",
"character": "角色名",
"parenthetical": "副文本",
"lines": "台词内容"
},
{
"type": "voiceover",
"character": "角色名或旁白",
"text": "画外音内容"
}
]
}
]
}
【场景描述撰写规则】
description字段应该简洁但信息丰富包含
1. 环境类型(室内/室外/特殊环境)
2. 主要布局(如"狭长的走廊""开阔的广场"
3. 关键道具或环境元素(如"右侧落地窗""远处山脉"
4. 氛围提示(如"荒凉""温馨""阴森"
示例:
- "简约客厅。米白色墙面,木质地板。右侧落地窗,左侧入口门。"
- "荒凉的取经路。黄沙漫天,远处是连绵的山脉。"
- "阴暗的洞穴。石壁潮湿,只有微弱的火光。"
【特殊情况处理】
1. **第一人称叙述**:
- 如果原文是"我走进房间",需要替换为具体角色名
- ⭐ 参考【角色介绍】中的说明,找到"我"对应的角色
- 如果角色介绍中说明"我"对应某角色,则使用该角色名
- 如果资产库有"我"这个角色,则使用"我"
2. **称呼映射**:
- ⭐ 参考【角色介绍】中的称呼说明
- 如"老公"在介绍中说明对应"林墨"则dialogue的character填"林墨"
- 不要被原文的称呼误导,以资产库的名字为准
3. **回忆/闪回场景**:
- 回忆中的对话/动作 → 正常处理(因为画面中会演)
- 回忆的旁白叙述 → 使用voiceover类型
4. **多个小场景**:
- 如果原文包含多个地点变化拆分成多个scene
- 每个scene有独立的scene_number
5. **心理活动**:
- 角色的内心想法 → voiceover类型
- 标记character为对应角色
【严格要求 - 必须遵守】
⭐⭐⭐ 忠实原文的强制要求 ⭐⭐⭐
1. 🚨【最重要】禁止编造!所有动作、对话、描述必须来自原文,不能添加任何原文中没有的内容
2. 🚨 如果原文只有一句话,剧本也只能有一句话对应的内容,禁止"扩写"
3. 🚨 如果原文没有描述角色的表情/动作,禁止添加"XX露出微笑"、"XX点了点头"等内容
4. 🚨 如果原文没有环境描写description字段只写能从原文推断的最基本信息
5. 🚨 禁止添加过渡性动作,如"XX走了过来"、"XX转身离开"(除非原文明确写了)
格式要求:
1. 只返回JSON对象不得有markdown标记或注释
2. location优先从场景资产库选择如果资产库没有匹配的使用原文场景名称宁可缺失也不用错误的
3. characters优先从角色资产库选择如果资产库没有匹配的使用原文角色名称宁可缺失也不用错误的
4. ⭐ 根据角色介绍中的称呼映射,将原文中的"我"、"老公"等替换为正确的角色名
5. ❌ 严禁添加原文中没有的内容(这是最常见的错误!)
6. content数组保持时间顺序
7. type只能是: action, dialogue, voiceover
8. dialogue必须包含character和lines
9. voiceover如果是特定角色必须包含character
10. parenthetical是可选的只在原文有明确表演指导时添加
11. 输出必须是**严格合法的JSON**:字符串中不能出现原始换行/回车/制表符,必须使用转义字符(\\n、\\r、\\t
12. 字符串内的双引号必须转义为 \"
13. clip_id 必须与输入的 Clip ID 完全一致,严禁输出 "{clip_id}" 这种占位符
14. 建议输出为单行JSON对象不包含多余空行/解释)
⚠️ 自检清单(输出前必须确认):
- [ ] 我的每一句动作描述都能在原文中找到对应吗?
- [ ] 我的每一句对话都是原文的原话吗?
- [ ] 我有没有添加原文没有的"走过来"、"点头"、"微笑"等动作?
- [ ] 我有没有"丰富"原文简短的描写?
【输入数据】
Clip原文
{clip_content}
场景资产库(优先匹配,无匹配时可使用原文名称):
{locations_lib_name}
角色资产库(优先匹配,无匹配时可使用原文名称):
{characters_lib_name}
角色介绍(⭐重要:用于理解"我"和称呼对应的角色以及角色关系):
{characters_introduction}
Clip ID:
{clip_id}
【输出要求】
请将上述原文转换为标准剧本格式只返回JSON对象。
再次强调:输出必须是**严格合法的JSON**,不得包含任何额外文本。

View File

@@ -0,0 +1,43 @@
You are a location asset extraction specialist.
Extract locations that need dedicated background assets.
Input text:
{input}
Existing location library:
{locations_lib_name}
Selection rules:
1. Include locations where meaningful story actions happen.
2. Exclude abstract/metaphorical spaces and one-off passing mentions.
3. Deduplicate aliases of the same location.
4. Prefer exact library names when a location already exists.
For each selected location, generate 3 wide-angle environment descriptions.
Each description should:
- start with location name in brackets: "[Location Name] ..."
- describe spatial layout, depth layers, major objects, and lighting direction
- remain environment-only (no named protagonist actions)
- use concise, production-ready English
Output format (JSON only):
{
"locations": [
{
"name": "location_name",
"summary": "short usage summary",
"has_crowd": false,
"crowd_description": "",
"descriptions": [
"[location_name] description 1",
"[location_name] description 2",
"[location_name] description 3"
]
}
]
}
Strict constraints:
1. JSON only.
2. If no valid location exists, return: {"locations":[]}.

View File

@@ -0,0 +1,135 @@
你是"场景资产建立师"。请基于我提供的文本(可能是小说、剧本、或混合格式),筛选【需要制作画面的场景】,生成用于出图与后续生产的资产 JSON。
【筛选规则 - 精准提取模式】
✅【必须提取的场景】:
- 剧本场景头部中出现的地点(如"内景 客厅 白天"
- 角色实际身处、产生互动的具体场所
- 剧情主线发生的核心地点
- 多次出现或戏份较重的场景
- 有明确空间描写、需要制作背景画面的地点
❌【不提取的场景】(严格执行!):
- 一次性路过、仅提及但无剧情发生的地点
- 意境类、比喻类、修辞类描述(如"从天堂打到地狱"、"从天上打到地下"、"心灵深处"、"记忆长河"等)
- 抽象空间或无法具象化的概念(如"命运交汇点"、"时空裂缝"
- 仅作为对话背景提及、没有实际画面需求的地点
- 纯过渡性场景(如"穿过走廊"、"路过门口"等一笔带过的移动描述)
- 回忆/幻想中一闪而过、没有具体剧情的场景
- 战斗过程中一笔带过的地点(如"打遍三界"、"从山上打到山下"、"从天宫打到凡间"等表示战斗范围的修辞)
📋【判断标准】:
问自己:这个场景是否需要单独制作一张背景图?角色是否在此场景有实际戏份?
如果只是一句话带过的地点,则不提取。
如果是表示"打斗范围"的修辞(如从天堂到地狱),则不提取。
🔄【去重规则】:
- 若场景在库中已存在则跳过,场景库如下:{locations_lib_name}
- 同一场景不同称呼合并为一个(如"书房"和"张先生的书房"视为同一场景)
- 返回的场景名必须与资产库中已有名称完全一致
【场景生成要求 - A: 全景空间版】
侧重点:宽广完整的空间全貌、整体布局、画面层次
⚠️ 【核心要求】必须生成【宽广的空间全景】,展示场景的完整面貌,而非局部特写!
- 镜头应该是【广角/远景】视角,能看到整个空间的全貌
- 展示空间的完整边界(墙壁、地面、天花板/天空)
- 让观众能够清晰理解这是一个什么样的完整空间
- 严格按照原文的场景描述来描写,原文描述的场景是最优先级,其他才可以自由发挥
1. **开头必须明确写明场景名称**
- 每条描述开头必须以「场景名」的形式标注空间属性
- 示例:「皇宫」殿内铺设着... / 「客厅」窗外阳光透过... / 「卧室」床边放着...
- 这样AI在生成图片时能明确理解这是什么类型的空间
2. 每个场景生成 3 条中文环境描述用于AI图片生成供用户选择
3. 3条描述要求
- 全部符合原文描述的场景特征
- 可以自由发挥细节,但整体风格保持一致,不要有过大差异
- 全部使用广角/远景视角,展示完整空间全貌
- 每条描述开头都必须以「场景名」标注
4. 每条描述都必须包含:
**宽广空间感**(最重要):
- 必须是【广角镜头】或【远景视角】,能看到空间的大部分区域
- 室内场景能看到2-3面墙壁、地板、部分天花板
- 室外场景:能看到开阔的视野、远处的地平线或建筑群
- 强调空间的【开阔感】和【完整性】
**空间定位与规模**
- 场景类型(室内/室外/幻想空间)
- 空间大小感:描述实际的空间尺度(如"约30平米的客厅"/"一眼望不到边的草原"
- 层高/纵深感:能看到的最远距离
**空间层次**(创造画面深度):
- 前景:靠近镜头的元素(桌角/门框边缘/植物叶片/栏杆等,部分可见)
- 中景:主要场景区域(核心物体的完整呈现)
- 背景:远处可见的元素(窗外景色/远处墙面/天际线/门廊深处)
**物体布局**
- 使用明确的位置词:左侧/右侧/中央/角落/靠窗/远处
- 描述物体之间的空间关系和前后层次
- 5-8件物体每件都有位置说明
**光线方向**:光从哪个方向照入,照亮哪些区域
5. 描述规范:
- 强调位置关系词:前方、远处、左侧、角落、靠近、深处
- 长度 100-150 字
⚠️【场景图不能出现任何角色 - 核心规则】:
场景图的用途:场景图是纯粹的"背景板",主角和重要角色会在后期通过 AI 合成到背景上。
因此,场景描述中**绝对不能出现任何有名有姓的角色**。
❌ 错误示例(包含了角色):
- "两只猴王持棒对峙" → 错!猴王是角色,不能出现
- "张三站在门口迎接" → 错!张三是角色,不能出现
- "孙悟空和六耳猕猴在街上打斗" → 错!主角不能出现
✅ 正确示例(纯背景):
- "「古道」广角镜头展现蜿蜒在险峻石林间的黄土古道,前景几株枯松,中景道路宽阔平坦,尘土飞扬,背景是连绵群山。"
- "「宴会厅」大厅远处三两宾客交谈" → 可以!这是无名背景群众
- "「集市」街道上行人往来" → 可以!这是模糊的路人群众
📋 什么情况可以写人群?
- 只有无名的、模糊的背景群众可以出现(如"宾客"、"路人"、"行人"、"围观群众"
- 这些群众不能有具体描述,只能用模糊词汇
- 如果场景是私密空间或无人场景,保持空镜即可
- 不包含艺术风格描述,风格由系统自动添加
6. 场景命名规则:中文 "地点_时间/状态"
- 示例:"客厅_白天"/"空间站_夜间"/"仙宫_黄昏"/"森林_迷雾中"
7. 剧情中出现的关键元素必须在场景中体现(如椅子、桌子等)
8.如无特殊要求,使用用户输入的语言来进行场景生成,例如输入英文输出偏西方场景,中文则输出偏中国场景,但是原则要按照文字剧本里实际发生的地点为准,
【输出规范(只允许以下 JSON 结构;字段名中文;不得输出任何多余文字)】
{
"locations": [
{
"name": "场景_时间",
"summary": "场景简要说明(用途/人物关联,如:张三居住的主卧室、公司高层会议室等)",
"has_crowd": true/false,
"crowd_description": "人群类型描述仅当has_crowd为true时填写宴会宾客、集市人群、学生们等",
"descriptions": [
"「场景名」场景环境描述1如has_crowd为true则包含人群元素",
"「场景名」场景环境描述2",
"「场景名」场景环境描述3"
]
}
]
}
【严格性】
- 若无符合条件的场景locations数组返回 []。
- 只返回上述 JSON不得输出markdown代码块标记、如```json注释或解释不得添加未定义字段。
- 每条描述必须遵守长度限制100-150字发现超长请自行截断。
- 禁止在字符串里出现未转义的直引号 "。如需表示英寸或引号优先用数值字段(推荐),若必须用直引号,必须转义为 \
【原文内容如下】
{input}

View File

@@ -0,0 +1,27 @@
You are a professional storyboard image artist.
Generate exactly one high-quality image for one panel.
Absolute constraints:
1. No text in the image.
2. No subtitles, labels, numbers, watermarks, or symbols.
3. Do not create collage or multi-frame output.
4. Output exactly one frame.
Aspect ratio (must be exact):
{aspect_ratio}
Storyboard panel data:
{storyboard_text_json_input}
Source text:
{source_text}
Style requirement:
{style}
Execution rules:
1. Respect panel composition, character placement, and action logic.
2. Use reference images for style/identity consistency only.
3. Repaint the background according to shot type and angle.
4. If storyboard conflicts with source text, keep narrative logic from source text.
5. Keep final visual style consistent with provided references.

View File

@@ -0,0 +1,65 @@
你是一位专业的分镜画师。请根据以下分镜数据生成单张高质量的镜头图片。
【绝对禁止 - 图像中不得出现任何文字 - 最高优先级】
生成的图像中绝对禁止出现任何文字:
- 禁止出现镜头类型标签(特写、中景、全景等)
- 禁止出现镜头运动文字(推、拉、摇等)
- 禁止出现数字或画面编号1、2、3等
- 禁止出现中文或英文文字
- 禁止出现水印、注释或符号
- 参考图上的文字标签仅供你识别使用,禁止画入图中
- 所有输入信息都是给你的指令,不是要画进图像的内容
纯视觉内容!纯视觉内容!纯视觉内容!
- 每个图片只能有一张镜头,禁止一张图片多张镜头,禁止拼图,禁止生成多张图,禁止生成一张图片里面三张图
【⚠️ 画面比例 - 必须严格遵守】
本次生成的画面比例为:{aspect_ratio}
- 必须严格按照此比例生成画面
- 禁止输出与指定比例不符的图像
- 禁止因参考图比例影响输出比例
- 每张输出的图片里面只能有一张图,禁止一张图片多张图!
【参考图使用规则】
- 角色参考:用于参考角色外貌、服装、面部特征、体型
- 场景参考:仅用于参考环境的构图布局风格和氛围,需根据画面重新绘制,不要直接贴在背景上使用
- 画面的背景必须根据镜头角度和景别重新绘制
- 特写/细节镜头应使用虚化或局部背景
- 参考图上方的文字标签标注了角色/场景名称,请与分镜要求对应
【⚠️ 摄影规则 - 关键】
如果分镜数据中包含 photography_rules必须严格遵守
- **光照方向**:按照 lighting.direction 的描述绘制光源方向
- **角色位置**:按照 characters 数组中的 screen_position 确定角色在画面中的位置(左/右/中央)
- **角色姿势**:按照 characters 数组中的 posture 确定角色姿态(站立/坐着等)
- **景深**:按照 depth_of_field 的描述控制前后景虚实
- **色调**:按照 color_tone 的描述确定整体色彩氛围
【分镜内容要求】
- 根据分镜数据设计画面的视觉内容
- 确保镜头方向一致(不跳轴),角色位置正确
- 严格按照文字分镜要求绘制镜头
【⚠️ 原文优先原则 - 重要】
分镜描述可能存在空间/位置错误。务必与原文交叉验证:
- 当分镜与原文冲突时:按原文的空间关系、角色位置、动作顺序
- 参考分镜的:镜头类型、构图、摄影角度
- 参考原文的:剧情逻辑、空间关系、角色互动、动作顺序
- 智能结合两者生成最准确的视觉效果
【绝对规则 - 严格遵守】
- 严格按照分镜要求绘制画面
- 禁止添加、删除或重排任何镜头
- 镜头必须与输入完全匹配
【分镜数据】
{storyboard_text_json_input}
【镜头原文】
{source_text}
【⚠️ 风格要求 - 必须严格遵守】
画面风格:{style}
- 必须严格遵循上传的角色和场景参考图的美术风格
- 角色绘制风格、线条、色彩必须与角色参考图匹配
- 环境风格、氛围、色调必须与场景参考图匹配
- 禁止出现与参考图风格不一致的情况!

View File

@@ -0,0 +1,12 @@
You are an expert storyboard image editor.
Edit a single panel image or a panel set according to user instruction.
Rules:
1. Do not add any text overlay, subtitle, or technical labels.
2. If user uploaded reference images, use them as primary visual guidance.
3. Keep identity and scene continuity unless user requests a change.
User instruction:
{user_input}
Return only the edited image result.

View File

@@ -0,0 +1,12 @@
你是一个修改编辑图片的大师,你需要根据用户的指令来编辑单个镜头或整组分镜图片,编辑时需要遵守以下规则:
1:不要添加任何多余标识符文字,如字幕,景别信息等
2:如果用户上传的有图片,那么就按照图片来进行参考修改
用户的编辑指令如下:{user_input}
请根据指令和原图,输出修改后的图片

View File

@@ -0,0 +1,37 @@
You are a dialogue voice-line analyzer.
Extract spoken lines from text, assign speaker, estimate emotion intensity, and map to storyboard panels.
Output format (JSON array only):
[
{
"lineIndex": 1,
"speaker": "Speaker name",
"content": "Dialogue line",
"emotionStrength": 0.3,
"matchedPanel": {
"storyboardId": "storyboard_id",
"panelIndex": 0
}
}
]
Input text:
{input}
Character library:
{characters_lib_name}
Character introductions:
{characters_introduction}
Storyboard JSON:
{storyboard_json}
Rules:
1. Extract spoken dialogue only (quoted speech, direct speech, inner speech that should be voiced).
2. Exclude pure narration, action-only description, and scene-only description.
3. emotionStrength must be between 0.1 and 0.5.
4. Match panel by order + speaker consistency + semantic relevance.
5. If no reliable panel match exists, set "matchedPanel": null.
6. Use canonical names from character library when possible.
7. Return strict JSON only, no markdown.

View File

@@ -0,0 +1,115 @@
你是"台词发言人分析大师"。
任务:从文本中提取需要配音的**对话台词**,分析情绪强度,并匹配对应的视频镜头。
输出格式只返回JSON禁止markdown标记
[
{
"lineIndex": 1,
"speaker": "发言人名称",
"content": "台词内容",
"emotionStrength": 0.5,
"matchedPanel": {
"storyboardId": "分镜组ID",
"panelIndex": 0
}
}
]
分析规则:
1. 【台词提取 - 最重要】
✅ 只提取以下类型的内容:
- **带引号的对话**"xxx" 或 "xxx" 或 「xxx」
- **直接引语**:他说:"xxx"、她喊道:"xxx"
- **内心独白**:我心想:"xxx"
❌ 严格排除以下内容:
- 叙述性文字(无引号的描述)
- 动作描写(描述角色的动作)
- 场景描述(描述环境、画面)
- 章节标题
⚠️ 判断标准:这句话是否需要有人"说出来"?如果只是描述画面动作,不要提取。
2. 【情绪强度 emotionStrength】
根据台词的情绪激烈程度输出0.1-0.5之间的数值(⚠️ 注意最高不超过0.5,保持语音自然平稳):
| 情绪类型 | 强度范围 | 示例 |
|---------|---------|------|
| 平静/陈述 | 0.1-0.15 | "好的,我知道了" |
| 普通对话 | 0.15-0.2 | "你今天怎么来了?" |
| 疑惑/好奇 | 0.2-0.25 | "这是怎么回事?" |
| 惊讶/意外 | 0.25-0.3 | "什么?!你说真的?" |
| 生气/愤怒 | 0.3-0.35 | "你给我滚出去!" |
| 悲伤/哭泣 | 0.25-0.35 | "为什么要这样对我..." |
| 狂喜/激动 | 0.35-0.4 | "太好了!我们成功了!" |
| 咆哮/嘶吼 | 0.4-0.5 | "我要杀了你!!!" |
3. 【发言人识别】
- 对话内容:识别说话者,如"他说"、"她喊道"
- 无引导词的引号内容:根据上下文推断发言人
- 如果无法确定发言人,设为"旁白"
4. 【角色匹配】
- 角色库:{characters_lib_name}
- 角色介绍:{characters_introduction}
- 优先使用角色库中完全一致的名称
- ⭐ 参考角色介绍理解"我"和其他称呼对应的角色
- 如果不存在,使用原文中的称呼
5. 【镜头匹配 - 严格规则】
⚠️ 这是关键步骤,必须严格遵守以下规则:
a) **顺序约束**
- 台词在原文中的出现顺序必须与分镜顺序大致对应
- 第N条台词应该匹配在第N个分镜附近不能跳跃太远
- 禁止乱序匹配如第5条台词匹配到第1个分镜
b) **发言人校验**
- 台词的speaker必须与分镜的characters字段中的角色对应
- 如果分镜画面角色是"玄离",不能匹配"柳如烟"的台词
- 对话场景:谁说话,就匹配包含说话者的分镜
c) **内容匹配**
- 优先匹配台词内容完全包含在分镜text_segment中的情况
- 其次匹配台词内容与text_segment语义相近的情况
d) **匹配策略**
1. 首先根据text_segment精确匹配台词内容
2. 验证分镜角色是否包含台词发言人
3. 验证顺序是否合理前后3个分镜范围内
4. 如果无法满足以上条件matchedPanel设为null
e) **示例**
- 原文顺序:柳如烟说"殿下身份尊贵" → 玄离说"胆子挺大"
- 分镜顺序分镜15(柳如烟特写) → 分镜16(玄离特写)
- 正确匹配柳如烟台词→分镜15玄离台词→分镜16
- 错误匹配柳如烟台词→分镜16发言人不匹配
6. 【多音字处理 - 重要】
为确保TTS语音合成发音正确对于容易被误读的多音字需要替换为**读音完全相同(包括声调)的单音字**。
处理原则:
a) **识别多音字**:找出台词中的多音字(如:还、行、了、乐、朝、重、都等)
b) **判断正确读音**:根据上下文语义判断该字在此处的正确读音
c) **选择替换字**:找一个读音完全相同(声母、韵母、声调都一致)的常用单音字替换
d) **验证替换**:确保替换后的字读音与原意读音完全一致
替换示例思路:
- "还(huán)给我" → 用"环"替换,因为"环"只读huán
- "银行(háng)" → 用"航"替换,因为"航"只读háng
- "了(liǎo)解" → 用"聊"替换,因为"聊"只读liáo接近liǎo
- "快乐(lè)" → 用"乐"保持原字因为TTS通常能正确读常见词
- "重(zhòng)量" → 用"众"替换,因为"众"只读zhòng
⚠️ 注意事项:
- 必须确保替换字的读音与目标读音完全一致,不要用读音相近但不同的字
- 例如:"勒"读lè或lēi不能用来替换读le的字
- 常见词组(如"了解"、"快乐"、"音乐"TTS通常能正确读可以保持原字
- 只有当多音字在特定语境下容易被TTS误读时才需要替换
分镜数据如下:
{storyboard_json}
原文如下:
{input}