告别平庸:我开发了一个能“拷问灵魂”的 AI 编剧助手
在 AI 写作已经普及的今天,我们经常遇到一个尴尬的问题:AI 写的剧本太“干”了。
如果你让 AI 写一个“葬礼上的故事”,它大概率会给你一个充满陈词滥调的感人剧本。但真正的戏剧张力不源于文字的堆砌,而源于人性深处的冲突。为了解决这个问题,我开发了 One-Shot Script。
核心理念:深度的多轮挖掘,换取精准的一次生成
与其说它是一个生成器,不如说它是一个 “灵魂审讯官”。
大部分 AI 工具是“一问一答”式:
用户:“写个剧本。” AI:“好的,这是剧本。”(产出:平庸)
One-Shot Script 的逻辑是:
用户:“我有个点子。” AI:“先等等,这个角色的伤痕是什么?他为什么要在这个时刻爆发?如果他赢了,他会失去什么?”(产出:灵魂挖掘)
只有当故事的“潜台词”和“动机”被彻底挖透,系统才会触发那“一箭穿心”式的最终生成。
技术架构:单脑统筹 (Orchestrator) + 物理工具链
不同于市面上常见的、由于通讯损耗容易导致逻辑断层的多 Agent 协作,我采用了一套更为精简且强悍的 Orchestrator(统筹导演)架构。
1. 单 Agent 贯穿全流程 (Pure Logic Architecture)
系统由一个具备“导演、编剧、制作人”多重身份的 核心 Agent 驱动。这种设计避免了在多个 Agent 间传递信息时的语境丢失:
- 灵魂挖掘逻辑:Agent 内部嵌入了苏格拉底式的交互逻辑。它深知剧本创作的潜规则,在 3-5 轮对话中,它会化身为严苛的“审讯官”,只提问、不给答案,逼迫用户触及故事的核心。
- 全场景状态控制:同一个“大脑”在挖掘完灵魂后,立即无缝切换到剧作家模式,将之前的深度上下文直接淬炼成专业剧本,确保了情节与人性的高度一致。
2. 物理工具链的自动化闭环 (The Toolchain)
当剧本生成后,系统通过高度集成的物理工具,将文字瞬间转化为音频资产:
- 智能语义清洗:系统在生成音频清单时,会自动过滤掉剧本中的表演指令(如
[低声沙哑]),只保留纯台词,防止 TTS 引擎读出括号里的内容。 - 物理路径管理:工具支持传递 绝对路径。Agent 负责定义目标,物理脚本负责精准落盘,这使得该工具能够无缝集成到任何生产环境。
- 批量并行合成:调用
azure_speech_synthesis_tool,多角色音频并发生成,并自动产出《音频列表.md》作为最终交付文档。
实际效果演示
在演示中,你可以看到:
- 从模糊到清晰:原本只是一个“想笑的男人”,在 AI 的拷问下,变成了一个“在父亲留下的冷笑话集里寻找救赎”的深刻故事。
- 零人工干预:从点击“生成”到本地文件夹里自动出现一排排整齐的角色 MP3 文件,整个过程行云流水。
结语
One-Shot Script 的本质是 尊重创作的复杂性。它证明了:在 AI 时代,技术不应该取代思考,而应该通过流程的设计,迫使我们思考得更深。
项目开源/详情: [https://github.com/spacegt-master/One-Shot-Script]
#AI剧本 #生成式AI #AzureTTS #提示词工程 #OneShotScript #AgenticWorkflow
