仿OiiOii 故事转电影生成器 - 开发历程全记录
📖 项目起源
💡 我的产品创意
我希望创建一个能够:
将用户输入的故事自动转换为电影视频(其实是我想要模仿oiioii的这个故事生视频功能)
保持角色在不同场景中的一致性(这个是gemini给我讲的oiioii的技术核心是角色一致性)
成本尽可能低(OiiOii 级别的低成本)
操作简单,用户友好
说人话版:故事一开始是这样的,我在某个场景知道了oiioii这个软件,我就对它的故事生视频功能很感兴趣,我就去问了gemini,譬如oiioii的这个故事生视频功能是怎么实现的,用了哪些技术,我用claude code能不能仿写它之类的。然后gemini就耐心的给我讲了它的功能,实现方法以及技术难点之类的。最终在我和gemini的多轮交互之下,我让gemini给我写了一份项目需求文档。最后再把这份需求文档扔给claude code,让它根据这份需求文档开始给我干活。
📋 项目概述
仿OiiOii 故事转电影生成器 是一个低成本的故事转电影应用,通过 AI 技术实现角色一致性的视频生成。项目的核心理念是:主要成本只来自图像生成,视频生成完全免费(哈哈,一开始这么想的,后来被打脸了,想要结果好还得花钱用API)。
基本信息
项目名称:仿OiiOii 故事转电影生成器
代码行数:约 2000+ 行
开发周期:多轮迭代开发
技术栈:Python + Streamlit + DeepSeek + Replicate/fal.ai/Grok + MoviePy + OpenCV
🎯 核心策略
聪明的成本优化方案:
图像生成:使用 AI API(Replicate InstantID 等)→ 成本约 $0.03/场景
视频生成:本地处理(完全免费)或使用免费方案(Grok)
总成本:5 个场景的电影只需约 $0.15
🏗️ 第一阶段:架构设计
🔧 技术栈确定
我在 prompt.md 中清晰地定义了技术栈(哈哈,其实都是gemini给我说的):
组件 技术选择 理由 脚本引擎 DeepSeek API 成本低,理解能力强 图像引擎 Replicate InstantID 角色一致性最好 视频引擎 MoviePy + OpenCV 本地处理,完全免费 UI 框架 Streamlit 快速开发,Python 原生
📐 工作流程设计
我设计了清晰的三阶段工作流(其实这个工作流也是让gemini给我设计的):
代码块 ┌─────────────────────────────────────────────────────────────┐ │ Phase 1: 故事分析 │ │ 用户输入故事 → DeepSeek 拆分为 3-10 个场景(JSON 格式) │ └─────────────────────────────────────────────────────────────┘ ↓ ┌─────────────────────────────────────────────────────────────┐ │ Phase 2: 导演剪辑版 │ │ 显示场景列表 → 用户可编辑每个场景的提示词和时长 │ └─────────────────────────────────────────────────────────────┘ ↓ ┌─────────────────────────────────────────────────────────────┐ │ Phase 3: 制片阶段 │ │ 循环每个场景: │ │ Step A: API 生成图像(成本约 $0.03/场景) │ │ Step B: 本地创建视频(免费)或 API 生成 │ │ Step C: 合并所有场景为最终电影 │ └─────────────────────────────────────────────────────────────┘
💻 第二阶段:核心功能开发
🏗️ 2.1 基础框架搭建(Claude Code 负责)
Claude Code 创建了 app.py 的基础结构,包括:
🔑 Session State 管理
代码块
为了更好的阅读体验,来飞书看吧:
Comments on "我的第一个AI产品开发历程(AI视频生成网站)" :