自托管 · $0/视频可能 · 21 个代理

输入一个主题。获取一个视频。

VigenFlow 是一个将任何主题转化为可发布 YouTube 视频的 AI 流水线:研究、脚本、语音、逐场景视频、一致角色、字幕、SEO、缩略图和短视频。完全自动化。在您自己的设备上运行。

21 个生产代理 多语言 YouTube · Facebook · TikTok · Instagram
vigenflow

The Accountant Who Found Two Sets of Books In The CEO's Safe

0浏览次数
0点赞次数
+0订阅次数

它是如何工作的

三步完成 视频制作

无需UI, 无需云订阅。您的机器,您的密钥,您的内容。

步骤 01

输入您的主题

一条命令。VigenFlow 自动研究角度、痛点和热门钩子。无需模板,无需手动输入。

python main.py "The Accountant Who Found Two Sets of Books"
步骤 02

21 个代理运行端到端

10 个管道步骤,21 个专用代理。每个步骤都有一个专用的 AI 审核员,具有重试逻辑。如果质量低于您的阈值,管道将停止。

Topic Review → Research → Script → Character
→ Images → Voice → Video → Subtitles
→ Effects → SEO → Thumbnail → Shorts
→ Final Review (score gate)
步骤 03

获取可发布成果

最终视频,3 个短片,缩略图,SEO 元数据和章节。所有内容均已评分。准备好上传或安排。

✓ Score: 8.6/10 - Ready to upload
✓ video:     final_video.mp4  (36 MB)
✓ shorts:    hook / climax / moral
✓ thumbnail: thumbnail.png
✓ seo:       seo.json

多方案演示

一条命令。
四个视觉层级。

相同主题:python main.py "The Accountant Who Found Two Sets of Books"四个视觉输出。VigenFlow 根据您的 API 密钥自动选择。

免费层:$0/视频
付费层:自带密钥
免费素材$0 / 视频

Pexels · Pixabay · Unsplash

来自 Pexels, Pixabay 和 Unsplash 的真实镜头。无需 API 密钥。

免费 AI$0 / 视频

Gemini Flash · MLX Flux · Pollinations

Gemini Flash 免费层,MLX Flux 本地设备(Apple Silicon),或 Pollinations 云。无需 API 密钥。

AI + 角色~$0.30 / 视频

Gemini img2img · Flux Kontext · Imagen 3

每个频道只需初始化一次角色。Gemini img2img, Replicate Flux Kontext, 或 Imagen 3 保持每个场景的相同面部。

AI 视频~$1–2 / 视频

Seedance · Kling · Wan2.1 · Hailuo · Runway

具有实际运动的场景级视频。可以在一行配置中切换提供者。

相同主题 · 不同提供者 · 无手动编辑

功能

一条命令。 随时可发布的视频。

21 个代理,每个都可以独立审查、重试和替换。审查和重新生成任何场景,然后导出。

独特

AI 审核循环

每个步骤都有一个专用的审查代理。脚本、图像、音频、缩略图,都评分和自动重试,多达 3×。没有其他工具可以做到这一点。

独特

每场景视频

每个脚本场景都有自己的图像序列、语音剪辑、字幕块和时序,组装成一个完整的电影视频。

独特

角色一致性

每个频道只需初始化一次角色。相同的面孔,相同的视觉风格,自动应用于每个视频的每个场景。

独特

评分卡

每次运行都根据 hook、CTA、弧线、气氛、紧张度进行评分。包括货币化风险评分。每个视频的参与度预测。

还包括

多 LLM

Claude → Gemini → GPT-4o → Grok。每个步骤自动回退,无提供商锁定。免费层首先。

多层语音

ElevenLabs → OpenAI TTS → Kokoro (本地,无 API 密钥,在设备上运行) → Edge TTS (免费云) → gTTS。选择您的质量层或让链自动选择。

多源图像

Imagen 3 → DALL-E 3 → Pollinations → Pixabay → Pexels。8 个提供商级联。始终有图像。

AI 视频片段

Seedance · Kling · Wan2.1 · Hailuo · Runway。交换提供商在一个配置行中。新的提供商将定期添加,因为市场不断发展。

自动短片

3 个垂直剪辑(hook / 高潮 / 道德),带有卡拉 OK 风格的黄色文字突出显示。适用于 TikTok、Facebook Reels、Instagram Reels 和 YouTube Shorts。

市场机遇

$3.4B
2033年AI视频市场规模
相比2025年的$788M
12h+
每个视频节省的时间
相比手动编辑
$80K–300K
月收入
顶级无人频道
38%
2025年新频道中无人频道的比例
相比2022年的12% ·

为什么选择VigenFlow

不只是另一个 剪辑工具。

大多数工具只是剪辑、添加字幕或改用现有素材。VigenFlow从零开始创建:仅需一条命令即可完成整个生产流程。

独有的审核循环

每个代理都有专属的审查员。剧本根据吸引力、情节和行动号召进行评分。图像会被检查是否有水印、重复和视觉一致性。失败的步骤会自动重试,最多3次。

检视并重新生成任意场景

不满意某个场景的图像或声音?审查输出,重新生成该场景,并重新组装。完全手动控制,无需重新启动整个流程。

跨视频的角色一致性

为每个频道配置文件初始化一次角色。相同的面孔,相同的视觉风格,覆盖每个视频的每个场景。支持Imagen 3和Pollinations FLUX。

您的密钥。您的机器。零订阅。

$0/视频是真实的:Gemini免费层用于LLM,Kokoro(本地)用于语音,Pollinations(免费)用于图像。可选的付费提供商,您可以自带密钥。

对比

VigenFlow 的差异化优势

没有其他工具既是开源的、可自托管的,又拥有完整的 AI 审核循环和功能对等性。

工具价格开源自托管完整流水线AI 审核循环多 LLM短视频生成评分卡越南语免费方案
VigenFlow
$0*
In*** AI
$28/mo
Sy***ia
$29/mo
Auto***ts
$19/mo
Pi***ry
$19/mo
He***en
$24/mo

* 使用 Gemini 免费方案 + Kokoro(本地 TTS)+ Pollinations(免费图像)可实现 $0/视频。付费 API 为可选项。

用例

任何渠道。 任何领域。

戏剧、财经、健康、动画、纪录片。VigenFlow 通过 YAML 配置文件适应您的渠道,而不是模板选择器。

戏剧 / 真实犯罪

无面故事频道

输入故事角度 → 15 场电影视频,统一角色,男声,卡拉OK字幕。3 个病毒式短片自动剪辑和调整大小以适应 TikTok。

  • 15 场 / 视频
  • ~4 分钟生产
  • 3 个短片自动剪辑
财经,历史,健康...

任何主题,任何视觉风格

带有动画主持人的财经解释,带有档案风格图像的历史纪录片,带有温暖旁白的健康频道。每个频道都有自己的 YAML 配置文件来控制声音,视觉风格,审查阈值和语言。

  • 每个频道的 YAML 配置文件
  • EN,VI 和 10+ 语言
  • 无限频道
机构和高级用户

大规模的多频道生产

每个频道运行并行管道。每个都有自己的声音,视觉风格,LLM 链和审查阈值。评分卡跟踪每次运行的质量。

  • 并行频道运行
  • 每个频道配置文件
  • 完整评分卡

推荐语

创作者们 这样说

仅审阅循环就为我每个视频节省了 3 小时。以前需要 4 个手动轮次的脚本现在可以自动通过或以确切的修复方式标记。

Marcus T.
Marcus T.
戏剧频道 · 127K 订阅者

我曾花费 $400/月雇佣自由职业者进行配音和编辑。VigenFlow 取代了所有这些。在第一个月,我制作了 12 个视频,API 调用费用不到 $8。

Sarah K.
Sarah K.
财经频道 · 43K 订阅者

角色一致性是一个游戏规则的改变者。我的观众现在可以在每个视频中识别出旁白。切换后,留存率增加了 22%。

James W.
James W.
历史纪录片 · 89K 订阅者

同时运行 4 个频道。每个频道都有其自己的配置文件和语音。评分卡告诉我应该发布哪个视频和哪个视频需要重做。

Linh P.
Linh P.
机构所有者 · 6 个活跃频道

免费堆栈是真实的。我使用了 Gemini 免费层、Kokoro 进行语音和 Pollinations 进行图像。运行了 30 个视频,花费 $0。每次都让我惊讶的质量。

Omar A.
Omar A.
健康频道 · 31K 订阅者

我制作越南语内容。FPT TTS 集成可以本地工作,字幕准确,SEO 输出是本地化的。市场上没有其他产品可以做到这一点。

Nguyen H.
Nguyen H.
生活方式频道 · 58K 订阅者 · VI

仅审阅循环就为我每个视频节省了 3 小时。以前需要 4 个手动轮次的脚本现在可以自动通过或以确切的修复方式标记。

Marcus T.
Marcus T.
戏剧频道 · 127K 订阅者

我曾花费 $400/月雇佣自由职业者进行配音和编辑。VigenFlow 取代了所有这些。在第一个月,我制作了 12 个视频,API 调用费用不到 $8。

Sarah K.
Sarah K.
财经频道 · 43K 订阅者

角色一致性是一个游戏规则的改变者。我的观众现在可以在每个视频中识别出旁白。切换后,留存率增加了 22%。

James W.
James W.
历史纪录片 · 89K 订阅者

同时运行 4 个频道。每个频道都有其自己的配置文件和语音。评分卡告诉我应该发布哪个视频和哪个视频需要重做。

Linh P.
Linh P.
机构所有者 · 6 个活跃频道

免费堆栈是真实的。我使用了 Gemini 免费层、Kokoro 进行语音和 Pollinations 进行图像。运行了 30 个视频,花费 $0。每次都让我惊讶的质量。

Omar A.
Omar A.
健康频道 · 31K 订阅者

我制作越南语内容。FPT TTS 集成可以本地工作,字幕准确,SEO 输出是本地化的。市场上没有其他产品可以做到这一点。

Nguyen H.
Nguyen H.
生活方式频道 · 58K 订阅者 · VI

常见问题

常见 问题

该流水线是免费和开源的。使用Gemini(免费层)+ 免费的库存提供商,您可以以$0生成完整的视频。可选:ElevenLabs语音(~$0.30/视频),DALL-E 3图像(~$0.50/视频)

如果您可以在终端中运行`pip install`和`python script.py`,则可以运行VigenFlow。无需Web开发或ML背景

YouTube长视频,YouTube Shorts,TikTok,Facebook Reels,Instagram Reels。每个平台的宽高比,时长,LUFS目标和字幕样式会自动调整

10-40分钟,取决于提供商。ElevenLabs + Imagen 3 = 15分钟。仅免费堆栈 = 35分钟。完全无人值守

语音链按顺序尝试:ElevenLabs(高级,自然度最高),OpenAI TTS(付费,质量良好),Kokoro(免费,在您的机器上本地运行,无需API密钥),Edge TTS(免费云,无需密钥)。对于零成本,Kokoro提供最好的质量。在Apple Silicon或CPU上运行。Edge TTS可以在任何机器上运行,无需设置

是的。越南语使用FPT AI TTS本地。任何Gemini支持的语言都可以使用。ElevenLabs多语言或Edge TTS作为回退

所有三个。需要Python 3.11+和FFmpeg。在macOS Apple Silicon,Intel和Ubuntu上测试。Windows通过WSL2工作

是的。桌面GUI应用程序(Mac,Windows,Linux)正在开发中,适用于那些不想使用终端的用户。相同的流水线在后台,视觉主题输入,实时进度查看和一键导出。不需要编码

是的。计划有一个云托管版本,因此您可以在浏览器中输入主题并在不安装任何本地内容的情况下接收视频。它将使用相同的流水线和评分系统,按视频计费。早期访问列表已开放

通过YouTube Data API的自动上传几乎完成。当启用时,通过评分门槛的视频将自动上传,包括生成的标题,描述,标签,章节和缩略图。不需要YouTube Studio

提前体验

请求一个 演示

我们正在为选定的创作者和机构提供服务。请告诉我们关于您的频道,我们将联系您安排一个实时演示。

没有垃圾邮件。没有销售推销。只有对工具的真实演示。