Direktor¶

Transform text content into engaging podcast-style videos with AI

Direktor is a Python library that converts written content into visually engaging podcast-style videos. Using state-of-the-art AI models, it automatically generates narration, creates synchronized visuals, and produces professional-quality video content.

Key Features¶

AI-Powered Script Generation - Converts any text into engaging podcast scripts using GPT models
Text-to-Speech - High-quality voice synthesis using the BARK model
Dynamic Image Generation - Creates contextual visuals using FLUX image generation
Automatic Synchronization - Aligns audio, images, and text overlays seamlessly
Resumable Pipeline - 6-stage processing allows resuming from any point
Configurable - Extensive customization options via environment variables

Quick Start¶

# Install Direktor
uv add direktor

# Set up your API keys in .env file
# Run the pipeline
direktor input.txt

Pipeline Overview¶

Direktor uses a 6-stage pipeline:

Content Optimization - Enhances text for better narration
Script Generation - Creates an engaging podcast script
Audio Generation - Converts script to speech
Transcript Generation - Creates timestamped transcript
Image Generation - Generates contextual visuals
Video Creation - Combines everything into final video

Requirements¶

Python 3.11+
FFmpeg (system dependency)
API keys for: OpenAI, Replicate
Cloud storage (Cloudflare R2 or S3-compatible)

Next Steps¶

Installation Guide - Detailed setup instructions
Quick Start Tutorial - Create your first video
API Reference - Detailed API documentation