Pipeline 100% bash para análise de vídeos virais e geração de playbooks de produção.
Zero Python. Zero venv. Só bash + curl.
- Baixa o vídeo (yt-dlp ou HikerAPI fallback)
- Extrai frames em alta densidade (2fps)
- Transcreve o áudio com Whisper (via Groq)
- Analisa cada frame com Gemini Vision
- Gera um PLAYBOOK.md detalhado
sudo apt install ffmpeg jq curl
pip install -U yt-dlp# 1. Configurar API keys
cp .env.example .env
# Editar .env:
# - GROQ_API_KEY (transcrição)
# - OPENROUTER_API_KEY (vision + texto)
# - HIKERAPI_KEY (fallback Instagram - opcional)
# 2. Tornar executável
chmod +x *.sh
# 3. Carregar variáveis
source .env
# 4. Processar um Reels
./generate-playbook.sh "https://www.instagram.com/reel/XXXXX/"/tmp/reels-XXXXX/
├── video.mp4 # Vídeo original
├── audio.wav # Áudio extraído
├── transcript.txt # Transcrição
├── transcript_timed.txt # Com timestamps
├── frame_analysis.json # Análise de cada frame
├── PLAYBOOK.md # Playbook final
└── frames/
└── frame_XXXX.jpg # Frames extraídos
| Componente | Custo/vídeo |
|---|---|
| Groq Whisper | ~$0.00 (free tier) |
| Gemini Flash (vision) | ~$0.01-0.05 |
| Gemini Flash (playbook) | ~$0.01-0.02 |
| Total | ~$0.02-0.07 |
Configurar em .env:
VISION_MODEL=google/gemini-2.5-flash-preview # default
TEXT_MODEL=google/gemini-2.5-flash-preview # defaultAlternativas:
google/gemini-2.5-pro-preview(melhor qualidade)anthropic/claude-sonnet-4openai/gpt-4o
| Script | Função |
|---|---|
generate-playbook.sh |
Orquestrador principal |
01-download.sh |
Baixa vídeo (yt-dlp + HikerAPI) |
02-extract-frames.sh |
Extrai frames (ffmpeg) |
03-transcribe.sh |
Transcreve (Groq Whisper) |
04-analyze-frames.sh |
Analisa frames (Gemini) |
05-generate-playbook.sh |
Gera PLAYBOOK.md |
# Criar arquivo com URLs
cat > urls.txt << 'URLS'
https://www.instagram.com/reel/ABC123/
https://www.instagram.com/reel/DEF456/
URLS
# Processar todos
source .env
for url in $(cat urls.txt); do
./generate-playbook.sh "$url"
done