PaellaDoc supports three engines today: Claude Code, Codex, Gemini. None is universally best. Pick based on billing model, task type, and latency tolerance.
🇬🇧 English
PaellaDoc supports three engines today. None of them is universally best. Pick based on three factors: billing model, task type, latency tolerance.
Claude Code (Anthropic)
- Billing: subscription (Claude Pro / Max plan) OR API key per token
- Strengths: best at long-context reasoning, refactoring across many files, following complex specs literally, producing structured output (artifacts, decision records). Strong on test-driven workflows.
- Weaknesses: slower than Codex on small isolated changes. The subscription has session limits that can hit you mid-iteration.
- Recommended for: dev with repo, PM workflow, anything where the artifact tree matters.
Codex (OpenAI)
- Billing: API key per token (no subscription path for the CLI we use)
- Strengths: fastest for small isolated edits, very fluent in JavaScript/TypeScript and Python, low latency.
- Weaknesses: context window smaller than Claude when you really need to load a big spec. Less reliable at following the canonical artifact format word for word.
- Recommended for: rapid iteration on a focused feature, no-coder mode where the brief is small and the scaffold is small.
Gemini (Google)
- Billing: API key per token, generous free tier
- Strengths: huge context window (good for very large repos), free tier is genuinely usable for experimentation.
- Weaknesses: more variable output quality than Claude or Codex, sometimes verbose. Tool-use reliability is still catching up.
- Recommended for: experimentation, learning the orchestrator without committing to a paid plan, very large repos.
The honest part
PaellaDoc is designed to be engine-agnostic by port, not just by adapter. That means: if a new engine appears tomorrow that destroys all three on quality and price, PaellaDoc adopts it with an adapter, no domain change. So this comparison expires every few months — re-read with that in mind.
Switching mid-project
You can. Each user story declares which engine ran it. The decision_record captures which engine made which decision. If you switch from Claude to Codex halfway through, the trace tells you which artifact belongs to which engine. Useful when debugging “wait, why was this done this way”.
What we explicitly do NOT do
- No rate-limit UI: if your subscription saturates, PaellaDoc shows you the raw provider error. No fake reassuring messages.
- No per-action cost banner: subscription users don’t see a “$0.02 spent” toast every time the engine runs. That would be insulting.
- No fallback without consent: if you set Claude as your engine and it fails, PaellaDoc does not silently retry with Codex. You decide.
🇪🇸 Español
PaellaDoc soporta tres motores hoy. Ninguno es universalmente el mejor. Elige según tres factores: modelo de facturación, tipo de tarea, tolerancia a latencia.
Claude Code (Anthropic)
- Facturación: suscripción (plan Claude Pro / Max) O API key por token
- Fortalezas: el mejor en razonamiento de contexto largo, refactor a lo largo de muchos archivos, seguir specs complejas al pie de la letra, producir output estructurado (artefactos, decision records). Sólido en flujos TDD.
- Debilidades: más lento que Codex en cambios pequeños aislados. La suscripción tiene límites de sesión que te pueden pillar a mitad de iteración.
- Recomendado para: dev con repo, workflow de PM, todo lo que el árbol de artefactos importe.
Codex (OpenAI)
- Facturación: API key por token (sin ruta de suscripción para la CLI que usamos)
- Fortalezas: el más rápido para edits aislados, muy fluido en JavaScript/TypeScript y Python, baja latencia.
- Debilidades: ventana de contexto más pequeña que Claude cuando de verdad necesitas cargar una spec grande. Menos fiable siguiendo el formato canónico de artefactos al pie de la letra.
- Recomendado para: iteración rápida en una feature focalizada, modo no-coder cuando el brief es pequeño y el scaffold es pequeño.
Gemini (Google)
- Facturación: API key por token, free tier generoso
- Fortalezas: ventana de contexto enorme (bueno para repos muy grandes), free tier genuinamente usable para experimentar.
- Debilidades: calidad de output más variable que Claude o Codex, a veces prolijo. Fiabilidad en tool-use aún se está poniendo al día.
- Recomendado para: experimentación, aprender el orquestador sin comprometerte a un plan de pago, repos muy grandes.
La parte honesta
PaellaDoc está diseñado para ser agnóstico al motor por puerto, no solo por adapter. Eso significa: si mañana aparece un motor nuevo que aplasta a los tres en calidad y precio, PaellaDoc lo adopta con un adapter, sin tocar dominio. Por eso esta comparación caduca cada pocos meses — léela con eso en mente.
Cambiar a mitad de proyecto
Puedes. Cada user story declara qué motor la corrió. El decision_record captura qué motor tomó qué decisión. Si cambias de Claude a Codex a mitad de camino, la traza te dice qué artefacto pertenece a qué motor. Útil cuando depuras “espera, ¿por qué se hizo esto así?”.
Lo que explícitamente NO hacemos
- Sin UI de rate-limit: si tu suscripción satura, PaellaDoc te muestra el error crudo del proveedor. Sin mensajes tranquilizadores falsos.
- Sin banner de coste por acción: los usuarios con suscripción no ven un toast de “$0.02 gastados” cada vez que el motor corre. Sería insultante.
- Sin fallback sin consentimiento: si pones Claude como motor y falla, PaellaDoc no reintenta silenciosamente con Codex. Tú decides.