Claude Code vs Codex vs Gemini — choosing your engine

jlcases · May 18, 2026, 7:03pm

PaellaDoc supports three engines today: Claude Code, Codex, Gemini. None is universally best. Pick based on billing model, task type, and latency tolerance.

🇬🇧 English

PaellaDoc supports three engines today. None of them is universally best. Pick based on three factors: billing model, task type, latency tolerance.

Claude Code (Anthropic)

Billing: subscription (Claude Pro / Max plan) OR API key per token
Strengths: best at long-context reasoning, refactoring across many files, following complex specs literally, producing structured output (artifacts, decision records). Strong on test-driven workflows.
Weaknesses: slower than Codex on small isolated changes. The subscription has session limits that can hit you mid-iteration.
Recommended for: dev with repo, PM workflow, anything where the artifact tree matters.

Codex (OpenAI)

Billing: API key per token (no subscription path for the CLI we use)
Strengths: fastest for small isolated edits, very fluent in JavaScript/TypeScript and Python, low latency.
Weaknesses: context window smaller than Claude when you really need to load a big spec. Less reliable at following the canonical artifact format word for word.
Recommended for: rapid iteration on a focused feature, no-coder mode where the brief is small and the scaffold is small.

Gemini (Google)

Billing: API key per token, generous free tier
Strengths: huge context window (good for very large repos), free tier is genuinely usable for experimentation.
Weaknesses: more variable output quality than Claude or Codex, sometimes verbose. Tool-use reliability is still catching up.
Recommended for: experimentation, learning the orchestrator without committing to a paid plan, very large repos.

The honest part

PaellaDoc is designed to be engine-agnostic by port, not just by adapter. That means: if a new engine appears tomorrow that destroys all three on quality and price, PaellaDoc adopts it with an adapter, no domain change. So this comparison expires every few months — re-read with that in mind.

Switching mid-project

You can. Each user story declares which engine ran it. The decision_record captures which engine made which decision. If you switch from Claude to Codex halfway through, the trace tells you which artifact belongs to which engine. Useful when debugging “wait, why was this done this way”.

What we explicitly do NOT do

No rate-limit UI: if your subscription saturates, PaellaDoc shows you the raw provider error. No fake reassuring messages.
No per-action cost banner: subscription users don’t see a “$0.02 spent” toast every time the engine runs. That would be insulting.
No fallback without consent: if you set Claude as your engine and it fails, PaellaDoc does not silently retry with Codex. You decide.

🇪🇸 Español

PaellaDoc soporta tres motores hoy. Ninguno es universalmente el mejor. Elige según tres factores: modelo de facturación, tipo de tarea, tolerancia a latencia.

Claude Code (Anthropic)

Facturación: suscripción (plan Claude Pro / Max) O API key por token
Fortalezas: el mejor en razonamiento de contexto largo, refactor a lo largo de muchos archivos, seguir specs complejas al pie de la letra, producir output estructurado (artefactos, decision records). Sólido en flujos TDD.
Debilidades: más lento que Codex en cambios pequeños aislados. La suscripción tiene límites de sesión que te pueden pillar a mitad de iteración.
Recomendado para: dev con repo, workflow de PM, todo lo que el árbol de artefactos importe.

Codex (OpenAI)

Facturación: API key por token (sin ruta de suscripción para la CLI que usamos)
Fortalezas: el más rápido para edits aislados, muy fluido en JavaScript/TypeScript y Python, baja latencia.
Debilidades: ventana de contexto más pequeña que Claude cuando de verdad necesitas cargar una spec grande. Menos fiable siguiendo el formato canónico de artefactos al pie de la letra.
Recomendado para: iteración rápida en una feature focalizada, modo no-coder cuando el brief es pequeño y el scaffold es pequeño.

Gemini (Google)

Facturación: API key por token, free tier generoso
Fortalezas: ventana de contexto enorme (bueno para repos muy grandes), free tier genuinamente usable para experimentar.
Debilidades: calidad de output más variable que Claude o Codex, a veces prolijo. Fiabilidad en tool-use aún se está poniendo al día.
Recomendado para: experimentación, aprender el orquestador sin comprometerte a un plan de pago, repos muy grandes.

La parte honesta

PaellaDoc está diseñado para ser agnóstico al motor por puerto, no solo por adapter. Eso significa: si mañana aparece un motor nuevo que aplasta a los tres en calidad y precio, PaellaDoc lo adopta con un adapter, sin tocar dominio. Por eso esta comparación caduca cada pocos meses — léela con eso en mente.

Cambiar a mitad de proyecto

Puedes. Cada user story declara qué motor la corrió. El decision_record captura qué motor tomó qué decisión. Si cambias de Claude a Codex a mitad de camino, la traza te dice qué artefacto pertenece a qué motor. Útil cuando depuras “espera, ¿por qué se hizo esto así?”.

Lo que explícitamente NO hacemos

Sin UI de rate-limit: si tu suscripción satura, PaellaDoc te muestra el error crudo del proveedor. Sin mensajes tranquilizadores falsos.
Sin banner de coste por acción: los usuarios con suscripción no ven un toast de “$0.02 gastados” cada vez que el motor corre. Sería insultante.
Sin fallback sin consentimiento: si pones Claude como motor y falla, PaellaDoc no reintenta silenciosamente con Codex. Tú decides.

Fernan2 · May 19, 2026, 12:31pm

Which option would you recommend for a pet project?

paelladoc_help_bot · May 19, 2026, 12:35pm

For a pet project, I’d say: Codex if you want to move fast on small changes, or Gemini if you prioritize low cost / free tier and you’re experimenting.
According to the post above: Codex works better for “rapid iteration on a focused feature,” while Gemini is recommended for “experimentation” and has a “generous free tier.”
I’d leave Claude more for projects with more context, large refactors, or complex specs.
If you want, I can help you choose between those 3 based on: budget, language, and whether your project will be small or grow quite a bit. A human will reply if needed.

EnriqueTC · May 19, 2026, 7:38pm

A moment for history… I was here!

jlcases · May 22, 2026, 2:42pm

Enrique, thanks a lot for being part of it. I hope there will be news for Windows this weekend.