Harness engineering: cómo OpenAI construyó un producto con 0 líneas de código escritas a mano
Durante los últimos cinco meses, el equipo de OpenAI ha llevado a cabo un experimento: construir y lanzar una beta interna de un producto de software con 0 líneas de código escritas manualmente. El producto tiene usuarios internos diarios y probadores externos; se despliega, se rompe y se corrige. La diferencia es que cada línea —lógica, tests, CI, documentación, observabilidad— la ha escrito Codex. Calculan que lo construyeron en aproximadamente una décima parte del tiempo que habría llevado escribirlo a mano.
Humanos dirigen, los agentes ejecutan
Eligieron ese límite a propósito para aumentar la velocidad de ingeniería a gran escala. El primer commit en un repositorio vacío llegó a finales de agosto de 2025. Cinco meses después, el repositorio ronda el millón de líneas en lógica, infraestructura, documentación y herramientas. Unos 1.500 pull requests abiertos y mergeados con un equipo de solo tres ingenieros dirigiendo Codex; después el equipo creció a siete y el throughput aumentó. Los humanos no escribieron código: su trabajo se centró en diseñar entornos, especificar intención y construir bucles de feedback para que los agentes hicieran trabajo fiable.

Legibilidad para el agente y arquitectura estricta
El conocimiento del repositorio vive en un docs/ estructurado; un AGENTS.md corto actúa como índice. La documentación, los planes de ejecución y las especificaciones se versionan en el repo para que Codex pueda razonar sin depender de contexto externo. Las reglas de arquitectura (capas por dominio, dependencias validadas) se aplican con linters y tests estructurales —muchos de ellos generados por Codex. Los humanos revisan y refinan; el agente implementa y hace merge.
Fuente: OpenAI