Para demostrar la capacidad de crear proyectos grandes de forma autónoma con el nuevo modelo de IA de Claude Opus 4.6, Anthropic generó un compilador de C (claudes-c-compiler) compatible con el kernel de Linux, PostgreSQL, SQLite, Redis, FFmpeg, GNU coreutils, Busybox, CPython, QEMU, LuaJIT y aproximadamente otros 150 proyectos de código abierto conocidos. Las compilaciones resultantes superaron con éxito las suites de pruebas proporcionadas por los proyectos. El kernel de Linux resultante arranca correctamente y ejecuta Doom. El código del compilador se genera en Rust y se publica en el dominio público (CC0). La compilación es compatible con las arquitecturas x86_64, i686, AArch64 y RISC-V 64.
Todo el código y la documentación del compilador se generaron utilizando el modelo Claude Opus 4.6. La intervención humana se limitó a la definición de los casos de prueba que el producto final debía satisfacer. No se utilizaron desarrollo interactivo, depuración ni control de calidad; el modelo Claude Opus realizó todo el trabajo según la tarea en cuestión. No se realizó una revisión manual de la corrección del compilador, por lo que no se recomienda su uso fuera de entornos experimentales. La tasa de aprobación del conjunto de pruebas del compilador, incluidas las pruebas de tortura de GCC, es del 99 %.
Se reclutaron dieciséis agentes de IA para desarrollar el compilador. Tras dos semanas de trabajo y aproximadamente dos mil sesiones en Claude Code, generaron 100.000 líneas de código Rust, construyendo el kernel de Linux 6.9 para arquitecturas x86, ARM y RISC-V. La generación de código utilizó un nuevo modo de "equipos de agentes", que permite que varios agentes de IA de Claude trabajen en paralelo en una única base de código compartida, de forma autónoma y sin intervención humana. El coste del compilador, basado en el acceso a la API, se estima en 20.000 dólares (2.000 millones de tokens de entrada transferidos y 140 millones de tokens de salida generados).
El compilador es autónomo y no requiere dependencias externas, salvo la biblioteca estándar de Rust. Todos los componentes se crean desde cero, incluyendo el frontend, la representación intermedia (IR) basada en SSA, el optimizador, el generador de código, el ensamblador, el enlazador y el generador de información de depuración DWARF. El frontend es compatible con GCC y puede utilizarse como un sustituto transparente e inmediato. Los ejecutables de salida están en formato ELF. Solo es compatible con la plataforma Linux (no se prevé compatibilidad con macOS ni Windows).
Las limitaciones incluyen la falta de niveles de optimización independientes (los niveles -O0 a -O3, -Os y -Oz resultan en optimizaciones idénticas), problemas con el uso de _Atomic y _Complex, compatibilidad parcial con la palabra clave __attribute__ e implementación parcial de las instrucciones NEON. Además de las limitaciones descritas en la documentación del compilador de IA, el anuncio del proyecto menciona varios problemas adicionales:
- Falta de soporte para la compilación en modo de 16 bits (el código de 16 bits necesario para arrancar el kernel se compiló en GCC).
- Errores en las implementaciones del enlazador y del ensamblador (se utilizaron el ensamblador GNU y el enlazador GNU para preparar la demostración).
- Claudes-c-compiler aún no está listo para reemplazar a los compiladores reales, ya que no todos los proyectos se compilan exitosamente.
- El grado de optimización del código generado es peor que en GCC con todos los modos de optimización deshabilitados.
- La calidad del código Rust generado es aceptable, pero notablemente peor que el código preparado por un programador profesional.
- El proyecto está cerca de los límites del modelo Opus 4.6: los intentos de corregir errores o agregar características adicionales generalmente han tenido como resultado que se rompa la funcionalidad existente.

Fuente: opennet.ru
