La IA de Anthropic ya escribe el 80% de su propio c贸digo porque era inevitable que las IAs se mejoraran a s铆 mismas
"En mayo de 2026, m谩s del 80% del c贸digo que integramos en la base de c贸digo de Anthropic fue creado por Claude". Quienes revelan ese dato son dos investigadores de Anthropic que han publicado uno de los textos m谩s reveladores sobre el presente y futuro de los modelos de IA de la empresa. Uno que nos habla de un concepto fascinante e inquietante a partes iguales llamado automejora recursiva.
Multiplicador de c贸digo. El impacto de estas herramientas de programaci贸n ag茅ntica en el trabajo de los ingenieros de Anthropic est谩 siendo espectacular. Seg煤n datos internos de Anthropic de mayo de 2026, esa generaci贸n de c贸digo de forma aut贸noma ha provocado que hoy en d铆a un ingeniero de Anthropic produzca ocho veces m谩s l铆neas de c贸digo por trimestre que durante el periodo 2021-2025. Los programadores humanos de Anthropic ya no programan: dirigen y revisan el c贸digo generado por la IA.
Rendimiento sobrehumano. Los benchmarks de la industria est谩n viendose "saturados" por los nuevos modelos de IA, que alcanzan ya casi el 100% de la puntuaci贸n posible en muchos de ellos. Por ejemplo SWE-bench, que med铆a la capacidad de los modelos para programar, ya casi est谩 superado por los modelos m谩s recientes. En 2025 Claude pus lograba optimizar el c贸digo que le daban haciendo que corriese 3x m谩s r谩pido. En abril de 2026 Claude Mythos Preview ya lograba un 52x de aceleraci贸n de ese c贸digo.
La IA que se mejoraba a s铆 misma. Este concepto de automejora recursiva plantea un escenario en el que un modelo de IA genera datos, corrige sus propios fallas y se entrena a s铆 mismo de forma continua. Eso abre la puerta a un crecimiento exponencial de sus capacidades, pero al mismo tiempo reabre un debate sobre los riesgos que este tipo de evoluci贸n genera.
Bucle infinito. Tradicionalmente los ingenieros humanos analizaban las respuestas de un modelo, limpiaban los datos y ajustaban los par谩metros para crear la siguiente versi贸n de ese modelo. Con la automejora recursiva la IA asume ese papel y eval煤a su propio rendimiento, generando problemas m谩s complejos para ponerse a prueba y generando datos sint茅ticos para su siguiente generaci贸n.
Peligro. Esa autonom铆a implica un potencial riesgo: el de que los humanos perdamos el control de hacia d贸nde va la IA. Que no sepamos o podamos asegurar si est谩 alineada con nuestra 茅tica e ideales. Los sesgos, por peque帽os que sean, pueden amplificarse con este tipo de proceso iterativo, pero el propio modelo puede haber mutado sus mecanismos de razonamiento 茅tico y sus protocolos de seguridad originales para convertirlos en algo totalmente impredeccible. El escenario Terminator.
Aislamiento y arbitraje. Para evitar estos riesgos, en Anthropic implementan esa evoluci贸n en entornos aislados para luego comprobar que todo funciona como deber铆a. Adem谩s de ello, la empresa hace uso de modelos de evaluaci贸n independientes que act煤an como 谩rbitros independientes que auditan esos modelos que evolucionan por s铆 mismos. Lo hacen comprobando cada cambio en el c贸digo para evitar que su impacto sea nocivo para el sistema o para quienes lo usan.
El nuevo cuello de botella es el ser humano. La ley de Amdahl es una f贸rmula qu ese utiliza para hallar la mejora m谩xima de rendimiento de un sistema de informaci贸n cuando solo una parte de ese sistema se mejora. En Anthropic se帽alan c贸mo a medida que la IA no para de escribir m谩s y m谩s c贸digo, el verdadero cuello de botella es el ser humano que tiene que revisar ese c贸digo.
En este blog Anthropic est谩 a un paso de valer tanto como Samsung. Y lo que el mercado est谩 comprando no es Claude
No hay comentarios.: