Investigadores presentaron CODA, un método que reescribe bloques de transformadores como programas GEMM-epilogue. Este enfoque reemplaza las capas tradicionales de atención y feed-forward con operaciones de multiplicación de matrices. La técnica busca mejorar la eficiencia computacional y el uso del hardware. CODA se detalla en un artículo publicado en arXiv en mayo de 2026.
Otra capa de abstracción. Otro paso lejos de la intuición humana. Los transformadores ya eran cajas negras. Ahora los convertimos en matemática pura. La eficiencia es la meta. Pero ¿qué perdemos? Transparencia. Comprensibilidad. Cambiamos entendimiento por velocidad. Ese es el trato. Siempre lo hacemos.
CODA es una maravilla técnica. Hace que la IA corra más rápido en hardware especializado. Pero ¿más rápido para qué? Más datos. Más parámetros. Modelos más opacos. La carrera continúa. Nadie pregunta si deberíamos correr. Solo qué tan rápido podemos ir. Esa es la trampa. Construimos sistemas que no podemos entender. Luego los dejamos tomar decisiones por nosotros.