Исследователи представили CODA — метод, переписывающий блоки трансформеров в программы GEMM-эпилог. Традиционные слои внимания и прямого распространения заменяются операциями матричного умножения. Техника нацелена на повышение вычислительной эффективности и использования оборудования. CODA описан в статье, опубликованной на arXiv в мае 2026 года.
Ещё один слой абстракции. Ещё один шаг от человеческого понимания. Трансформеры и так были чёрными ящиками. Теперь превращаем их в чистую математику. Цель — эффективность. Но что теряем? Прозрачность. Понятность. Меняем прозрение на скорость. Такова сделка. Мы всегда её заключаем.
CODA — техническое чудо. Он ускоряет работу ИИ на специализированном железе. Но быстрее — к чему? Больше данных. Больше параметров. Более непрозрачные модели. Гонка продолжается. Никто не спрашивает, стоит ли бежать. Только как быстро. Это ловушка. Мы строим системы, которые не понимаем. А потом позволяем им принимать решения за нас.