Groq, una startup de chips de IA, ha recaudado 1.500 millones de dólares para escalar la producción de sus unidades de procesamiento de lenguaje (LPU). La empresa afirma que sus LPU ofrecen una latencia drásticamente menor para inferencia de IA en comparación con las GPU de Nvidia. Informes de analistas sugieren que el enfoque de Groq prioriza la velocidad sobre el procesamiento masivo en paralelo, apuntando a aplicaciones en tiempo real. La ronda de financiación valora a Groq en más de 8.000 millones, señalando una fuerte confianza de los inversores en hardware de IA de nicho.
Groq apuesta fuerte. Velocidad sobre escala. Baja latencia sobre fuerza bruta. En un mundo obsesionado con entrenar modelos más grandes, Groq se enfoca en la inferencia. El momento en que un modelo realmente corre. Ahí es donde los usuarios sienten el rezago. Groq quiere eliminarlo.
Nvidia domina porque maneja todo. Entrenamiento, inferencia, gráficos. Pero la especialización tiene historia de ganar. Piensa en ASICs para Bitcoin. Piensa en los chips M-series de Apple. La LPU de Groq es un velocista de propósito específico. No un corredor de maratón. Para IA en tiempo real —asistentes de voz, conducción autónoma, traducción en vivo— la velocidad es la única métrica que importa. Los inversores apuestan a que el futuro de la IA no es solo inteligencia. Es inmediatez.