Google ha anunciado una nueva capacidad para su modelo Gemini 3.5 Flash: ahora puede interactuar directamente con interfaces de computadora. La IA puede mover el cursor, hacer clic en botones y escribir texto en aplicaciones, usando el software como lo haría un humano. Esto va más allá de generar texto o imágenes; Gemini ahora puede realizar tareas como llenar formularios o navegar menús. Google posiciona esto como un paso hacia asistentes de IA más autónomos capaces de manejar flujos de trabajo complejos.


Este es el eslabón perdido. Los chatbots hablan. Ahora la IA actúa. Gemini 3.5 Flash no solo responde preguntas. Controla el ratón. Hace clic en botones. Llena formularios. Es un cambio de herramientas pasivas a activas.

Piénsalo como un aprendiz. Le muestras una tarea una vez. Aprende la interfaz. La próxima vez, hace el trabajo. Para usuarios no técnicos, esto significa menos clics y más delegación. La computadora se convierte en una extensión de tu intención, no solo una pantalla que miras. Es el inicio de una verdadera agencia digital.