GPT-5.5 y el salto a la verdadera autonomía
El benchmark OSWorld no es un simple examen de preguntas y respuestas; es un entorno virtual (que simula Windows, macOS y Linux) donde la IA debe usar el ratón, hacer clics y teclear como un humano.
-
El gran avance: Los modelos anteriores se perdían fácilmente si un botón cambiaba de lugar o si una página web tardaba en cargar. Que GPT-5.5 roce el 80% de éxito significa que ya es capaz de recibir una orden como “Revisa mi bandeja de entrada, descarga todas las facturas en PDF, clasifícalas por fecha en una hoja de cálculo y envíale un resumen al contable” y ejecutarla de principio a fin sin supervisión constante.
-
Impacto: Esto marca el inicio de los verdaderos “asistentes de sistema operativo”, integrados profundamente en nuestros ordenadores diarios, capaces de manejar múltiples aplicaciones a la vez.