OpenAI presentó el martes GPT-5.4-Cyber, una variante de su último modelo emblemático GPT-5.4, específicamente optimizada para casos de uso defensivos en ciberseguridad, días después de que su rival Anthropic lanzara su propio modelo de frontera, Mythos.
"El uso progresivo de la IA acelera a los defensores – aquellos responsables de mantener seguros los sistemas, datos y usuarios – permitiéndoles encontrar y solucionar problemas más rápido en la infraestructura digital de la que todos dependen", afirmó OpenAI.
Junto con el anuncio, la empresa de inteligencia artificial indicó que está ampliando su programa Trusted Access for Cyber (TAC) a miles de defensores individuales autenticados y cientos de equipos encargados de proteger software crítico.
Los sistemas de IA son inherentemente de doble uso, ya que los actores maliciosos pueden reutilizar tecnologías desarrolladas para aplicaciones legítimas en su propio beneficio y lograr objetivos dañinos. Una preocupación central es que los adversarios podrían invertir los modelos ajustados para la defensa de software con el fin de detectar y explotar vulnerabilidades en software ampliamente utilizado antes de que puedan ser parcheadas, exponiendo a los usuarios a riesgos significativos.
OpenAI señaló que el objetivo es democratizar el acceso a sus modelos minimizando dicho uso indebido, así como fortalecer sus salvaguardas mediante un despliegue deliberado e iterativo. La idea es permitir un uso responsable a escala, dar a los defensores una ventaja inicial y, al mismo tiempo, reforzar las barreras contra jailbreaks e inyecciones adversariales de instrucciones a medida que las capacidades del modelo se vuelven más avanzadas.
"A medida que avanzan las capacidades del modelo, nuestro enfoque es escalar la ciberdefensa en paralelo: ampliando el acceso para los defensores legítimos mientras continuamos fortaleciendo las salvaguardas", agregó la compañía.
El creador de ChatGPT, que lanzó Codex Security como una forma de encontrar, validar y proponer correcciones para vulnerabilidades, reveló que el agente de seguridad de aplicaciones impulsado por IA ha contribuido a más de 3,000 vulnerabilidades críticas y altas corregidas.
El lanzamiento limitado de OpenAI sigue a la vista previa de Mythos de Anthropic, un modelo de frontera que se está implementando de manera controlada como parte del Proyecto Glasswing. La compañía afirmó que el modelo encontró "miles" de vulnerabilidades en sistemas operativos, navegadores web y otro software.
"El ecosistema más fuerte es aquel que identifica, valida y soluciona problemas de seguridad de forma continua mientras se escribe el software", dijo OpenAI. "Al integrar modelos de codificación avanzados y capacidades agentivas en los flujos de trabajo de los desarrolladores, podemos darles retroalimentación inmediata y procesable mientras construyen, desplazando la seguridad de auditorías episódicas e inventarios estáticos de vulnerabilidades a una reducción de riesgos continua y tangible".