OpenAI lanza el modelo o1 para avanzar en las capacidades de razonamiento de la IA
El último modelo de inteligencia artificial de OpenAI, o1 (con nombre en clave interno "Strawberry"), ya está disponible. El modelo o1 está diseñado específicamente para mejorar las capacidades de razonamiento de la inteligencia artificial. Múltiples fuentes informan que esta nueva familia de modelos tiene como objetivo resolver problemas complejos en ciencia, programación y matemáticas dedicando más tiempo a "pensar" antes de dar una respuesta.

Razonamiento Avanzado y Rendimiento
El modelo o1 ha demostrado capacidades notables en la resolución de problemas complejos, particularmente en los campos STEM (Ciencia, Tecnología, Ingeniería y Matemáticas). En las pruebas, o1 se ubicó en el percentil 89 en concursos de programación competitiva (Codeforces) y se clasificó entre los 500 mejores estudiantes en la eliminatoria de la Olimpiada Matemática de EE. UU. (AIME). En dominios científicos como física, biología y química, superó la precisión humana a nivel de doctorado en un conjunto de datos de referencia (GPQA). Su razonamiento avanzado permite a o1 abordar preguntas intrincadas, generar algoritmos sofisticados y sobresalir en tareas de análisis comparativo, como examinar contratos o documentos legales.
Puntos de Referencia de Rendimiento
El modelo o1 mostró un rendimiento sobresaliente en varios puntos de referencia, demostrando sus habilidades avanzadas de razonamiento. La siguiente tabla resume los resultados clave para el modelo o1:
Punto de Referencia | Rendimiento |
---|---|
Codeforces (Programación Competitiva) | Percentil 89 |
AIME (Eliminatoria de la Olimpiada de Matemáticas) | Top 500 estudiantes en EE. UU. |
GPQA (Física, Biología, Química) | Supera la precisión a nivel de doctorado |
Olimpiada Internacional de Informática (IOI) | Percentil 49 a nivel mundial |
Puntuación Elo de Codeforces | 1807 (percentil 93) |
Subcategorías MMLU | Supera a modelos anteriores en 54 de 57 |
El rendimiento del modelo o1 es particularmente notable en los campos STEM, lo que demuestra su capacidad para resolver problemas complejos y trabajar lógicamente en tareas difíciles. Sus resultados elevan las capacidades de razonamiento de la IA a un nuevo nivel, representando un avance significativo para las aplicaciones en ciencia, matemáticas y programación.
Variantes del Modelo o1
El modelo o1 se ha lanzado en dos variantes: o1-preview y o1-mini. El o1-mini es más pequeño, más rápido y más rentable, diseñado específicamente para tareas de codificación. Se informa que o1-mini es un 80% más barato que o1-preview, al tiempo que ofrece un rendimiento competitivamente sólido en puntos de referencia de codificación. Ambos modelos son accesibles dentro de ChatGPT y a través de la API de OpenAI.
Limitaciones y Desafíos
A pesar de sus capacidades avanzadas, el modelo o1 enfrenta varios desafíos. Es significativamente más caro de usar, con costos de entrada 3 veces y costos de salida 4 veces más altos que GPT-4o a través de la API. El modelo o1 a veces puede ser más lento en el procesamiento de consultas, especialmente para problemas complejos que podrían requerir más de diez segundos de tiempo de computación. Otra limitación es que o1 actualmente no admite funciones como la navegación web y el análisis de archivos, que están disponibles en otros modelos de IA.
Disponibilidad y Planes Futuros
El modelo o1 está actualmente disponible para usuarios de ChatGPT Plus y Team, con límites semanales de mensajes: 30 mensajes para o1-preview y 50 mensajes para o1-mini. Se espera que el modelo o1-mini esté disponible pronto para todos los usuarios gratuitos de ChatGPT, aunque aún no se ha anunciado una fecha de lanzamiento específica. OpenAI planea mejorar aún más las capacidades del modelo, abordar sus limitaciones e integrar funciones adicionales como la navegación y la carga de archivos para aumentar su utilidad en diversas aplicaciones.