OpenAI no da tregua a Google: anuncia o3 y o3 mini tras del lanzamiento del modo de pensamiento de Gemini
La competencia entre OpenAI y otras compañĂas en el ĂĄmbito de la inteligencia artificial (IA) es una guerra sin cuartel. El lanzamiento de ChatGPT en noviembre de 2022 supuso un punto inflexiĂłn en esta industria, que se ha vuelto mucho mĂĄs competitiva. Desde ese entonces, Google ha estado tratando de recuperar su liderazgo, pero la firma liderada por Sam Altman no le ha dado respiro.
En los Ășltimos años hemos visto cĂłmo el gigante del buscador y la “startup” respaldada por Microsoft han medido sus fuerzas lanzamiento tras lanzamiento. Google presentĂł esta semana el “Modo de pensamiento de Gemini 2.0 Flash”, una apuesta que, por fin, parecĂa estar a la altura del modelo o1 de OpenAI. Pues bien, acaban de aparecer en escena los nuevos modelos o3 y o3 mini de OpenAI.
Ciertamente, los modelos de razonamiento son ideales para todo. De hecho, el ĂĄmbito de la IA estĂĄ creciendo tanto que hay alternativas orientadas a casos de uso. Por ejemplo, si buscamos un modelo de respuestas rĂĄpidas para impulsar un chatbot de atenciĂłn al cliente, no elegirĂamos o3, sino algo como GPT-4o mini. Si lo que buscamos en precisiĂłn en fĂsica y matemĂĄtica, puede que o3 sea la elecciĂłn correcta.
Una forma interesante de analizar el alcance y las posibilidades de un modelo es contemplarlo a la luz de los benchmarks. Durante la presentaciĂłn, OpenAI ha presentĂł dos puntos de referencia de programaciĂłn. Como podemos ver en las imĂĄgenes, o3 mejora a o1 en 22,8 puntos porcentuales en SWE-Bench Verified. En este punto de referencia alcanza 71.7 puntos en frente a los 84.9 del modelo anterior.
En Codeforces, o1 alcanza una puntuaciĂłn de 1891 y o3 de 2727. Como decimos, estos modelos son Ăștiles para muchas tareas complejas. Si nos enfocamos en puntos de referencia de matemĂĄticas, en el American Invitational Mathematics Exam 2024, o1 registra una puntuaciĂłn del 83.3%. o3, por su parte, presume de un 96.7%, fallando a una Ășnica pregunta.
Cabe señalar que la decisiĂłn de llamar al modelo o3 en lugar de o2 parece no tener que ver con un salto en sus capacidades (o de un movimiento motivado por el marketing). En realidad, segĂșn The Information, se debe a evitar problemas de marcas registradas. OpenAI habrĂa decidido saltarse un nĂșmero porque o2 es una marca registrada de un proveedor de telecomunicaciones britĂĄnico.
Tendremos que esperar para acceder al nuevo modelo de razonamiento insignia de OpenAI, o3, como a su modelo mĂĄs pequeño y rĂĄpido, o3 mini. De momento, los investigadores de seguridad pueden apuntarse en una lista de esperar para probar el modelo. La firma espera lanzarlos al pĂșblico “prĂłximamente”, pero no estĂĄ claro cuĂĄndo acabarĂĄn llegando (y si bajo quĂ© suscripciones).
En este blog Apple no puede ofrecer ChatGPT en China. MĂĄs que un problema, eso es una bendiciĂłn
No hay comentarios.: