Google lanzó el sucesor de sus modelos de inteligencia artificial (IA) de la serie Gemini 2.0 el miércoles. Apodado Gemini 2.5 Pro Experimental, es el primer modelo que la compañía está liberando de la familia 2.5. El gigante tecnológico con sede en Mountain View dice que esta serie de modelos tendrá una capacidad de “pensamiento” o razonamiento incorporada directamente en los modelos. También señala los puntajes de referencia mejorados en una amplia gama de funciones, superando el O3-Mini de OpenAI en varias áreas. Google ha comenzado a implementar el modelo para los usuarios.
Modelo Gemini 2.5 Pro AI lanzado
En blogKoray Kavukcuoglu, el CTO de Google Deepmind, detalló el nuevo modelo de lenguaje grande (LLM). El aspecto más notable de la serie Gemini 2.5 es que ya no habrá modelos de “pensamiento” como el pensamiento Flash Gemini 2.0.
El gigante tecnológico utilizó un modelo base mejorado, que mejoró aún más en el post-entrenamiento para ofrecer capacidades de razonamiento inherentes a todos los modelos Gemini 2.5 AI. Por lo tanto, Google no denotará una etiqueta particular de “pensamiento” a un modelo, ya que todos pueden llevar a cabo un razonamiento avanzado y mostrar la cadena de pensamiento (COT).
Gemini 2.5 PRO Benchmarks
Crédito de la foto: Google
Google no reveló mucho sobre las especificaciones del modelo, por lo que no se conocen detalles sobre su conjunto de datos, métodos de capacitación y arquitectura. Sin embargo, el gigante tecnológico compartió sus puntajes de referencia basados en pruebas internas. Se dice que obtuvo un puntaje de 18.8 por ciento en el último examen de la humanidad, un conjunto de datos considerado la prueba de evaluación comparativa más difícil para los modelos de IA. La puntuación de Gemini 2.5 Pro fue de vanguardia (SOTA) entre modelos sin uso de herramientas.
También se afirma que Gemini 2.5 Pro ha superado a modelos como O3-Mini de OpenAi, Grok 3 Beta, Claude 3.7 Sonnet y Deepseek R1 en varios puntos de referencia, como GPQA Diamond, AIME 2024 y 2025, Aider Polyglot y MMMU.
Además de esto, Gemini 2.5 Pro también se clasificó en la parte superior de Lmarena tabla de clasificación en el lanzamiento. Lmarena es una plataforma basada en el usuario donde los entusiastas de la IA y los desarrolladores califican los modelos en función de sus experiencias. Actualmente, es seguido por Grok 3 Preview, GPT 4.5 Preview, Gemini 2.0 Flash Thinking y Gemini 2.0 Pro para las posiciones segunda, tercera, cuarta y quinta, respectivamente.
Google afirma que el último LLM también mejora el rendimiento de la codificación y puede crear aplicaciones web “visualmente convincentes” y aplicaciones de código de agente. Gemini 2.5 Pro también viene con soporte multimodal nativo y una ventana de contexto de un millón de tokens.
Gemini 2.5 Pro está disponible para desarrolladores y empresas a través de Google AI Studio, y los suscriptores avanzados de Gemini pueden acceder al modelo en el cliente y aplicaciones web de Gemini. La compañía planea ponerlo a disposición en Vertex AI en las próximas semanas.