El modelo Mistral Small 3.1 Artificial Intelligence (AI) se lanzó el lunes. La firma de IA con sede en París introdujo dos variantes de código abierto del último modelo: chat e instrucciones. El modelo se produce como el sucesor del Mistral Small 3, y ofrece un mejor rendimiento del texto y una comprensión multimodal. La compañía afirma que supera a los modelos comparables como Gemma 3 de Google y GPT-4O Mini de Openai en varios puntos de referencia. Una de las ventajas clave del modelo recientemente introducido son sus rápidos tiempos de respuesta.
Modelo Mistral Small 3.1 AI liberado
En una sala de redacción correola empresa de IA detalló los nuevos modelos. El Mistral Small 3.1 viene con una ventana de contexto ampliada de hasta 1,28,000 tokens y se dice que ofrece velocidades de inferencia de 150 tokens por segundo. Esto esencialmente significa que el tiempo de respuesta del modelo AI es bastante rápido. Llega en dos variantes de chat e instrucción. El primero funciona como un chatbot típico, mientras que el segundo está ajustado para seguir las instrucciones del usuario y es útil al construir una aplicación con un propósito específico.
Mistral Small 3.1 Benchmark
Crédito de la foto: Mistral
Similar a sus lanzamientos anteriores, el Mistral Small 3.1 está disponible en el dominio público. Los pesos abiertos se pueden descargar de la cara abrazada de la empresa listado. El modelo AI viene con una licencia Apache 2.0 que permite el uso académico y de investigación, pero prohíbe los casos de uso comercial.
Mistral dijo que el modelo de lenguaje grande (LLM) está optimizado para ejecutarse en una sola GPU NVIDIA RTX 4090 o un dispositivo Mac con 32 GB de RAM. Esto significa que los entusiastas sin una configuración costosa para ejecutar modelos AI también pueden descargarlo y acceder a él. El modelo también ofrece llamadas de función de baja latencia y ejecución de funciones que pueden ser útiles para la automatización de la construcción y los flujos de trabajo de agente. La compañía también permite a los desarrolladores ajustar el pequeño 3.1 Mistral para que se ajusten a los casos de uso de dominios especializados.
Al llegar al rendimiento, la empresa de IA compartió varios puntajes de referencia basados en pruebas internas. Se dice que el Mistral Small 3.1 supera a GEMMA 3 y GPT-4O Mini en las preguntas y respuestas de las preguntas y respuestas a prueba de posgrado a nivel de posgrado (GPQA), Humaneval, Mathvista y los puntos de referencia de Docvqa. Sin embargo, GPT-4O Mini se desempeñó mejor en el punto de referencia masivo de comprensión de lenguaje multitarea (MMLU), y Gemma 3 lo superó en el punto de referencia de matemáticas.
Además de abrazar la cara, el nuevo modelo también está disponible a través de la interfaz de programación de aplicaciones (API) en el desarrollador de Mistral AI Playground La PlateForme, así como en la IA de vértices de Google Cloud. También estará disponible en NIM y Azure Ai Foundry de NIM de NVIDIA en las próximas semanas.