XAI, la firma de inteligencia artificial (IA) dirigida por Elon Musk detrás de Grok, lanzó una nueva interfaz de programación de aplicaciones (API) el miércoles. La nueva API es única, ya que es la primera herramienta de desarrollador que admite la generación de imágenes. La compañía recientemente se ha centrado en los desarrolladores y ha lanzado hasta cinco API desde que llegó la primera en noviembre de 2024. Se dice que el precio está ligeramente en el extremo más empinado, y la compañía actualmente no permite que los usuarios personalicen la salida.
XAI presenta una nueva API con capacidad de generación de imágenes
Antes de la última incorporación, Xai ofreció cuatro modelos AI personalizados como API. Dos se basaron en la primera iteración del Modelo de Lenguaje Grande de Grok (LLM) y dos se basaron en Grok 2. Si bien la compañía ofreció la función de comprensión de la imagen, no había forma de generar imágenes utilizando la API.
Esto fue probable porque Xai estaba subcontratando la capacidad de generación de imágenes disponible a través de su plataforma de chat. Hasta el año pasado, la generación de imágenes en Grok fue manejada por la startup de Startup Black Forest Labs. Sin embargo, en diciembre, la firma de IA anunció el lanzamiento de Aurora, un modelo de generación de imágenes basado en la red de la mezcla de expertos (MOE). Parece que la compañía ahora también está expandiendo el modelo a los desarrolladores.
En su documentación páginaXAI ahora enumera un nuevo modelo API denominado 'Grok-2-Image-1212' que viene con la capacidad de generación de imágenes. La funcionalidad es sencilla. Una vez que se envía un mensaje de texto, un modelo de chat toma la instrucción y revisa el mensaje para una mejor claridad. El aviso revisado se comparte con el modelo de generación de imágenes y se genera la salida.
Actualmente, los desarrolladores pueden generar hasta 10 imágenes con una sola solicitud ajustando el parámetro. Hay un límite de cinco solicitudes por segundo, cruce que devolverá un mensaje de error. Las imágenes se comparten en formato JPEG. Un techcrunch informe afirmó que Xai cobrará $ 0.07 (aproximadamente Rs. 6) por imagen.
El precio coloca el servicio en el extremo superior, dado que la API de flujo de Black Forest Labs cuesta $ 0.05 (aproximadamente Rs. 4) por imagen e Imagen 3 de Google cuesta $ 0.03 (aproximadamente Rs. 2.5) por imagen. Sin embargo, el ideograma sigue siendo más caro a $ 0.08 (aproximadamente Rs. 7) por imagen.
Además, XAI destacó que la API actualmente no admite la personalización de la salida, como cambiar la calidad, el tamaño o el estilo de las imágenes. En particular, el punto final de la API es compatible con Operai SDK y los usuarios pueden usar la misma base_url. Sin embargo, no es compatible con el SDK antrópico.