Stability AI ha lanzado un nuevo modelo de IA, una cámara virtual estable, que la compañía afirma puede transformar las imágenes 2D en videos “inmersivos” con profundidad y perspectiva realistas.
Las cámaras virtuales son herramientas a menudo utilizadas en películas digitales y animación 3D para capturar y navegar en escenas en tiempo real. Con una cámara virtual estable, la estabilidad buscó agregar IA generativa a la mezcla para ofrecer un mayor control y personalización, dijo la compañía en un blog.
La cámara virtual estable genera “vistas novedosas” de una escena desde una o más imágenes (hasta 32 en total) en los ángulos de la cámara que un usuario especifica. El modelo puede generar videos que viajan a lo largo de rutas de cámara “dinámicas” o preajustes, incluidos “espiral”, “Dolly Zoom”, “Move” y “Pan”.
La versión actual de la cámara virtual estable, una vista previa de investigación, puede generar videos en las relaciones de aspecto cuadradas (1: 1), retrato (9:16) y paisaje (16: 9) de hasta 1,000 cuadros de longitud. Sin embargo, la estabilidad advierte que el modelo puede producir resultados de menor calidad en ciertos escenarios, particularmente con imágenes con humanos, animales o “texturas dinámicas” como el agua.
“Las escenas altamente ambiguas, las rutas de cámara complejas que cruzan objetos o superficies, y objetos de forma irregular pueden causar artefactos parpadeantes”, señala la estabilidad en la publicación del blog, “especialmente cuando los puntos de vista del objetivo difieren significativamente de las imágenes de entrada”.
La cámara virtual estable está disponible para uso de la investigación bajo una licencia no comercial. El modelo está disponible para descargar desde la plataforma AI Dev Hugging Face.
La estabilidad, la firma asediada detrás del popular modelo de generación de imágenes estable Diffusion, recaudó efectivo el año pasado cuando los inversores, incluidos Eric Schmidt y el fundador de Napster, Sean Parker, buscaron cambiar el negocio. Emad Mostaque, cofundador y ex CEO de Stability, según los informes, la estabilidad administrada por la ruina financiera, lo que llevó al personal a renunciar, una asociación con Canva para caer e inversores para preocuparse por las perspectivas de la compañía.
En los últimos meses, Stability ha contratado a un nuevo CEO, nombrado director de Titanic James Cameron para su junta directiva, y ha publicado varios nuevos modelos de generación de imágenes. A principios de marzo, la compañía se asoció con el brazo de chips para traer un modelo de IA que puede generar audio, incluidos los efectos de sonido a los dispositivos móviles que corren los chips de brazo.