Gemini está obteniendo dos nuevas características de inteligencia artificial (IA), anunció Google el martes. El gigante tecnológico basado en Mountain View está agregando lienzo, un espacio interactivo que permite a los usuarios humanos y a la IA colaborar en proyectos que involucran documentos y tareas relacionadas con la codificación. Otra característica que llega a Gemini es una visión general de audio, que anteriormente era exclusiva de NotebookLM, y permite a los usuarios generar una atractiva discusión de audio similar a un podcast basada en documentos, diapositivas e informes de investigación profundas. Estas características se están implementando actualmente a nivel mundial tanto para los suscriptores avanzados de Gemini como para las de el nivel libre.
Google trae dos nuevas características de IA a Gemini
En una publicación de blog, el gigante tecnológico anunció las dos nuevas características que se están agregando a Gemini. Esto sigue la función de investigación profunda que puede generar un informe detallado sobre temas complejos y los widgets de pantalla de bloqueo exclusivo para iOS. Las nuevas características, el lienzo y la descripción general de audio, estarán disponibles tanto en Gemini en aplicaciones web como móvil.
Canvas es un nuevo espacio interactivo en Gemini, que tiene como objetivo permitir que los usuarios colaboren con la IA sobre ciertos proyectos. Los usuarios ahora pueden ver un nuevo botón de lienzo junto a una investigación profunda en el cuadro de texto en la interfaz de Gemini. Seleccionar la función y agregar un documento o líneas de código ahora abrirá una caja de arena donde la IA crea un primer borrador basado en el aviso del usuario, y luego el usuario puede hacerse cargo de hacer ediciones y refinar aún más la salida con la ayuda del chatbot.
Actualmente, el lienzo solo funciona con documentos y tareas relacionadas con la codificación. Para los documentos, los usuarios deberán cargar un archivo y luego escribir un mensaje mientras se selecciona el botón de lienzo. El usuario puede decir algo como “Crear un discurso basado en estas notas en el aula” y la IA abrirá una interfaz de estilo Sandbox y escribirá el borrador. Luego, los usuarios pueden hacer ediciones manuales o resaltar partes del texto y pedirle a Gemini que cambie el tono o regenere el contenido con comentarios específicos.
Los usuarios pueden pedirle a la IA que escriba el código en función de las indicaciones. Luego, con el lienzo, pueden pedirle a Gemini que genere y previse el código y otros prototipos de aplicaciones web para ver una representación visual. Esto solo funciona con el código HTML y React actualmente. Después de la vista previa, el usuario también puede solicitar cambios en los campos de entrada o los botones de llamada a la acción, y ver la vista previa actualizada. En particular, la función es similar a la función de lienzo de Openai, aunque ChatGPT solo la ofrece en la web.
Google dijo que después de presenciar la popularidad de la función de descripción general de audio en Notebooklm, ahora la está llevando a Gemini. La función funciona con documentos, diapositivas e incluso informes creados utilizando investigaciones profundas. Cada vez que un archivo o respuesta se ajusta a los criterios, la plataforma Gemini mostrará un botón de acción flotante (FAB) sobre la función.
Una vez que un usuario aprovecha el botón, Gemini comenzará a generar una discusión de audio al estilo de podcast con dos hosts de IA, una voz masculina y femenina, que discutirá el tema, dibujará conexiones entre temas y participará en una dinámica de ida y vuelta para proporcionar perspectivas únicas. En particular, puede tomar unos minutos generar una descripción general de la IA.
Los miembros del personal de Gadgets 360 vieron ambas características en la interfaz web de Gemini, pero no en las aplicaciones. Dado que Google está lanzando la función a nivel mundial, puede pasar unos días antes de que todos los usuarios obtengan acceso a ellos.