Gemini Live AI: Conoce el modelo de IA conversacional
Google lanzó una serie de novedades sobre hardware esta semana, desde el teléfono inteligente Pixel 9 hasta nuevos auriculares inalámbricos. Detrás de todos estos brillantes dispositivos se encuentra el asistente de Google, Gemini AI. Este chatbot se lanzó a principios de este año y ahora es el asistente predeterminado en los teléfonos Pixel 9 y ahora está disponible en millones de teléfonos Android en todo el mundo. Pero ahora existe una nueva forma de comunicarse con este chatbot: Gemini Live. ¡Sigue leyendo!
¿Qué es Géminis Live AI?
Es la respuesta de Google al GPT-4o de OpenAI, una forma de comunicarse con el asistente de forma natural, como una conversación de voz normal entre dos personas (o al menos ese es el objetivo). Gemini Live AI será un asistente personal para dispositivos Android e iOS.
Esta nueva experiencia permitirá a los usuarios tener conversaciones fluidas y naturales con Geminis, quienes ayudarán a responder preguntas sobre una variedad de temas, generar ideas creativas, resolver problemas y planificar el proyecto. Puede acceder a él haciendo clic en el pequeño botón Live en la esquina inferior derecha de la aplicación Gemini.
¿Cómo se utiliza Gemini Live AI?
Inicie Gemini y verá una pantalla en blanco con una luz brillante en la parte inferior. Puede iniciar una conversación con su asistente y continuarla incluso cuando el teléfono esté bloqueado y la pantalla apagada. Además, podrás acceder a él a través de los nuevos auriculares inalámbricos Google Pixel Buds Pro 2, para que puedas realizar llamadas con manos libres cuando tengas el teléfono en el bolso.
Hay 10 voces para elegir con diferentes tonos, acentos y estilos. Una vez finalizada la sesión, verás una grabación de toda la conversación a la que podrás acceder en cualquier momento en la aplicación Gemini. A diferencia de los asistentes de voz más antiguos, Gemini Live te permite interrumpir una conversación sin interrumpir todo el proceso.
Y la idea es conectarlo con otras apps mediante extensiones, aunque muchas de ellas aún no están disponibles. Por ejemplo, puede pedirle a Gemini Live que busque invitaciones a fiestas en su Gmail y proporcione la hora y la ubicación en lugar de tener que buscarlas usted mismo.
También puedes buscar una receta y pedirle que agregue ingredientes a tu lista de compras en Google Keep. Google dice que estas extensiones para aplicaciones como Keep, Tasks, Utilities, Calendar y YouTube Music se lanzarán en las próximas semanas. A finales de este año, Google agregará Gemini Live al Proyecto Astra, una tecnología de visión por computadora que la compañía anunció en su conferencia de desarrolladores en mayo.
¿Dónde está el Asistente de Google?
Si toca el ícono de su perfil en la aplicación Gemini, verá la opción para cambiar al Asistente de Google si desea volver a la versión anterior, pero es difícil decir cuánto tiempo estará disponible esta opción. Actualmente, hay algunas cosas que los Asistentes pueden hacer y que Géminis no puede, por lo que habrá una transición. Sin embargo, a principios de este mes, Google anunció nuevos productos Nest y también trajo noticias de que el Asistente de Google pronto tendrá una voz más natural y algunas de sus funciones se actualizarán con otros modelos en lenguaje Gemini.
Por ejemplo, puede preguntar si un conductor de entrega de FedEx se presentará en su puerta y lo interpretará basándose en el video del timbre. Las alertas de movimiento pueden contener más información que solo «persona detectada». Esto significa que ahora tenemos dos asistentes, y parece que Google ahora está totalmente de acuerdo con esto.
Xiao promete que Gemini Live AI será tu asistente personal, desde donde podrás solicitar citas en el calendario e invitaciones por correo electrónico, todo ello en función de tus datos personales. En casa, el Asistente de Google es tu asistente «práctico» porque se parece más a un dispositivo doméstico.
Esto parece una receta para el desastre de la marca. Es difícil realizar un seguimiento de todas las variaciones de Gemini que existen (y no olvidemos que Gemini era «Bard» cuando se lanzó por primera vez el año pasado). Esto también puede significar que algunas funciones estarán limitadas según el dispositivo que esté utilizando para evitar que los visitantes vean sus correos electrónicos.
Si tienes la costumbre de pedirle a Gemini que haga una tarea en tu teléfono, pero luego lo dejas en otra habitación y el asistente del altavoz Nest se niega, ¿estás molesto?
¿Qué puede hacer Gemini Live AI?
Con Gemini Live AI, puedes hacer una variedad de cosas, desde hacer preguntas similares a las que escribimos en Gemini tradicional, hasta preguntas más complejas que te ayudarán en tu investigación, trabajo o envío de planificación. De hecho, puedes hablar con Gemini Live sobre casi cualquier cosa que quieras.
Por ejemplo, para ampliar el artículo que estás leyendo, le pedí a Gemini Live que me hablara de algunas funciones. Con Gemini Live AI también podrás tener conversaciones muy personales.Tu chat de Gemini Live AI se guardará para que puedas verlo más tarde. También puedes comprobar y traducir si ha compartido algún enlace o fragmento de código contigo.
¿Cómo empezar con Géminis?
La aplicación Gemini está disponible para Android en Play Store. Para comenzar a usar Gemini, los usuarios deben descargar la aplicación Gemini de Google Play Store en su dispositivo Android. En este caso, Gemini está disponible para teléfonos Android (incluidos algunos modelos plegables) con 2 GB de RAM o más y Android 10 o superior.
En su dispositivo iOS, debe instalar la aplicación de Google y luego buscar la pestaña Gemini en la aplicación. Debes tener iOS 15.0 o posterior. Otra forma de utilizar Gemini en iOS (requiere la aplicación de Google) y Android es utilizar el Asistente de Google. Los usuarios sólo necesitan decir «Hola Google» para comenzar a interactuar con la inteligencia artificial.
Finalmente, los usuarios de cualquier dispositivo móvil con una cuenta de Google pueden visitar el sitio web de Gemini e interactuar con la IA. Otra ventaja de Géminis es la capacidad de interrumpir las reacciones. Si bien esto funciona, a veces tarda un poco en responder.
Además, Géminis tarda mucho en dejar de hablar así que estoy un poco confundida y no sé si puedo hablar o si tengo que esperar mi turno para hablar. Si bien la animación del degradado es agradable, no crea giros claros. Sin embargo, siempre existe una forma segura de interrumpir su trabajo tocando la pantalla.
Vale la pena señalar que Gemini Live AI funciona a través de Internet. No podrás usarlo sin conexión. Usar Wi-Fi es rápido y fluido, pero si intentas usar datos móviles, las llamadas pueden interrumpirse. Gemini también introdujo recientemente funciones adicionales como el uso de extensiones para conectarse a otros servicios de Google y una búsqueda de imágenes mejorada, pero Gemini Live no tiene acceso a esas funciones nuevas.