Click acá para ir directamente al contenido
Tecnología

Google I/O 2024: Conoce los anuncios que abren una nueva era de la IA

Google realizó su evento anual Google I/O en el que anunció nuevos productos y servicios impulsados por inteligencia artificial (IA).

Google I/O, Gemini, 2024.

Vicente Barraza

- TVN

Jueves 16 de mayo de 2024

Google realizó esta semana una nueva edición de su evento anual Google I/O en el que anunció nuevos productos y servicios impulsados por inteligencia artificial (IA). Las novedades vinieron desde la expansión del modelo de lenguaje Gemini a nuevas fronteras y nuevas experiencias de búsqueda, hasta la integración de Gemini en Workspace para facilitar la creación de respuestas inteligentes. Con esto, Google confirma que está plenamente en la era de la IA.

LEE TAMBIÉN EN CONCIENCIA 24.7:

Durante la conferencia, Sundar Pichai, CEO de Google y Alphabet, afirmó que el objetivo de Google es que todas las personas se beneficien de los avances de Gemini.

Además, hizo hincapié en los esfuerzos de la compañía: “Llevamos más de una década priorizando la inteligencia artificial e invirtiendo en todas las capas del proceso: investigación, producto e infraestructura. Creemos que es una herramienta que tiene muchos desafíos por delante. Por eso, todos nuestros anuncios representan lo que bautizamos como un “I/O” para una nueva generación”. 

Actualizaciones del modelo de lenguaje Gemini

Entre los anuncios de Google, destacó la nueva versión Gemini 1.5 Pro que brinda mayor utilidad en su ventana de contexto, en sus capacidades de razonamiento multimodal y en su rendimiento a nivel general. Además, gracias a las pruebas previas con clientes y desarrolladores, se creó Gemini 1.5 Flash: un modelo más ligero que 1.5 Pro, diseñado para ser rápido y eficaz a gran escala.

Ambos modelos se encuentran en versión preliminar con una ventana de contexto de un millón de tokens en Google AI Studio y Vertex AI. A su vez, y a partir de esta semana, está disponible una ventana de contexto de 2 millones de tokens tanto para desarrolladores que utilicen la API como para los clientes de Google Cloud, a través de la lista de espera. Además, se anunció que se está integrando Gemini 1.5 Pro en los productos de Google, incluyendo Gemini Advanced y en las aplicaciones de Workspace.

También se lanzaron la próxima generación de modelos abiertos Gemma 2, y compartieron los avances en el futuro de los asistentes de inteligencia artificial con Proyecto Astra. Esta última iniciativa propuso asistentes basados en el modelo Gemini y otros modelos específicos de tarea, diseñados para procesar la información más rápidamente mediante la codificación continua de fotogramas de imágenes, la combinación de video y voz en una línea temporal de acontecimientos y el almacenamiento en caché de esta información para una reproducción más eficaz.

Al aprovechar los modelos de voz de Google se optimiza el sonido, dotando a los asistentes de una gama más amplia de entonaciones. Así pueden entender mejor el contexto en el que se utilizan y responder rápidamente en una conversación.

Avances para reimaginar la búsqueda en línea con IA generativa

En el evento también se dio a conocer la integración de un nuevo modelo de Gemini en el Search, que sigue abriendo nuevas puertas a la hora de buscar en Google. Este permitirá no solo realizar consultas, sino también simplificarlas, facilitar la investigación y planificación, y la generación de ideas, entre otros.

¿Lo más destacado respecto a este apartado? Para aquellas personas que necesiten encontrar respuestas rápidas en internet por falta de tiempo, ahora el buscador podrá hacer un “Resumen Creado con IA” para preguntas simples y complejas. Al mismo tiempo, ayudará a crear planes de alimentación o viajes: por ejemplo, consultando “crear plan (...)” se brindará información de recetas o lugares turísticos en un clic.  Esta información se podrá exportar a Gmail o Documentos si fuese necesario. Asimismo, el buscador incorporará la posibilidad de buscar con videos y acceder a páginas personalizadas de las fuentes más relevantes para cada inquietud. 

Realizar más tareas diarias con Gemini

Por primera vez, las personas suscriptas a Gemini Advanced podrán acceder a Gemini 1.5 Pro: el modelo de lenguaje más actualizado que permite, entre otras cosas, acceder a una ventana de contexto ampliada, la más extensa de cualquier chatbot para consumidores disponible en el mundo. Comprenderá múltiples documentos grandes, de hasta 1.500 páginas en total, o podrá resumir 100 correos electrónicos en segundos. Pronto podrá manejar una hora de contenido de vídeo o bases de código con más de 30.000 líneas.

A su vez, se implementará una nueva experiencia de conversación móvil llamada “Gemini Live” que utiliza la tecnología de voz de última generación para que hablar con Gemini sea aún más intuitivo. Por otro lado, se creó Gems: una experiencia que permite a los suscriptores de Gemini Advanced personalizar Gemini según sus gustos, ya sea como entrenador personal, estilista o guía de escritura creativa. En este sentido, Gemini continúa incorporando más aplicaciones de Google a través de “Extensiones”.

Gemini para Workspace: “Ayúdame a escribir” ahora en español en Gmail y Documentos de Google

En las próximas semanas, todas las organizaciones que usan Google Workspace y los usuarios que tienen Google One AI Premium tendrán acceso a la funcionalidad “Ayúdame a escribir” directamente integrada a Gmail y Documentos de Google en español. Esta herramienta será útil para:

  1. Escribir un nuevo borrador utilizando un comando libre. Por ejemplo, se podrá pedir a Gmail que escriba una invitación de cumpleaños o una presentación para un posible contacto comercial.
  2. Mejorar un borrador. Por ejemplo, se podrá pedir que reformule un borrador o hacerlo más formal, conciso o detallado.

Además, a partir de ahora, el modelo Gemini 1.5 Pro se incorporará a las distintas herramientas de Workspace a través de un panel lateral en el que las personas podrán realizar preguntas o consultas sobre el contenido o información disponible en ese producto y recibir respuestas, resúmenes, sugerencias y más. Por ejemplo, se podrá pedir en Documentos un resumen con foco en ciertas características de un informe disponible en dicho archivo

IA al servicio de la sociedad y más formas para proteger el uso indebido de ella

Durante el evento, Google reveló nuevas formas en las que está mejorando sus modelos de lenguaje, como Gemini, y como se encuentra protegiendo a las personas de su uso indebido. Esto incluye nuevas prácticas de investigación, como la incorporación de marcas de agua para textos y videos generados con IA, y el trabajo colaborativo con otras organizaciones.

Por otro lado, presentó “LearnLM” un nuevo modelo de lenguaje basado en Gemini que impulsa una experiencia de aprendizaje adaptada a las necesidades de cada individuo. Se integrará a Gemini, al Search, YouTube y Google Classroom. De igual forma, lanzó “Illuminate”, una nueva herramienta experimental creada para hacer más accesible y comprensible el conocimiento. Por ejemplo, puede generar una conversación formada por dos voces generadas por IA, que ofrecen una visión general y un breve debate sobre las ideas clave de un trabajo de investigación determinado.