Google presentó sus actualizaciones e internet pierde la cabeza

Google presentó sus actualizaciones e internet pierde la cabeza

El martes pasado, la Google I/O 2024, el evento anual en el que la empresa presenta sus últimas apuestas y su visión al futuro, mostró todas las novedades que se esperan para los próximos meses. Entre lo más destacado, resalta Gemini, el anuncio de Veo, su IA generativa que crea videos a partir de texto, su próximo asistente inteligente de voz y su poderoso hardware Trillium.

Bueno, estas actualizaciones tienen menos de 48 horas y ya ha generado todo un revuelo en internet por lo que son capaces de hacer. Te mostramos porque Google competirá de lleno contra otras inteligencias artificiales.

Veo: el avanzado creador de videos con IA de Google

Google presentó sus actualizaciones e internet pierde la cabeza
Veo IA de Google permitirá hacer videos únicos.

Veo es el nuevo modelo de síntesis de video con IA que puede crear videos HD a partir de textos, imágenes o indicaciones, muy parecido a Sora de OpenAI. Puede generar videos en 1080p que duran más de un minuto y editar videos a partir de prompts.

También incluye la capacidad de editar videos existentes usando comandos de texto, mantener coherencia visual en todos los fotogramas y generar secuencias de video que duran hasta 60 segundos y más a partir de un solo mensaje o una serie de mensajes que forman una narrativa. También puede generar escenas detalladas y aplicar efectos cinematográficos, como time-lapses, tomas aéreas y varios estilos visuales.

Google asegura que Veo se basa en los modelos de generación de video anteriores de la compañía, incluyendo Generative Query Network, DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet y Lumiere. Para mejorar la calidad y eficacia, los datos de la capacitación de Veo incluyen subtítulos de video más detallados y usa representaciones de videos “latentes” comprimidas. Para mejorar la calidad de generación de videos de Veo, Google incluyó subtítulos más detallados para los videos usados para entrenar a Veo, lo que permitió a al IA interpretar las indicciones con mayor precisión.

IA integrada perfectamente en la búsqueda

Google presentó sus actualizaciones e internet pierde la cabeza
La IA se integrará a la búsqueda de Google.

IA Overviews será la nueva herramienta que se integrará al buscador de Google, con el que será capaz de entregar resultados contextuales a preguntas específicas. Además, podrá diseñar y presentar páginas de información organizada según peticiones puntuales.

Además de AI Overviews, Google también presentó su nueva búsqueda con video. Los usuarios podrán tomar video y hacer preguntas específicas con su voz sobre lo que están capturando con su cámara y Google responderá.

Ambas herramientas son el resultado de una implemetación profunda del modelo de inteligencia artificial de Gemini.

Astra, el asistente de IA de próxima generación

Google presentó sus actualizaciones e internet pierde la cabeza
Astra será un asistente con IA muy competitivo.

Astra está diseñado para interactuar con su entorno, capturando, almacenando, analizando y captando información contextual.

Project Astra es una especie de versión con esteroides de Google Lens. Cuando se enfoca algo con la cámara y la IA lo reconoce, ofrecerá respuestas en base a ello en tiempo real. Durante una demostración, se seleccionaron varios peluches y se colocaron debajo para que arme su propia historia. Por ejemplo, un dinosaurio, una dona, una barra de pan o un instrumento. Se le puede preguntar a Astra cualquier cosa sobre ellos y contestará. Si se añade un nuevo objeto, inmediatamente hablará sobre él.

Lo espectacular de esta nueva herramienta de Google es como reconoce cada objeto y como puede “inventar” una historia con la función “Storyteller”, en base a dichos objetos.

Otra característica es que tiene “memoria”. En la demostración oficial se nota como una persona pregunta en dónde dejó sus gafas y esta le responde.

Imagen 3: modelo de conversión de texto a imagen de máxima calidad

Google presentó sus actualizaciones e internet pierde la cabeza
Imagen 3, la evolución de la IA generativa de imágenes.

Imagen 3 es la nueva versión del modelo de inteligencia artificial para generar imágenes a partir de texto de Google. Hace unas semanas habían anunciado Imagen 2, lo que significa que la empresa está esforzándose en avanzar.

Este tipo de sistemas de IA entenderán la petición escrita que hagas, cada detalle que deseas que esté en la imagen, su enfoque, texturas, estilos y más. Entonces, generará la imagen a partir de la interpretación de tu petición.

Imagen 3 destaca porque puede producir imágenes fotorrealistas. También mejoró la manera en la que interpreta el lenguaje natural, y sobre todo, la capacidad que tiene para añadir detalles específicos a partir de prompts muy extensos. Esto quiere decir que entiende mejor los textos y los detalles.

Gemini 1.5 Pro

Google presentó sus actualizaciones e internet pierde la cabeza
Gemini 1.5 Pro ha recibido una actualización.

Hace poco hablamos de Gemini 1.5 Pro y como er de potente, bueno, Google la actualizó y amplió aún más su ventana de contexto. Ahora, del millón de tokens iniciales, que ya era una barbaridad, pasamos a dos millones de tokens. De momento, hay que acceder a una lista de espera para la vista previa privada, donde se permite procesar una mayor cantidad de horas de  video, audio, líneas de código y muchas más palabras. Según explican los responsables de Google, esto implica mejoras de calidad en casos de uso clave, como la traducción, la codificación, el razonamiento y más. Lo que debería ayudarte a abordar tareas aún más amplias y complejas.

Trillium: ofrece un rendimiento computacional por chip 4.7 veces mejor que TPU v5e

Google presentó sus actualizaciones e internet pierde la cabeza
Trillium será el nuevo chip que competirá con Nvidia.

Alphabet, matriz de Google, presentó Trillium, un producto de su familia de chips de centro de datos de inteligencia artificial que, según dice, es casi cinco veces más rápido que su versión anterior.

La demanda de la industria de computadoras se ha multiplicado por un millón en los últimos seis años, aumentando aproximadamente diez veces año, según Sundar Pichai, director ejecutivo de Alphabet.

El esfuerzo de la empresa por construir chips personalizados para centros de datos de IA representa una de las pocas alternativas viables a Nvidia. Junto con el software estrechamente relacionado con las unidades de procesamiento sensorial de Google, los chips han permitido que l empresa se posicione en el mercado.

Trillium logrará un rendimiento informático 4.7 veces mejor en comparación con el TPU v5e, un chip diseñado para impulsar la tecnología que genera texto y otros medios a partir de modelos  grandes.

El nuevo chip estará disponible para sus clientes de la nube a “finales de 2024”, dijo la compañía.

Música generativa con MusicFX

Google presentó sus actualizaciones e internet pierde la cabeza
MusicFX, genera música con IA generativa.

Libera al DJ que llevas dentro con MusicFX. Mezcla géneros, ritmos, instrumentos, crea historias musicales y mucho más.

MusicFX consiste en generador de música a partir de texto. Escribiendo prompts como “un solo de saxofón de jazz”, obtendrás exactamente eso. Está diseñado para ser fácil de usar y ofrece sugerencias y una nube de palabras para afinar tus ideas musicales. El potencial de MusicFX de Google es enorme, especialmente para los  creadores de contenido que buscan un punto de partida o simplemente inspiración.

Como puedes observar, Google ha decidido actualizar a lo grande la gama de herramientas que ofrece a los usuarios y no quedarse atrás frente a sus competidores en el mercado de IA.

Dejar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio