ScreenAI: La nueva IA de Google que cambiará la experiencia de usuario para siempre

ScreenAI: La IA de Google que cambiará la experiencia de usuario para siempre

Google presentó recientemente su nueva Inteligencia Artificial llamada ScreenAI y sin duda alguna, es algo que llegará para cambiar totalmente el futuro de nuestra experiencia como usuario para siempre. Aquí te mostraremos qué es y cuáles son esas novedades que cambiarán para siempre nuestra experiencia dentro de la web.

ScreenAI ¿Qué es?

ScreenAI: La IA de Google que cambiará la experiencia de usuario para siempre
Una captura de pantalla de una aplicación móvil con anotaciones generadas que incluyen elementos de la interfaz de usuario y sus descripciones; por ejemplo, TEXTlos elementos también contienen contenido de texto de OCR, IMAGElos elementos contienen títulos de imágenes y LIST_ITEMscontienen todos sus elementos secundarios.

En principio, ScreenAI se trata de un modelo de visión-lenguaje, o VLM por sus siglas en inglés, desarrollado por Google AI, el cual comprende tanto interfaces de usuarios como infografías. Así, Google presentó algo increíble, capaz de realizar tareas como respuestas gráficas a preguntas, anotación de elementos, resúmenes, navegación y control de calidad específico de la interfaz de un usuario.

El cómo funciona es sencillo, ya que no es más que un intérprete de la interfaz de usuario todopoderoso. Así, ScreenAI usa etapas diferentes para desempeñar mejor sus funciones. Estas etapas son las siguientes:

ScreenAI: La IA de Google que cambiará la experiencia de usuario para siempre
Diagrama de bloques de nuestro flujo de trabajo para generar datos para tareas de control de calidad, resumen y navegación utilizando modelos ScreenAI y LLM existentes. Cada tarea utiliza un mensaje personalizado para enfatizar los aspectos deseados, como preguntas relacionadas con el conteo, el razonamiento, etc.

Capacitación previa: En principio, aplica el aprendizaje autosupervisado para generar automáticamente etiquetas de datos.

Ajuste fino: Seguidamente, usa los datos etiquetados manualmente por evaluadores humanos, así que su automatización no será la respuesta de un simple robot, dando resultados perfectos.

Características de ScreenAI

ScreenAI: La IA de Google que cambiará la experiencia de usuario para siempre
atos generados por LLM. Ejemplos de control de calidad de pantalla, navegación y resumen. Para la navegación, el cuadro delimitador de acciones se muestra en rojo en la captura de pantalla.

ScreenAI cuenta con excelentes características que demuestran su potencia, en las que destacan:

Respuestas a preguntas: La Inteligencia Artificial es capaz de responder preguntas sobre lo que contienen las capturas de pantallas que hacemos. Si tenemos alguna duda de lo que vemos en una interfaz, solo debemos tomar una captura de pantalla y dársela a ScreenAI. Responderá de forma general o específica.

Navegación en pantalla: El modelo transforma una expresión en lenguaje natural en una acción que puede ejecutar en una pantalla. Por ejemplo, si le decimos “haz clic en el botón de búsqueda”, específicamente accionará la pantalla en la sección donde esté el botón de búsqueda.

Resumen de pantalla: Una de las opciones que más tiempo nos ahorrará, es que es capaz de resumir todo lo que se encuentra en pantalla en una o dos oraciones, facilitando enormemente la búsqueda de algún elemento específico.

ScreenAI: La IA de Google que cambiará la experiencia de usuario para siempre
Comparación del rendimiento del modelo de ScreenAI con modelos de última generación (SOTA) de tamaño similar.

Google mencionó que este es el futuro de la interacción de la interfaz de usuario y que la IA mejorará por completo la experiencia de todos sus usuarios. Estamos cerca del futuro en el que no deberemos presionar botones en un teclado o hacer clic en un mouse y bastará con decirle a nuestra computadora que haga tal acción.

Aunque ScreenAI aún no está disponible y de hecho, tan solo es un proyecto de investigación de momento, Google aseguró que es un proyecto consolidado y que está dispuesto a transformar la forma en como navegamos ¡Mantente atento, porque esto es algo que podría cambiar por completo todo lo que sabemos sobre navegación!

1 comentario en “ScreenAI: La nueva IA de Google que cambiará la experiencia de usuario para siempre”

  1. Pingback: Lumiere: La nueva IA generativa de Google | Cerebro Digital | 2024

Dejar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio