¿Qué está anunciando Google en su Cloud Next ´24?

A tan sólo ocho meses de la pasada edición, la agenda de anuncios de este año es nutrida y trascendente. Thomas Kurian, CEO de Google Cloud, pasa revista a los hechos más importantes del encuentro, las alianzas celebradas y las novedades.

211

“Nos reunimos por última vez hace apenas ocho meses en Next 2023, pero desde entonces, hemos avanzado más de un año innovando y transformándonos con nuestros clientes y partners”, expresó el CEO de Google Cloud, Tomas Kurian, en la previa de Next ´24. “Hemos introducido más de mil avances de productos en Google Cloud y Workspace. Hemos ampliado nuestra infraestructura a escala planetaria a 40 regiones y anunciado nuevas inversiones en cables submarinos para conectar el mundo a nuestra nube con una latencia baja predecible. Hemos introducido modelos nuevos y de última generación, incluidos nuestros modelos Gemini, y los hemos llevado a desarrolladores y empresas. Y la industria se está dando cuenta: hemos sido reconocidos como líderes en 20 de las evaluaciones de los principales analistas de la industria”, agregó.

Lo cierto es que, ya desde el primer día de los tres que dura el encuentro (del 9 al 11 de abril) se fueron acumulando los anuncios de alianza y despliegues en torno a la tecnología de nube de Google y, más precisamente, las de IA generativa. Entre los anuncios de nuevas alianzas y expansiones de las existentes, figuran organizaciones de la talla de Bayer, Mercedes Benz, Palo Alto Networks o Verizon. “De hecho, esta semana en Next, más de 300 clientes y socios compartirán sus éxitos en la generación de IA trabajando con Google Cloud”, adelantó el Kurian. 

Las colaboraciones que se vienen abarcan desde el campo de la Salud (Bayer y Google Cloud anunciaron una colaboración para el desarrollo de soluciones de IA para ayudar a los radiólogos en sus diagnósticos) hasta el territorio de la Ciberseguridad (donde, por ejemplo, Palo Alto nombró a Google Cloud como su proveedor de IA e infraestructura preferente), pasando por la infraestructura tecnológica empresarial (Google Cloud y Broadcom estarán optimizando las cargas de trabajo VMware para Google Cloud, colaborando además en iniciativas de comercialización). Pero esto es sólo el comienzo. 

«esta semana en Next, más de 300 clientes y socios compartirán sus éxitos en la generación de IA trabajando con Google Cloud».

Desde el silicio a la IA

Uno de los anuncios importantes se relaciona directamente con los chips personalizados, como la disponibilidad general de TPU v5p y Google Axion: la primera CPU personalizada basada en arquitectura Arm y diseñada para el centros de datos. Las TPU han sido durante mucho tiempo la base para capacitar y ofrecer productos impulsados ​​por inteligencia artificial como YouTube, Gmail, Google Maps, Google Play y Android. De hecho, como bien cuenta Kurian, Gemini, el modelo de IA más capaz y general de Google (también anunciado en el marco de esta edición de Next) fue entrenado y funciona utilizando TPU.

Por otro lado, Google Cloud lanzó la versión preliminar pública de Gemini 1.5 Pro, que incluye un gran avance en la comprensión del contexto a largo plazo, nuevas capacidades en Vertex AI bajadas a tierra; Gemini Code Assist para desarrolladores; capacidades ampliadas de ciberseguridad con Gemini en Threat Intelligence; y nuevas mejoras para Gemini en Google Workspace, por citar tan sólo algunas de las novedades. 

Más modelos y funcionalidades en Vertex AI

Hoy se anunció el acceso ampliado a una variedad de modelos, brindando a las organizaciones la mayor opción en cuanto a selección de los mismos. Gemini 1.5 Pro, disponible en versión public preview, incorpora una enorme ventana de contexto de un millón de tokens, además de modelos abiertos de IA incluídos Gemma y Llama 2. También se incorporan modelos asociados como Claude 3, y otros abiertos como Code Gemma.

Respecto de creación de imágenes a través de IA, se suma a Imagen 2.0 con nuevas capacidades de conversión de texto a imagen en tiempo real que permitirán a los equipos creativos generar imágenes e imágenes animadas como gifs con filtros de seguridad y marcas de agua digitales – con tecnología SynthID de Google DeepMind – para obtener resultados fotorrealistas de alta calidad.

Con el avance de los casos de usos de inteligencia artificial, Google Cloud también presentó nuevas funcionalidades dentro de Vertex AI diseñadas para que organizaciones puedan obtener mucho más de los modelos de lenguaje naturales al expandirlos y anclarlos con datos propios de la organización. Se están anunciando también la ampliación de las capacidades de grounding (proceso de dotar a los modelos de lenguaje de información específica del caso de uso, la cual es relevante pero no está disponible en su conocimiento preexistente) de la plataforma Vertex AI, a través del uso de la Búsqueda de Google y la integración con aplicaciones, como Workday y Salesforce.

Cómo escalar con infraestructura optimizada por IA

“El potencial de la IA generativa para impulsar una transformación rápida para todas las empresas, gobiernos y usuarios es tan poderoso como la infraestructura que la sustenta. Google Cloud ofrece nuestra hipercomputadora AI, una arquitectura que combina nuestras potentes TPU, GPU, software de inteligencia artificial y más para brindar una forma eficiente y rentable de entrenar y servir modelos. Las empresas líderes en inteligencia artificial a nivel mundial, como Bending Spoons y Kakao Brain, están construyendo sus modelos en nuestra plataforma”, explicó Kurian.

En este orden, durante Next ´24 se realizaron anuncios que buscan respaldar a los clientes en cada nivel del stick tecnológico:

  • A3 Mega: Desarrollada con NVIDIA utilizando GPU H100 Tensor Core, esta nueva instancia basada en GPU estará disponible de forma general el próximo mes y ofrece el doble de ancho de banda por GPU en comparación con las instancias A3, para admitir las cargas de trabajo más exigentes. También anunciamos Confidential A3, que permite a los clientes proteger mejor la confidencialidad y la integridad de los datos confidenciales y las cargas de trabajo de IA durante la capacitación y la inferencia.
  • NVIDIA HGX B200 y NVIDIA GB200 NVL72: la última plataforma NVIDIA Blackwell llegará a Google Cloud a principios de 2025 en dos variantes: HGX B200 y GB200 NVL72. El HGX B200 está diseñado para las cargas de trabajo de IA, análisis de datos y HPC más exigentes, mientras que el GB200 NVL72 impulsa la inferencia de modelos de lenguaje grande en tiempo real y el rendimiento de entrenamiento a escala masiva para modelos de escala de billones de parámetros.
  • TPU v5p: Como se dijo, TPU v5p es un poderoso acelerador de IA, escalable y flexible para entrenamiento e inferencia, con cuatro veces la potencia de cálculo por módulo en comparación con nuestra generación anterior. También anunciamos la disponibilidad de compatibilidad con Google Kubernetes Engine (GKE) para TPU v5p. Durante el año pasado, el uso de GPU y TPU en GKE aumentó más del 900 %.
  • Opciones de almacenamiento optimizadas para IA: Estamos acelerando la velocidad del entrenamiento con nuevas funciones de almacenamiento en caché en Cloud Storage FUSE y Parallelstore, que mantienen los datos más cerca de la TPU o GPU del cliente. También presentamos Hyperdisk ML (en versión preliminar), nuestro servicio de almacenamiento en bloques de próxima generación que acelera los tiempos de carga de modelos hasta 3,7 veces en comparación con las alternativas comunes.
  • Nuevas opciones para Dynamic Workload Scheduler: El modo Calendario para garantizar la hora de inicio y el inicio flexible para una economía optimizada ayudarán a los clientes a garantizar una gestión eficiente de los recursos para la distribución de trabajos complejos de capacitación e inferencia.

«El potencial de la IA generativa para impulsar una transformación rápida para todas las empresas, gobiernos y usuarios es tan poderoso como la infraestructura que la sustenta».

“Además, estamos acercando la IA a los lugares donde se generan y consumen los datos: al borde, a los entornos aislados, a las nubes soberanas de Google y entre nubes. Estamos habilitando la IA en cualquier lugar a través de Google Distributed Cloud (GDC), lo que le permite elegir el entorno, la configuración y los controles que mejor se adapten a las necesidades específicas de su organización. Por ejemplo, el proveedor líder de telefonía móvil Orange, que opera en 26 países donde se deben conservar datos locales en cada país, aprovecha la IA en GDC para mejorar el rendimiento de la red y mejorar las experiencias de los clientes”, agrega el CEO de Google Cloud.

“También anunciamos N4 y C4, dos nuevas series de máquinas en nuestra cartera de máquinas virtuales de uso general; formas nativas de máquinas de metal desnudo en la familia de máquinas C3; la disponibilidad general de los grupos de almacenamiento avanzados de Hyperdisk; y mucho más”, agregó el ejecutivo.

América Latina en Google Cloud Next ’24

Como se dijo, durante Google Cloud Next ’24 numerosas empresas líderes a nivel global como Deutsche Bank, Estée Lauder, Mayo Clinic, McDonald’s, Puma, WPP, entre otras, presentarán cómo están utilizando Google Cloud AI para innovar en sus negocios. También lo harán varias compañías con fuerte presencia en América Latina entre las que se destacan:

  • Mercado Libre: Con foco en la mejora constante de la experiencia de sus usuarios, se encuentra experimentando con la búsqueda vectorial para gestionar su amplio catálogo de productos y mejorar la precisión de resultados en las consultas. También trabaja en la prevención de fraude con Google Vision AI y la tecnología de reconocimiento óptico de caracteres (OCR). Además. utiliza procesadores de documento como Document AI para analizar la información y automatizar la evaluación del riesgo crediticio en su servicio Mercado Crédito. Mercado Libre es uno de los primeros testers de Gemini Ultra y Gemini 1.5 Pro para probar sus casos de uso como agentes, asistentes de publicación, entre otros
  • Rotoplas: Rotoplas avanza en su camino de transformación digital con el apoyo de Google Cloud extendiendo la integración de soluciones como Gemini (antes Duet AI) en Gmail y Workspace para mejorar la productividad, creatividad y colaboración de los colaboradores de su organización. Tras una exitosa prueba piloto, Rotoplas implementará un plan para que más de 2 mil de sus colaboradores se beneficien de Gemini y les ayude a escribir en Docs y Gmail, a completar de forma inteligente información en Sheets y generar imágenes en Slides. Gemini también apoyará en la comprensión de tendencias comerciales, análisis del mercado y en la generación de pronósticos para desarrollar planes de negocio. En 2023, Rotoplas se embarcó en un acuerdo tecnológico de 5 años con Google Cloud para optimizar procesos y negocios por medio de soluciones basadas en IA. 
  • Camanchaca: Creó un agente -Elon- usando inteligencia artificial generativa que permite extraer y combinar información de un archivo de texto (CSV) con datos de producción, democratizando los datos críticos para su negocio al ponerla a disposición de todos los empleados, independientemente de sus conocimientos técnicos.