En Intel Vision 2024, Intel presentó el acelerador Intel Gaudi 3 para aportar rendimiento, apertura y opciones a la IA generativa empresarial (GenAI), y dio a conocer un conjunto de nuevos sistemas abiertos escalables, productos de última generación y colaboraciones estratégicas para acelerar la adopción de GenAI.

«Gracias al silicio, la innovación avanza a un ritmo sin precedentes y todas las empresas se están convirtiendo rápidamente en empresas de IA», afirmó Pat Gelsinger, CEO de Intel. «Intel está llevando la IA a todas las partes de la empresa, desde el PC hasta el centro de datos y el Edge. Nuestras últimas plataformas GaudíXeon y Core Ultra están ofreciendo un conjunto cohesionado de soluciones flexibles adaptadas para satisfacer las necesidades cambiantes de nuestros clientes y capitalizar las inmensas oportunidades que tenemos por delante.»

Sobre este punto, Marcelo Bertolami destacó las tres leyes mencionadas por el CEO de Intel: económica, el Cloud es mucho más caro que el Edge; la ley física, ya que no podemos cambiar la velocidad de la luz, por lo que por una cuestión de latencia si se necesitan respuestas rápidas el procesamiento se tiene que hacer de manera local; y la ley de la tierra, las empresas quieren tener sus datos en su país. “Para 2026 el Machine Learning y la IA va a estar en el Edge al menos en la mitad de las implementaciones”, sostuvo.

El acelerador de IA Intel Gaudi 3 impulsará sistemas de IA con hasta decenas de miles de aceleradores conectados a través del estándar común de Ethernet. De acuerdo con la compañía, promete 4 veces más capacidad de cálculo de IA para BF16 y 1,5 veces más ancho de banda de memoria que su predecesor. “El acelerador ofrecerá un salto significativo en el entrenamiento y la inferencia de IA para las empresas globales que buscan desplegar GenAI a escala”, asegura.

“EN COMPARACIÓN CON NVIDIA H100, SE PREVÉ QUE INTEL GAUDI 3 OFREZCA UN TIEMPO MEDIO DE ENTRENAMIENTO UN 70% MÁS RÁPIDO PARA LOS MODELOS LLAMA2 CON 13B PARÁMETROS. ADEMÁS, SE PREVÉ QUE SUPERE A H100 EN UNA MEDIA DEL 50% EN INFERENCIA Y DEL 40% EN EFICIENCIA ENERGÉTICA PARA LOS MODELOS DE LENGUAJE DE GRAN TAMAÑO (LLM) LLAMA 7B, 70B Y FALCON 180B”. 

Intel Gaudi 3 proporciona software abierto basado en la comunidad y redes Ethernet estándar del sector. Además, permite a las empresas escalar con flexibilidad desde un único nodo hasta clústeres, superclústeres y megaclústeres con miles de nodos, dando soporte a la inferencia, el ajuste fino y la formación a la mayor escala.

 

Intel Gaudi 3 estará disponible para los fabricantes de equipos originales, incluidos Dell TechnologiesHPELenovo y Supermicro, en el segundo trimestre de 2024.

Sistemas de IA abiertos y escalables

La compañía también presentó su estrategia para sistemas de IA abiertos y escalables, que incluye hardware, software, marcos y herramientas. “El enfoque de Intel permite que un amplio ecosistema abierto de actores de la IA ofrezca soluciones que satisfagan las necesidades de GenAI específicas de las empresas. Esto incluye fabricantes de equipos, proveedores de bases de datos, integradores de sistemas, proveedores de software y servicios y más. También permite a las empresas utilizar las soluciones y los socios del ecosistema que ya conocen y en los que ya confían”, afirmó.

“IA EVERYWARE: INTEL TRABAJA PARA QUE LA IA SEA SEGURA, MÁS ECONÓMICA, CON MENOS CONSUMO, Y EN UN ECOSISTEMA ABIERTO”. 

MARCELO BERTOLAMI

 

Desarrollo en Latam y rol del canal

Si bien Bertolami aclaró que tener sistemas con Gaudi no es algo sencillo, es decir que la especificidad no es nada simple, por lo que la propuesta vendrá del lado de los grandes OEMs, destacó que dentro del Edge los canales están trabajando con OpenVINO desde hace años, por lo que ahora van a poder utilizar los NPU de las nuevas versiones de Core Ultra.

“PARA EL CANAL EL EDGE ES CLAVE Y VA A JUGAR UN ROL SÚPER IMPORTANTE”.

También dijo que hay un espacio muy grande para el canal con la IA PC. “Imaginen que hay 18 meses para el fin de Windows 10 Support (14 de octubre de 2025): “Ahí hay una oportunidad clara de entrar y modernizar esas flotas de PCs”, señaló.

En ese sentido, recordó que a través de Intel Partner Alliance, la compañía brinda entrenamiento a sus distintos tipos de canales, de hardware, de software, servicios y para los desarrolladores.

“Es impresionante el desarrollo en Latam con IA, recuerden que se trata de software; y no solo con Intel. Los CIOs hoy están viendo cómo usan IA para ganar competitividad. La IA no le va a ganar a un humano solo, un humano con IA le va a ganar a una empresa sin IA”, concluyó.

Casos

Intel compartió un amplio impulso con clientes empresariales de todos los sectores para desplegar las soluciones del acelerador Intel Gaudi para nuevas e innovadoras aplicaciones de IA generativa:

  • NAVER. NAVER ha confirmado la capacidad fundacional de Intel Gaudi en la ejecución de operaciones informáticas para modelos Transformer a gran escala con un rendimiento por vatio excepcional, para desarrollar el modelo LLM más potente para el despliegue de servicios avanzados de IA a nivel global, desde la nube hasta el dispositivo.
  • Bosch. Explora nuevas oportunidades para la fabricación inteligente, incluyendo modelos fundacionales, generando conjuntos de datos sintéticos de anomalías de fabricación para proporcionar conjuntos de entrenamiento robustos y uniformemente distribuidos para, por ejemplo, la inspección óptica automatizada.
  • IBM. Emplea procesadores Intel® Xeon® de 5ª generación para su almacén de datos watsonx.data y colabora estrechamente con Intel para validar la plataforma watsonx para los aceleradores Intel Gaudi.
  • Ola/Krutrim. Pre- entrena y afina su modelo fundacional de la India con capacidades generativas en 10 idiomas, produciendo un rendimiento/coste líder en la industria (1,5-2 veces mejor) frente a las soluciones del mercado. Krutrim está entrenando un gran modelo fundacional en un clúster Gaudi 2.
  • Advent International/NielsenIQ. Implementa GenAI dentro de su plataforma Discover, incluyendo el entrenamiento de Modelos de Lenguaje Amplio (LLMs, por sus siglas en inglés) específicos del dominio en la base de datos más grande del mundo para el comportamiento de compra del consumidor, mejorando sus servicios al cliente.
  • Seekr. Líder en IA de confianza, ejecuta cargas de trabajo de producción en Intel Gaudi 2, GPUs Intel Max Series y procesadores Intel Xeon en Intel Developer Cloud para el desarrollo LLM y soporte de despliegue de producción.
  • IFF. Lidera la próxima ola de soluciones sostenibles para el cuidado del consumidor mediante el establecimiento de un flujo de trabajo de biología digital integrado y generado por IA para mejorar el diseño de enzimas y la tecnología de gemelos digitales para la optimización del proceso de fermentación.
  • CtrlS Group. Trabaja con Intel para llevar un clúster Intel Developer Cloud Gaudi de 128 nodos a clientes con sede en la India y ampliación de los servicios en la nube de CtrlS para la India con clústeres Gaudi adicionales.
  • Bharti Airtel. Aprovechando el poder de la tecnología de vanguardia de Intel, Airtel planea aprovechar sus ricos datos de telecomunicaciones para mejorar sus capacidades de IA y turbo cargar las experiencias de sus clientes. Los despliegues estarán en línea con el compromiso de Airtel de mantenerse a la vanguardia de la innovación tecnológica y ayudar a impulsar nuevas fuentes de ingresos en un panorama digital en rápida evolución.
  • Landing AI. Modelo de visión de gran escala adaptado a un dominio específico para segmentar células y detectar el cáncer.
  • Roboflow. Ejecuta cargas de trabajo de producción de los modelos YOLOv5, YOLOv8, CLIP, SAM y ViT para su plataforma integral de visión por ordenador.
  • Infosys. Colaboración estratégica para utilizar las soluciones de Intel technologies en Infosys Topaz, un conjunto de servicios basados en IA, soluciones y plataformas que aceleran el valor empresarial utilizando GenAI.

Intel también ha anunciado colaboraciones con Google CloudThales y Cohesity para aprovechar las capacidades informáticas confidenciales de Intel en sus instancias en la nube. Esto incluye Intel Trust Domain Extensions (Intel TDX), Intel Software Guard Extensions (Intel SGX) y el servicio de respaldo de Intel. Los clientes pueden ejecutar sus modelos y algoritmos de IA en un entorno de ejecución de confianza (TEE) y pueden aprovechar los servicios de confianza de Intel para proporcionar una verificación independiente para sus instancias de máquina virtual C3.

Plataforma abierta de IA empresarial

En colaboración con SAPOracle y otros líderes del sector, Intel ha anunciado su intención de crear una plataforma abierta para la IA empresarial. “El esfuerzo de todo el sector tiene como objetivo desarrollar sistemas GenAI abiertos y multiproveedor que ofrezcan la mejor facilidad de despliegue, rendimiento y valor de su clase, habilitados por la generación aumentada por recuperación (RAG)”, anunció. RAG incorpora datos estructurados y no estructurados procedentes de fuentes fiables fuera de un modelo, lo que mejora la precisión y fiabilidad de GenAI al tiempo que preserva la seguridad de los datos de propiedad.

Como pasos iniciales en este esfuerzo, Intel lanzará implementaciones de referencia para canalizaciones GenAI, publicará un marco conceptual técnico y continuará añadiendo capacidad de infraestructura en Intel Developer Cloud para el desarrollo del ecosistema y la validación de RAG y futuras canalizaciones. Intel exhorta a una mayor participación del ecosistema para unir fuerzas en este esfuerzo abierto para facilitar la adopción empresarial y los resultados de negocio.

Hoja de ruta 

Además del acelerador Intel Gaudi 3, Intel proporcionó actualizaciones sobre sus productos y servicios de próxima generación en todos los segmentos de la IA empresarial.

Intel Xeon 6

Los procesadores Intel Xeon ofrecen una solución de rendimiento eficiente para ejecutar las soluciones GenAI actuales, incluyendo RAG, que producen resultados específicos de negocio utilizando datos propios. Intel presentó la nueva marca para sus procesadores de próxima generación para centros de datos, nube y periferia: Intel Xeon 6. “Lanzados en el segundo trimestre de 2024, los procesadores Xeon 6 con los nuevos núcleos Efficient-core (E-core) y Performance-core (P-core) ofrecerán una eficiencia excepcional y un mayor rendimiento de IA”, destacó.

  • Procesadores Intel Xeon 6 con E-cores (antes denominados Sierra Forest):
    • 2.4 veces más rendimiento por vatio y 2,7 veces más densidad de rack en comparación con los procesadores Intel Xeon de 2ª generación.
    • Los clientes pueden sustituir los sistemas antiguos en una proporción de casi 3 a 1, lo que reduce drásticamente el consumo de energía y ayuda a cumplir los objetivos de sostenibilidad.
  • Procesadores Intel Xeon 6 con P-cores (antes denominados Granite Rapids):
    • Incorpora soporte de software para el formato de datos MXFP4, que mejora el rendimiento de la inferencia hasta 2,5 veces con respecto a BF16, con capacidad para ejecutar modelos Llama-2 de 70 billones de parámetros.

Clientes, Edge y conectividad

Intel también anunció el impulso para el cliente y las actualizaciones de su hoja de ruta para el Edge y la conectividad:

  • Los procesadores Intel Core Ultra están impulsando nuevas capacidades de productividad, seguridad y creación de contenidos, lo que supone una gran motivación para que las empresas renueven sus flotas de PC.

“ESPERAMOS COMERCIALIZAR 40 MILLONES DE PC CON INTELIGENCIA ARTIFICIAL EN 2024, CON MÁS DE 230 DISEÑOS, DESDE PC ULTRADELGADOS HASTA DISPOSITIVOS PORTÁTILES PARA JUEGOS”.

  • La próxima generación de la familia de procesadores Intel Core Ultra para clientes (cuyo nombre en código es Lunar Lake), que se lanzará en 2024, tendrá más de 100 teras de operaciones pico por segundo (TOPS) y más de 46 TOPS de unidad de procesamiento neural (NPU) para la próxima generación de PC con IA.
  • Intel ha anunciado nuevos productos Edge de silicio de vanguardia de las familias Intel Core Ultra, Intel Core, Intel Atom e Intel Arc de unidades de procesamiento gráfico (GPU), dirigidos a mercados clave como el comercio minorista, la fabricación industrial y la sanidad. Todas las nuevas incorporaciones a la cartera de Intel Edge AI estarán disponibles este trimestre y contarán con el apoyo de Intel Tiber Edge Platform este año.
  • Transformar los sistemas de IA, Intel presenta la AI NIC (tarjeta de interfaz de red), basada en el estándar abierto del Consorcio Ultra Ethernet. Esto amplía la cartera de conectividad de red de la empresa de adaptadores de red Ethernet Intel® y unidades de procesamiento de infraestructura Intel (IPU). A partir de 2026, AI NIC estará disponible en formato de tarjeta Ethernet o chiplet, y proporcionará conectividad de red optimizada basada en Ethernet para el entrenamiento y la inferencia en los mayores clústeres de IA.

Intel Tiber 

Intel presentó el portafolio Intel Tiber de soluciones empresariales para agilizar la implementación de software y servicios empresariales, incluso para GenAI.

“Una experiencia unificada facilita a los clientes y desarrolladores empresariales la búsqueda de soluciones que se adapten a sus necesidades, aceleren la innovación y liberen valor sin comprometer la seguridad, el cumplimiento o el rendimiento”, informó.