AWS anunció nuevos componentes para centros de datos y apoyar la innovación en IA al tiempo que mejora la eficiencia energética

Las novedades de la compañía están diseñadas para escalar a través de toda la infraestructura de nivel mundial, incluyendo sus 34 regiones, 108 zonas de disponibilidad y otras ofertas de infraestructura como Zonas locales de AWS. Se espera que la construcción de nuevos centros de datos con el conjunto completo de componentes comience a principios de 2025 en los Estados Unidos.

24
AWS re:Invent 2024.

Durante el evento AWS re:Invent, Amazon Web Services anunció nuevos componentes para centros de datos diseñados para respaldar la próxima generación de innovación en Inteligencia Artificial y las necesidades cambiantes de los clientes. Estas capacidades combinan innovaciones en energía, refrigeración y diseño de hardware para crear centros de datos más eficientes energéticamente que impulsarán la innovación de los clientes. 

“AWS continúa innovando incansablemente su infraestructura para construir la nube más eficiente, resiliente, segura y sostenible para clientes de todo el mundo”, dijo Prasad Kalyanaraman, Vicepresidente de Servicios de Infraestructura en AWS. “Estas capacidades para centros de datos representan un importante avance, con mayor eficiencia energética y soporte flexible para las nuevas cargas de trabajo. Pero lo que resulta aún más emocionante es que están diseñadas para ser modulares, lo que nos permite adaptar nuestra infraestructura actual con refrigeración líquida y eficiencia energética, alimentando aplicaciones de IA generativa y reduciendo nuestra huella de carbono”.

AWS ha estado construyendo centros de datos a gran escala durante 18 años y servidores basados en GPU para cargas de trabajo de IA durante 13 años. Actualmente, sus centros de datos respaldan a millones de clientes activos en todo el mundo, incluyendo cientos de miles que utilizan servicios de IA y machine learning de AWS, así como decenas de miles de clientes globales que emplean Amazon Bedrock para desarrollar sus aplicaciones de GenAI. A medida que el uso de IA generativa sigue creciendo y las demandas de capacidad de procesamiento aumentan, los centros de datos de AWS están adaptándose para admitir densidades de energía cada vez mayores. 

Principales mejoras

Diseño eléctrico y mecánico simplificado para alta disponibilidad

Las últimas mejoras en el diseño de los centros de datos de AWS incluyen distribución eléctrica y sistemas mecánicos simplificados, permitiendo una disponibilidad de la infraestructura del 99,9999%.  Además, estos sistemas simplificados reducen en un 89% la cantidad potencial de racks que podrían verse afectados por problemas eléctricos.

En un centro de datos, la electricidad pasa por múltiples sistemas de conversión y distribución antes de llegar al equipamiento de TI. Cada paso introduce naturalmente ineficiencia, pérdida de energía y puntos potenciales de falla. Como ejemplo de un nuevo diseño, AWS simplificó la distribución eléctrica y, al hacerlo, redujo en un 20% los posibles puntos de falla. 

Innovaciones en refrigeración, diseño de racks y sistemas de control

AWS ha desarrollado una serie de nuevas capacidades mejoradas para ofrecer a sus clientes una infraestructura con el máximo rendimiento, alta disponibilidad y eficiencia energética. Las innovaciones más recientes en los centros de datos incluyen:

  • Refrigeración líquida: Los servidores más recientes de IA se benefician de la refrigeración líquida para enfriar de manera más eficiente los chips de alta densidad. AWS ha desarrollado soluciones mecánicas innovadoras que permiten refrigeración líquida configurable directamente en el chip, tanto en sus centros de datos nuevos como en los actuales. Algunas tecnologías de AWS utilizan infraestructura de red y almacenamiento que no requieren refrigeración líquida. Por ello, los sistemas de refrigeración actualizados integrarán sin problemas capacidades de refrigeración por aire y por líquido para los chips de IA más avanzados, como AWS Trainium2, y soluciones de supercomputación de IA a nivel de rack, como NVIDIA GB200 NVL72, además de los switches de red y servidores de almacenamiento de AWS. 
  • Soporte para cargas de trabajo de IA de alta densidad: AWS está maximizando el uso de la energía optimizando la disposición de los racks en un centro de datos. Esto se logró mediante un software impulsado por datos e IA generativa que predice la forma más eficiente de ubicar servidores. AWS ahora reducirá la cantidad de energía desaprovechada y hará un uso más eficiente de la energía disponible.

    Este diseño admitirá la próxima generación de hardware y racks de alta densidad necesarios para cargas de trabajo de IA, pero es lo suficientemente flexible para adaptarse a una amplia gama de otros tipos de hardware. La infraestructura de AWS ofrece la plataforma de cómputo más amplia y profunda, con más de 750 instancias de Amazon Elastic Cloud Compute (Amazon EC2), lo que brinda a los clientes opciones de procesador, almacenamiento, red, sistema operativo y modelo de compra para cualquier carga de trabajo. Además del diseño flexible de refrigeración multimodal, AWS ha desarrollado innovaciones de ingeniería en sus sistemas de distribución de energía, lo que permitirá a AWS aumentar la densidad de potencia en racks seis veces durante los próximos dos años, y otras tres veces en el futuro. 

    En conjunto, estas innovaciones permiten a AWS ofrecer un 12% más de capacidad de cómputo por sitio para las cargas de trabajo de los clientes. Estos cambios reducirán la cantidad total de centros de datos necesarios para proporcionar la misma capacidad de cómputo.

  • Sistemas de control actualizados: La implementación de un sistema de control propio de Amazon en los dispositivos eléctricos y mecánicos de AWS permite estandarizar la supervisión, las alarmas y las secuencias operativas. Por ejemplo, las herramientas internas de telemetría de AWS utilizan tecnologías de la empresa para ofrecer diagnósticos en tiempo real y servicios de resolución de problemas, lo que permite mantener condiciones óptimas de operación en beneficio de los clientes.

Mayor eficiencia energética y sostenibilidad

Durante muchos años, AWS ha sido pionera en la mejora de la eficiencia energética y la sostenibilidad en su infraestructura. Las investigaciones estiman que la infraestructura de AWS es actualmente hasta 4.1 veces más eficiente que la infraestructura local, y cuando las cargas de trabajo se optimizan en AWS, la huella de carbono asociada puede reducirse hasta en el 99%. En 2023, Amazon logró su objetivo de igualar toda la electricidad consumida por sus operaciones con energía el 100% renovable, siete años antes de su meta de 2030.

AWS evalúa continuamente cómo operan sus centros de datos y determina formas de permitir que su infraestructura utilice la energía de manera más eficiente mediante la innovación constante. Los nuevos componentes incluyen las siguientes mejorías para la eficiencia energética y la sostenibilidad:

  • Un sistema de refrigeración más eficiente que se espera que reduzca el consumo de energía mecánica en hasta un 46% en comparación con su diseño anterior durante las condiciones de refrigeración máxima, sin aumentar el uso de agua por megavatio. Los cambios de diseño incluyen un nuevo sistema de refrigeración unilateral, reducción de equipamiento de refrigeración e introducción de capacidades de refrigeración líquida.
  • Reducción del carbono incorporado en el concreto de la estructura del centro de datos en hasta un 35%, en comparación con el promedio de la industria. AWS está adoptando especificaciones para acero y concreto de menor carbono, y optimizando el diseño estructural para usar menos acero en general.
  • Los generadores de respaldo podrán funcionar con diésel renovable, un combustible biodegradable y no tóxico que puede reducir las emisiones de gases de efecto invernadero en hasta un 90% durante el ciclo de vida del combustible, en comparación con el diésel fósil. AWS ya ha comenzado a hacer la transición al diésel renovable para alimentar generadores de respaldo en centros de datos existentes en Europa y América.

«Los centros de datos deben evolucionar para satisfacer las demandas transformadoras de la IA», dijo Ian Buck, Vicepresidente de Hyperscale y HPC en NVIDIA. «Al habilitar soluciones avanzadas de refrigeración líquida, la infraestructura de IA puede enfriarse de manera eficiente mientras se minimiza el uso de energía. Nuestro trabajo con AWS en su diseño de racks de refrigeración líquida permitirá a los clientes ejecutar cargas de trabajo de IA exigentes con un rendimiento y eficiencia excepcionales».

«A medida que Anthropic desarrolla nuestros modelos de base líderes, el acceso a una infraestructura segura, de alto rendimiento y eficiente en energía es crucial para nuestro éxito», dijo James Bradbury, Ingeniero Distinguido de Cómputo en Anthropic. «El compromiso de AWS para construir centro de datos de vanguardia es una de las razones clave por las que los hemos elegido nuestro proveedor principal de nube y socio de capacitación. Sus mejoras en el diseño representan un paso importante hacia la provisión de infraestructura segura, escalable y eficiente para alimentar modelos de IA e impulsar la innovación en este campo».

«Los avances continuos en la infraestructura de AWS nos permiten concentrarnos en innovar nuevos servicios que ayudan a nuestros clientes a tomar decisiones financieras más informadas, en lugar de en el pesado trabajo no diferenciado de gestionar centro de datos», dijo Alex Lintner, CEO de Tecnología, Soluciones de Software e Innovación en Experian. 

«Nuestros clientes dependen de nosotros para ofrecer innovación confiable y altamente segura de IA generativa en un entorno privado y confiable», concluyó Jeff Reihl, Director de tecnología de LexisNexis Legal & Professional.

Autor