martes, 17 de noviembre de 2020

 

AMD anuncia el acelerador HPC más rápido del mundo para investigación científica¹


Los aceleradores AMD Instinct ™ MI100 revolucionan la informática de alto rendimiento (HPC) y la IA con un rendimiento informático líder en la industria

Primer acelerador de GPU con nueva arquitectura AMD CDNA diseñada para la era de la exaescala

SANTA CLARA, California
 

AMD (NASDAQ: AMD) anunció hoy el nuevo acelerador AMD Instinct ™ MI100, la GPU HPC más rápida del mundo y la primera GPU de servidor x86 en superar la barrera de rendimiento de los 10 teraflops (FP64). 1 Con el respaldo de las nuevas plataformas de computación acelerada de Dell, GIGABYTE, HPE y Supermicro, el MI100, combinado con las CPU AMD EPYC ™ y la plataforma de software abierto ROCm ™ 4.0, está diseñado para impulsar nuevos descubrimientos antes de la era de la exaescala.

Construida sobre la nueva arquitectura AMD CDNA, la GPU AMD Instinct MI100 habilita una nueva clase de sistemas acelerados para HPC e IA cuando se combina con procesadores AMD EPYC de 2.ª generación. El MI100 ofrece hasta 11,5 TFLOPS de rendimiento máximo de FP64 para HPC y hasta 46,1 TFLOPS de rendimiento máximo de matriz FP32 para cargas de trabajo de inteligencia artificial y aprendizaje automático 2 . Con la nueva tecnología AMD Matrix Core, el MI100 también ofrece un aumento de casi 7 veces en el rendimiento de punto flotante máximo teórico FP16 para cargas de trabajo de entrenamiento de IA en comparación con los aceleradores de generaciones anteriores de AMD. 3

“Hoy, AMD da un gran paso adelante en el viaje hacia la computación a exaescala al presentar AMD Instinct MI100, la GPU HPC más rápida del mundo”, dijo Brad McCredie, vicepresidente corporativo, GPU de centro de datos y procesamiento acelerado de AMD. “Dirigido directamente a las cargas de trabajo que importan en la informática científica, nuestro último acelerador, cuando se combina con la plataforma de software abierto AMD ROCm, está diseñado para proporcionar a los científicos e investigadores una base superior para su trabajo en HPC”.

Plataforma de software abierta para la era de exaescala

El software para desarrolladores AMD ROCm proporciona la base para la computación a exaescala. Como un conjunto de herramientas de código abierto que consta de compiladores, API de programación y bibliotecas, los desarrolladores de software a exaescala utilizan ROCm para crear aplicaciones de alto rendimiento. ROCm 4.0 se ha optimizado para ofrecer rendimiento a escala para sistemas basados ​​en MI100. ROCm 4.0 ha actualizado el compilador para que sea de código abierto y esté unificado para admitir tanto OpenMP® 5.0 como HIP. Los marcos de PyTorch y Tensorflow, que se han optimizado con ROCm 4.0, ahora pueden lograr un mayor rendimiento con MI100 7,8 . ROCm 4.0 es la oferta más reciente para desarrolladores de aplicaciones HPC, ML e AI que les permite crear software portátil de rendimiento.

“Recibimos acceso temprano al acelerador MI100 y los resultados preliminares son muy alentadores. Por lo general, hemos visto aumentos significativos en el rendimiento, hasta 2-3 veces más en comparación con otras GPU ”, dijo Bronson Messer, director de ciencia, Oak Ridge Leadership Computing Facility. “Lo que también es importante reconocer es el impacto que tiene el software en el rendimiento. El hecho de que la plataforma de software abierto ROCm y la herramienta de desarrollo HIP sean de código abierto y funcionen en una variedad de plataformas, es algo con lo que hemos estado absolutamente obsesionados desde que lanzamos el primer sistema híbrido de CPU / GPU ".

Las capacidades y características clave del acelerador AMD Instinct MI100 incluyen:

  • Arquitectura AMD CDNA totalmente nueva: diseñada para alimentar las GPU de AMD para la era de la exaescala y en el corazón del acelerador MI100, la arquitectura CDNA de AMD ofrece un rendimiento y una eficiencia energética excepcionales.
  • Rendimiento líder de FP64 y FP32 para cargas de trabajo HPC : ofrece un rendimiento máximo de FP64 de 11,5 TFLOPS líder en la industria y un rendimiento de FP32 máximo de 23,1 TFLOPS, lo que permite a científicos e investigadores de todo el mundo acelerar los descubrimientos en industrias que incluyen ciencias de la vida, energía, finanzas, académicos, gobierno, defensa y más. 1
  • Tecnología Matrix Core totalmente nueva para HPC e IA : rendimiento sobrealimentado para una gama completa de operaciones matriciales de precisión simples y mixtas, como FP32, FP16, bFloat16, Int8 e Int4, diseñadas para impulsar la convergencia de HPC e IA.
  • nd Gen AMD Infinity Tela ™ Technology - Instinct MI100 proporciona ~ 2x la (P2P) pico peer-to-peer I / O ancho de banda sobre PCIe® 4,0 con hasta 340 Gb / s de ancho de banda agregado por tarjeta con tres AMD Infinity Tela ™ Enlaces. 4 En un servidor, las GPU MI100 se pueden configurar con hasta dos colmenas de GPU cuádruples completamente conectadas, cada una de las cuales proporciona hasta 552 GB / s de ancho de banda de E / S P2P para compartir datos rápidamente. 4  
  • Memoria HBM2 ultrarrápida: cuenta con memoria HBM2 de alto ancho de banda de 32 GB a una frecuencia de reloj de 1,2 GHz y ofrece un ancho de banda de memoria ultra alto de 1,23 TB / s para admitir grandes conjuntos de datos y ayudar a eliminar los cuellos de botella al mover datos dentro y fuera de la memoria . 5
  • Compatibilidad con el PCIe® Gen 4.0 más reciente de la industria : diseñado con el soporte de tecnología PCIe Gen 4.0 más reciente que proporciona hasta 64 GB / s de ancho de banda de datos de transporte teórico máximo desde la CPU a la GPU. 6

Soluciones de servidor disponibles

Los aceleradores AMD Instinct MI100 se esperan para fin de año en sistemas de los principales socios OEM y ODM en los mercados empresariales, que incluyen:

Dell

“Los servidores Dell EMC PowerEdge admitirán el nuevo AMD Instinct MI100, que permitirá obtener información más rápida a partir de los datos. Esto ayudaría a nuestros clientes a lograr rápidamente resultados de HPC e IA más sólidos y eficientes ”, dijo Ravi Pendekanti, vicepresidente senior de servidores PowerEdge de Dell Technologies. "AMD ha sido un socio valioso en nuestro apoyo para promover la innovación en el centro de datos. Las capacidades de alto rendimiento de los aceleradores AMD Instinct son un ajuste natural para nuestra cartera de servidores PowerEdge AI y HPC".

GIGABYTE

“Nos complace volver a trabajar con AMD como socio estratégico que ofrece a los clientes hardware de servidor para la informática de alto rendimiento”, dijo Alan Chen, vicepresidente asistente en NCBU, GIGABYTE. “Los aceleradores AMD Instinct MI100 representan el siguiente nivel de computación de alto rendimiento en el centro de datos, brindando mayor conectividad y ancho de banda de datos para investigación energética, dinámica molecular y capacitación en aprendizaje profundo. Como nuevo acelerador en la cartera de GIGABYTE, nuestros clientes pueden buscar beneficiarse de un rendimiento mejorado en una variedad de cargas de trabajo de HPC científicas e industriales ”.

Hewlett Packard Enterprise (HPE)

“Los clientes utilizan los sistemas HPE Apollo para obtener capacidades y rendimiento especialmente diseñados para abordar una gama de cargas de trabajo complejas con uso intensivo de datos en computación de alto rendimiento (HPC), aprendizaje profundo y análisis”, dijo Bill Mannel, vicepresidente y gerente general de HPC. en HPE. “Con la introducción del nuevo sistema HPE Apollo 6500 Gen10 Plus, estamos avanzando aún más en nuestra cartera para mejorar el rendimiento de la carga de trabajo al admitir el nuevo acelerador AMD Instinct MI100, que permite una mayor conectividad y procesamiento de datos, junto con el procesador AMD EPYC ™ de 2.ª generación . Esperamos continuar nuestra colaboración con AMD para expandir nuestras ofertas con sus últimas CPU y aceleradores ".

Supermicro

“Estamos entusiasmados de que AMD esté logrando un gran impacto en la informática de alto rendimiento con los aceleradores de GPU AMD Instinct MI100”, dijo Vik Malyala, vicepresidente senior de ingeniería de aplicaciones de campo y desarrollo comercial de Supermicro. “La combinación de la potencia de cómputo obtenida con la nueva arquitectura CDNA, junto con la alta memoria y el ancho de banda de GPU peer-to-peer que brinda el MI100, nuestros clientes obtendrán acceso a excelentes soluciones que cumplirán con sus requisitos de cómputo acelerado y cargas de trabajo empresariales críticas . El AMD Instinct MI100 será una gran adición para nuestros servidores multi-GPU y nuestra amplia cartera de sistemas de alto rendimiento y soluciones de bloques de construcción de servidores ".

Especificaciones del MI100

Calcular unidades

Procesadores de flujo

FP64 TFLOPS (pico)

FP32 TFLOPS (pico)

FP32 Matrix TFLOPS
(pico)

FP16 / FP16 Matrix
TFLOPS
(pico)

INT4 | INT8 TOPS
(pico)

bFloat16 TFLOPs
(pico)

Memoria
ECC HBM2

ancho de banda de memoria

120

7680

Hasta 11,5

Hasta 23,1

Hasta 46,1

Hasta 184,6

Hasta 184,6

Hasta 92,3 TFLOPS

32 GB

Hasta 1,23 TB / s


No hay comentarios: