Construyen un nuevo banco de pruebas para el supercomputador Frontier

  • Infraestructura

El Departamento de Energía de Estados Unidos se ha visto obligado a retrasar la puesta en marcha del supercomputador a exaescala Frontier, debido a problemas de interconexión. Para acelerar el proceso acaba de anunciar la construcción de la plataforma Crusher, que servirá como banco de pruebas para este superordenador, que pretenden tener totalmente operativo el año que viene.

Uno de los proyectos más importantes del campo de la supercomputación es la plataforma Frontier, un equipo construido por el Departamento de Energía de Estados Unidos, que pretende convertirse en el referente de la computación a exaescala. Su instalación se completó a finales de 2021 y desde entonces sus creadores han trabajado en su integración y prueba, pero se han detectado problemas en la interconexión que han obligado a retrasar su lanzamiento final.

Para acelerar el proceso el DOE acaba de anunciar la construcción del supercomputador Crusher, una plataforma HPC de 40 petaflops que servirá como banco de pruebas para Frontier. En su anuncio explican que se trata de una iteración de 1,5 gabinetes del equipo Cray EX Frontier, que cuenta con 74 gabinetes. Según han explicado los responsables del Laboratorio Nacional Oak Ridge de Estados Unidos, que alberga Frontier, esta máquina alcanzará los 2 exaflops de capacidad cuanto esté a pleno rendimiento. Esperan lanzarlo finalmente en la segunda mitad de 2022, pero creen que no alcanzará todo su potencial hasta el 1 de enero de 2023.

Este gran proyecto resultará en el mayor supercomputador de todos los Estados Unidos, superando a la plataforma HPC Aurora. Contará con 192 nodos HPE Cray EX, cada uno equipado con las CPU AMD Trento 7A43 Epyc, cuatro GPU AMD Instinct MI250X, 512 Gb de memoria DDR4 para la CPU, otros 512 Gb de memoria HMB2 para las GPU y conectividad SlingShot-11.

Sobre el nuevo superordenador concebido como banco de pruebas para esta potente máquina, Bronson Messer directora de ciencia de Oak Ridge Leadership Computing Facility (OLCF), perteneciente al ORNL, comenta que “Crusher es el último de una larga línea de sistemas de prueba y desarrollo que hemos implementado para los primeros usuarios de las plataformas OLCF y hasta ahora es el más potente de todos. Los resultados que estos equipos de programación están logrando en la máquina son muy alentadores, a medida que miramos hacia el comienzo de la era de la exaescala con Frontier”.

Para impulsar las pruebas y el aprovechamiento de la futura supercomputadora Frontier la OLCF ha organizado diversos hackatones, con el fin de que los usuarios se acostumbren inicialmente a Crusher y, posteriormente, a Frontier. Bálint Joó, líder del Grupo de Computación Avanzada para Nuclear, Partículas y Astrofísica de la OLCF, explica que “a medida que más personas utilicen este hardware, cuando tengamos más códigos y estilos de programación en el sistema, nos brinda oportunidades para descubrir y superar desafíos y nos prepara para ejecutar la ciencia en Frontier sin contratiempos”.