Un acto de equilibrio: HDDs y SSDs en los centros de datos modernos
- Gestión del dato
Es cierto que el almacenamiento flash es cada vez más rápido y asequible, pero los discos duros (HDD) siguen desempeñando un papel fundamental en las empresas. Esto es especialmente evidente en los centros de datos actuales, donde la cantidad de datos creados continúa creciendo exponencialmente, impulsada aún más por el ciclo de datos de la IA.
Mientras que los consumidores tienden a usar solo unidades de estado sólido (SSD) y almacenamiento flash en sus portátiles, tabletas y teléfonos inteligentes, los discos duros son los dispositivos de almacenamiento masivo que hacen el trabajo de fondo. Ofrecen un menor coste por terabyte (TB) y son altamente eficientes para grandes volúmenes de datos. Según el informe “IDC Global StorageSphere 2024”, los HDD seguirán representando casi el 80% del almacenamiento utilizado en centros de datos en la nube y centros hiperescala aún más allá de 2028. En estos centros de hiperescala, los datos "calientes", a los que se accede con frecuencia o son críticos para el rendimiento, se almacenan en SSD de clase empresarial para una recuperación rápida. Por otro lado, los datos "tibios" o "fríos", a los que se accede con menos frecuencia, se almacenan en medios HDD de clase empresarial más rentables. Este enfoque por niveles optimiza el coste de almacenar y acceder a los datos y puede ajustarse según las necesidades de capacidad, rendimiento, disponibilidad y recuperación del sistema o aplicación.
La economía es un factor clave a escala. Aunque el coste del almacenamiento flash por terabyte ha mejorado significativamente, los SSD empresariales aún cuestan hasta ocho veces más por terabyte que los HDD empresariales, y seguirán siendo más de cinco veces más caros en los próximos cinco años, según la firma de analistas IDC en su informe ”IDC Global StorageSphere Forecast, 2024-2028” Los clientes más grandes de centros de datos suelen calcular el coste total de propiedad (TCO) por capacidad de terabyte por vatio. Una forma de optimizar la capacidad y la eficiencia energética en un centro de datos es aprovechar al máximo cada disco duro mediante tecnologías como OptiNAND™ y UltraSMR. Estas tecnologías, junto con arquitecturas de datos inteligentes, están ayudando a que los centros de datos sean más conscientes del clima al optimizar la demanda de energía. Los hiperescalares en la nube han estado migrando hacia la tecnología de grabación magnética escalonada (SMR). Actualmente, el SMR representa el 50 % de los exabytes de centros de datos enviados por Western Digital. Los casos de uso de los HDD incluyen respaldo, archivado y almacenamiento en frío, y seguirán desempeñando un papel vital en las infraestructuras empresariales en el futuro previsible.
Nuevas aplicaciones y casos de uso impulsados por los datos están generando un crecimiento explosivo de la información. La inteligencia artificial (IA) y el aprendizaje automático (Machine Learning, ML) son especialmente intensivos en datos, ya que dependen de conjuntos de datos masivos que necesitan recopilarse y preprocesarse antes ser enviados a los algoritmos. Estas iniciativas de big data recopilan y procesan datos de formas muy diversas, lo que requiere diversas soluciones de almacenamiento para satisfacer estas necesidades. Los modelos de IA operan en un ciclo continuo y autoperpetuante de consumo y generación de datos, procesando texto, imágenes, audio y video, mientras generan simultáneamente nuevos datos únicos. Western Digital ha detallado el “Ciclo de Datos de IA” en seis etapas diferentes. A medida que los modelos de IA evolucionan, crean aún más datos, los cuales tienen requisitos de almacenamiento específicos en cada etapa del proceso.
Los HDD juegan un papel clave, ya que se recopilan y almacenan vastas cantidades de datos sin procesar de diversas fuentes. Luego, los datos se procesan, limpian y transforman con SSD rápidos para apoyar el entrenamiento y la inferencia de IA. Los SSD empresariales de alta capacidad extraen datos de los lagos de datos rápidos. Los modelos entrenados analizan nuevos datos y generan contenido nuevo. Los modelos de lenguaje a gran escala (LLM), por ejemplo, absorben grandes volúmenes de datos y luego extraen lo importante para los modelos de procesamiento rápidos con GPU. Finalmente, se crea nuevo contenido a partir de los conocimientos producidos por los modelos de IA, lo que requiere HDD empresariales para almacenar los nuevos datos para futuros modelos.
Este ciclo continuo de generación y consumo de datos impulsa la necesidad de soluciones de almacenamiento escalables que puedan optimizar las implementaciones de IA. El almacenamiento es esencial para la economía de los datos. La combinación de HDDs y SSDs no solo impulsa lo que es posible, sino que también permite a las empresas lograr más y encontrar la solución adecuada para sus necesidades. Con el auge de la IA, ambas tecnologías serán aún más vitales para desbloquear oportunidades. Entender cómo usarlas mejor permitirá a las empresas tener más éxito en sus iniciativas impulsadas por datos. Con los datos creciendo a tasas sin precedentes, tanto los HDDs como los SSDs seguirán proporcionando la columna vertebral del almacenamiento para las empresas actuales.