La mejora genética de plantas se apoya en la computación de alto rendimiento

  • Infraestructura

Alimentar a toda la población mundial es un reto importante para los productores, y la industria de la agricultura está tratando de mejorar las especies vegetales para aumentar la producción. Esto se logrará gracias a la edición genómica, pero antes es preciso secuenciar los genes de las plantas, algo en lo que tienen un papel fundamental las nuevas plataformas de computación y análisis de Big Data.

La genómica de plantas es una ciencia que lleva décadas en desarrollo, ayudando a mejorar especies mediante diferentes técnicas de modificación del ADN de platas fundamentales para la agricultura, como es el trigo, el arroz o el maíz, entre otros muchos. Los científicos, entre ellos muchos españoles, han logrado crear variantes capaces de resistir plagas y condiciones climáticas adversas, o de producir más alimentos por metro cuadrado.

Pero, con el aumento constante de la población mundial, existe una presión importante para mejorar las plantas fundamentales para la alimentación en todo el mundo. Y esto requiere un gran trabajo de los investigadores, pero también una gran potencia de computación, capaz de capturar y analizar los datos del genoma de las plantas, para proporcionar información útil para apoyar tecnologías de edición genómica como CRISPR, que se están usando para mejorar las especies.

Teniendo en cuenta que el genoma humano, secuenciado en 2001, ocupa unos 90 Gigabytes de datos, el volumen de datos provenientes del ADN de las platas que hay que almacenar y procesar con rapidez es enorme. Esto está haciendo que las organizaciones implicadas en la mejora genética de las platas inviertan en plataformas de computación, almacenamiento y análisis de Big Data de nueva generación. Porque, a diferencia de con los humanos, para estudiar una planta y lograr una mejora genética, es preciso secuenciar el ADN de muchas semillas de la misma planta, que puede ser más extenso que el de las personas. Por ejemplo, la estructura genómica de una planta tan común como el trigo es siete veces más grande que la de un ser humano.

Y a esto se suman otros muchos factores implicados en el cultivo de plantas, como las cualidades del terreno, las condiciones climáticas y la disponibilidad de recursos clave como el agua o los abonos. Todo esto debe analizarse exhaustivamente para elaborar estudios realistas y fiables sobre la viabilidad de cultivos tradicionales y nuevas especies en diferentes partes del globo, lo que supone una capacidad de computación de primer nivel.

Para soportar estas enormes cargas de trabajo las empresas y entidades involucradas en la mejora genética de las plantas de uso alimentario recurren a proveedores de servicios de computación de alto rendimiento. Estos, a su vez, construyen sus plataformas de nueva generación gracias a proveedores especializados en infraestructura HPC. Este sector está viviendo un impulso importante en zonas como Europa, donde la Comisión Europea ha desarrollado planes para potenciar la computación de alto rendimiento en la región.

Al mismo tiempo que avanza el desarrollo de un ecosistema HPC más avanzado, la industria tecnológica está creando nuevas arquitecturas de procesamiento, memoria y almacenamiento dedicadas en especial a los entornos HPC, y en la próxima década se producirá una gran revolución, cuando salgan al mercado las primeras computadoras cuánticas comerciales, que elevarán exponencialmente la capacidad de cálculo empleada en la investigación de primera línea, como es la mejora genética de las plantas.