Inteligencia artificial capaz de reconocer datos más allá de su entrenamiento

  • Inteligencia Artificial

inteligencia artificial IA

El centro de Cerebros, Mentes y Máquinas del MIT y la compañía Fujitsu han desarrollado una nueva tecnología de IA capaz de identificar y trabajar con los datos no vistos (OOD). Esto permite a la inteligencia artificial reconocer los datos que no corresponden con su entrenamiento original, e forma similar a como lo hace el cerebro humano, lo que permitirá desarrollar modelos más inteligentes y versátiles.

Recomendados: 

Empresas data driven: estrategias de datos para marcar la diferencia Evento 

Entendiendo la Era del dato: tecnologías y propuestas para gestionar la "datificación" Webinar 

La realidad de la inteligencia artificial actual difiere mucho de la idea original de un símil del cerebro humano, ya que los modelos de IA se ciñen excesivamente al entrenamiento que han recibido, y no son capaces de ofrecer resultados tan precisos cuando se enfrentan a datos que no están incluidos en su entrenamiento original. Estos datos, que los científicos denominan datos no vistos (OOD, o fuera de distribución), están presentes en cualquier entorno en el que se genera información digital que después se quiere procesar mediante una IA, y al no poder identificarlos correctamente afectan a los resultados.

Las redes neuronales profundas (DNN) y el aprendizaje automático están ayudando a que la inteligencia artificial pueda abordar problemas más complejos del mundo real, proporcionando soluciones muy avanzadas. Por ejemplo, la detección inteligente de defectos en la industria manufacturera o el diagnóstico por imagen automatizado en la atención sanitaria, tareas que la IA es capaz de realizar con más precisión y rapidez que los humanos. Pero su fiabilidad depende de cómo se han entrenado los modelos, y si las condiciones cambian, en estos casos las de iluminación o perspectiva de las imágenes de origen, los datos obtenidos difieren mucho de los usados en su entrenamiento (OOD), y la fiabilidad baja.

Para resolver esto los expertos de la empresa Fujitsu y del Centro de Cerebros, Mentes y Máquinas (CBMM) del MIT han profundizado en los modelos de inteligencia artificial para dotar a la IA de capacidad para identificar y aprovechar los datos OOD, lo que permitirá aumentar la precisión de los modelos de IA. Para ello han dividido la red neuronal profunda en módulos, adoptando un enfoque único que se basa en las características cognitivas y la estructura del cerebro humano. Siguiendo el ejemplo anterior, en el caso de la IA enfocada al análisis de imágenes, estos módulos se enfocarían a características como el color o la forma de forma independiente.

Según explica el Dr. Seishi Okamoto, Fellow de Fujitsu Limited, su empresa lleva desde 2019 colaborando con el CBMM del MIT para profundizar en la comprensión de cómo el cerebro humano sintetiza la información para generar un comportamiento inteligente. Su objetivo es desarrollar una IA basada en este conocimiento para ayudar a resolver problemas del mundo real en diferentes industrias y en la sociedad en general. Afirma que “este logro marca un hito importante para el desarrollo futuro de la tecnología de IA que podría ofrecer una nueva herramienta para entrenar modelos que puedan responder con flexibilidad a diferentes situaciones y reconocer incluso datos desconocidos que difieran considerablemente de los de entrenamiento originales con gran precisión”.

Por su parte, el Dr. Tomaso Poggio, catedrático Eugene McDermott del Departamento de Ciencias Cerebrales y Cognitivas del MIT y director del Centro de Cerebros, Mentes y Máquinas, explica que “existe una brecha significativa entre las DNN y los humanos cuando se evalúan en condiciones fuera de distribución, lo que compromete seriamente las aplicaciones de la IA, especialmente en términos de su seguridad y equidad”. Dice que la investigación que han realizado puede ser la base para el desarrollo de nuevas tecnologías capaces de superar el sesgo en el tratamiento de grandes conjuntos de datos, y considera que con este trabajo han dado un gran paso para lograrlo. Como ejemplo del uso que puede tener su tecnología mencionan la vigilancia del tráfico o el diagnóstico por imagen en la industria médica, donde los matices que se captan más allá de los datos originales de entrenamiento de la IA son clave para identificar problemas.

En el contexto de la imagen el cerebro humano es capaz de detectar y clasificar anomalías potenciales en base a datos desconocidos, identificando lo que captan los sentidos, aunque haya diferencias en las formas o los colores. Y esta nueva tecnología calcula un índice único basado en la forma en que un objeto es percibido por las neuronas, y en cómo la DNN clasifica las imágenes que le llegan. Este modelo incrementa el índice para mejorar el reconocimiento de los objetos de ejemplo OOD, logrando más eficacia que los modelos de IA actuales.

Hasta ahora, para desarrollar los modelos de IA con más precisión se entrenaba la red neuronal profunda empleando un único módulo, pero en este modelo se divide la DNN en módulos separados en función de las formas, los colores y otras propiedades de la imagen, basándose en un índice más desarrollado, lo que ha permitido aumentar considerablemente la precisión en el reconocimiento de imágenes. Sus creadores han anunciado que seguirán trabajando en esta tecnología para lograr que su IA sea capaz de emitir juicios flexibles similares a los de los seres humanos, con la idea de aplicarla a campos como la fabricación inteligente y la atención sanitaria, aunque probablemente encontrarán otros muchos usos potenciales.