Posibilidades y requisitos del Procesamiento de Lenguaje Natural

  • Software y Apps

Los sistemas de Procesamiento de Lenguaje Natural van a impulsar una nueva forma de comunicarse con las máquinas. Desde chatbots a asistentes digitales enfocados a los negocios, pasando por atención sanitaria personalizada, la tecnología PNL se está expandiendo con rapidez entre empresas de diferentes sectores. Pero apostar por estos sistemas cognitivos requiere un estudio profundo de sus requisitos y una importante inversión en tecnología.

La interacción entre hombre y máquina es un campo en pleno desarrollo, que pretende facilitar la comunicación entre la tecnología y las personas, y la clave se encuentra en la inteligencia artificial. Los equipos de investigación y desarrollo trabajan a fondo en diferentes líneas de acción, entre las que se encuentran los sistemas de Procesamiento de Lenguaje Natural (PNL), que proporcionan una forma de que las máquinas entiendan el habla, de forma que se pueda transmitir información y órdenes con solo hablar. Para lograr el buen funcionamiento del software PNL se combinan disciplinas como la codificación informática y la lingüística computacional y los sistemas de aprendizaje automático. El objetivo es crear sistemas capaces de identificar las palabras en diferentes idiomas, con distintas entonaciones y acentos, algo muy complejo y que requiere de un profundo entendimiento de la lengua por parte de las máquinas.

Desde hace años muchas empresas destacadas del sector tecnológico han invertido en el desarrollo de software PNL. Por ejemplo, Apple, que creó la aplicación Siri para sus teléfonos inteligentes. Por su parte, Google utiliza esta tecnología para su asistente personal que, junto con Alexa, de Amazon, son los dos sistemas que más atención están captando en los últimos meses, por la salida al mercado de nuevos dispositivos asociados a sus respectivos asistentes digitales. Microsoft también ha trabajado con su software Cortana, y otras empresas están desarrollando sus propios sistemas de reconocimiento de lenguaje natural.

Pero la utilidad de esta tecnología no se queda en el entorno de consumo, sino que cada vez más empresas están aplicando PNL al sector empresarial. Amazon ya ha lanzado una versión de Alexa para empresas, y cada vez se ven más utilidades para agilizar la administración, las tareas y las comunicaciones en las organizaciones y con los clientes finales. La capacidad actual de los sistemas PNL alcanza la comprensión de los mensajes dictados por voz, y se emplea en chatbots y otros sistemas de interacción, pero los investigadores están tratando de evolucionar sus capacidades a nuevos niveles.

Un futuro prometedor para los sistemas PNL

Los expertos esperan que en un futuro cercano el Reconocimiento de Lenguaje Natural evolucionará hasta ser capaz de captar los sentimientos que subyacen tras la voz de las personas, lo que permitiría captar las relaciones y patrones que se desarrollen entre grupos sociales completos o las variaciones en los mercados. Aún es pronto para que esta tecnología llegue a este punto de desarrollo, pero con lo que ya funciona actualmente, y con las mejoras que se producirán en esta tecnología en los próximos años, se generará un gran impacto en los sistemas TI de las organizaciones y proveedores de servicios en la nube.

Según informan los expertos, el auge de las soluciones basadas en PNL está teniendo un importante impacto en la infraestructura digital de las empresas en un buen número de industrias, ya que incrementa la necesidad de acceder a los datos, y al análisis a tiempo real de los mismos. Según un reciente informe de IDC, la cantidad de datos que estará sujeta a procesos de análisis aumentará hasta 5,2 Zetabytes en 2025, y que la cantidad de datos que serán procesados por sistemas cognitivos llegará hasta 1,4 Zetabytes en ese año. Con esta perspectiva, y el avance de las tecnologías basadas en PNL, se espera que las organizaciones interesadas inviertan muchos recursos en los próximos años para incrementar el rendimiento de sus infraestructuras de datos, a fin de que puedan trabajar de forma eficiente con las aplicaciones basadas en la inteligencia artificial, como el software PNL.

Impacto de PNL en los centros de datos y en la nube

A medida que los proveedores de servicios en la nube sostienen cada vez más volumen de las aplicaciones y datos de las empresas, adaptan su infraestructura para dar cabida a la creciente necesidad de usar tecnologías cognitivas. Muchos sectores, como el financiero, el de seguros, en sanitario o el de las telecomunicaciones, entre otros, recurren cada vez más a las tecnologías basadas en la inteligencia artificial, con el fin de aplicar más inteligencia a sus negocios y actividades.

Pero crear y mantener la infraestructura necesaria para mover aplicaciones tan exigentes supone un gasto importante, y el retorno de esas inversiones no está garantizado por ahora para organizaciones individuales. Pero los proveedores de servicios en la nube, de centros de datos y de colocación pueden aprovechar mejor estos gastos, aplicando estas tecnologías a los servicios que proporcionan a sus clientes. Proporcionando la capacidad de utilizar sistemas cognitivos pueden adaptar su oferta a las futuras necesidades de las empresas, lo que les permite prepararse para la demanda que se espera de cara a los próximos años.

Los expertos recomiendan centrarse en determinadas áreas a la hora de trabajar con soluciones inteligentes como PNL. Estas aplicaciones son de muy baja latencia, ya que necesitan beber de sistemas de análisis de datos en tiempo real, y requieren fuentes de datos de alto rendimiento. Cualquier retraso en las comunicaciones hace que el cliente esté insatisfecho, y solucionar esto es vital tanto para los proveedores de infraestructura y servicios en la nube como para las empresas que proporcionan servicios cognitivos a sus clientes.

Con un diseño de infraestructura típico no basta

Para que no se produzcan problemas de excesiva latencia que lastre la efectividad de los servicios de Reconocimiento de Lenguaje Natural, los expertos recomiendan reducir la distancia a la fuente de datos. De esta forma, no solo se reduce la latencia, sino que se evita en gran medida la posible pérdida de paquetes. Como ejemplo, un 2% de pérdida de paquetes en estas comunicaciones el rendimiento del protocolo TCP puede ser entre 6 y 25 veces menor que sin pérdida de paquetes. Y esto afecta enormemente a las tareas de lectura de datos y al software PNL.

Dada la gran carga de trabajo que exigen las soluciones de análisis en tiempo real y el Procesamiento de Lenguaje Natural, los expertos aconsejan que se consideren con seriedad los requisitos y los esquemas de infraestructura de datos y de red a la hora de desplegar soluciones pensadas para PNL. Es preciso tener en cuenta que no se trata de cargas de trabajo típicas, sino de alta prioridad. Por un lado, apuntan a la importancia de dedicar servidores con CPUs de alto rendimiento, gran capacidad de memoria RAM de alta velocidad, y plataformas de almacenamiento de nueva generación, como las basadas en unidades flash NVMe. Todo ello debe contar con canales de datos e infraestructura de red sin cuellos de botella, que permitan garantizar la máxima velocidad para aplicaciones tan exigentes como las soluciones PNL. En caso contrario, no se logrará el objetivo, los clientes no estarán satisfechos y el gasto en nueva infraestructura para mover estos sistemas se convertirá en un dinero mal invertido.

Los centros de datos EDGE ofrecen una buena solución

Dada la necesidad de acercar los datos al cliente para reducir la latencia, los centros de datos EDGE están postulándose como una de las mejores soluciones para desplegar sistemas PNL. Desde su concepción inicial, muchos de los CPD de este tipo están pensados para soportar grandes cargas de trabajo, entre ellas el análisis intensivo de datos y los sistemas cognitivos. Según afirman los analistas de IDC, para 2020 el gasto en infraestructura EDGE supondrá el 18% del gasto total en infraestructura IoT. En este cálculo se contemplan los despliegues de soluciones basadas en Internet of Things, pero el potencial que tienen estas soluciones para soportar las cargas de trabajo de sistemas cognitivos podría incrementar esta cifra.

En los próximos años, los proveedores de infraestructura, servicios y colocación planean desplegar este tipo de centros de datos para determinados clientes, y las empresas interesadas en proporcionar servicios basados en sistemas cognitivos podrán encontrar en ellas un importante apoyo. Los expertos insisten a los interesados en estas tecnologías en que no basta con tratar de vender estos servicios apoyándose en su infraestructura actual o en actualizaciones parciales de sus sistemas. Es preciso contar con un centro de datos con capacidad cognitiva, que tenga asignadas estas aplicaciones como su máxima prioridad.

Como recomendación a las empresas que apuesten por esta clase de infraestructura, indican que hay que estudiar la necesidad de tener niveles adicionales de redundancia, sistemas de refrigeración de alta capacidad y una estructura que permita distribuir los datos con la menor latencia posible. En cualquier caso, es importante evaluar con mucho cuidado si interesa más invertir internamente para soportar las aplicaciones PNL, o subcontratar la infraestructura necesaria. Y, si la inversión en recursos propios resulta excesiva, es fundamental escoger bien al proveedor que pueda proporcionar el equipamiento y el nivel de servicio necesarios, con un coste asumible.