4 Tecnologías de voz que tendrán un efecto disruptivo

  • Negocios

La forma de comunicarnos con las máquinas y los sistemas digitales está evolucionando gracias a nuevas interfaces que emplean el reconocimiento de voz. Este avance está progresando de la mano de otras innovaciones como la inteligencia artificial, y los expertos prevén que en los próximos años varias tecnologías de voz tendrán un impacto importante en la forma en que nos comunicaremos en el futuro.

Uno de los avances que ha traído el rápido progreso tecnológico que hemos experimentado en la última década es la forma de comunicarnos con las máquinas. Se ha pasado del tradicional teclado y ratón a las pantallas táctiles como principal forma de interacción con la tecnología en el día a día, pero de cara al futuro las interfaces de voz podrían acabar sustituyendo a muchas de las actuales formas de dar instrucciones a las máquinas.

La aplicación más popular de esta tecnología es la de los asistentes digitales, que se popularizó a través de plataformas móviles, pero que ya está dando el salto a otros ámbitos. Ahora, el reconocimieto de vos ya se usa en los contact center, en diferentes dispositivos IoT de ámbito doméstico y, por supuesto, en los teléfonos móviles. Esto está contribuyendo al desarrollo de la tecnología que hay detrás del reconocimiento de voz, un mercado que según un reciente estudio publicado por Research & Markets va a crecer a una tasa anual del 17,2% entre 2019 y 2025, cuando podría alcanzar un valor de 26.790 millones de euros.

Los expertos afirman que la evolución de esta nueva generación de interfaces se apoyará en el desarrollo de diferentes tecnologías vinculadas al reconocimiento de voz. En este sentido, la empresa masvoz ha elaborado un estudio en el que destacan cuatro tecnologías que, en su opinión, supondrán una revolución en la forma en que nos comunicamos con la tecnología y los servicios digitales.

Reconocimiento automático del habla (ASR)

Esta tecnología es la que se emplea para comprender y transcribir los mensajes de personas que entran en contacto con un servicio de atención telefónica, por ejemplo cuando se dan datos como números de teléfono o de identificación personal. Su uso es muy común en servicios de atención automatizados para facilitar la interacción a las personas y evitar que tengan que usar el teclado del teléfono.

En sus primeras etapas, allá por los años ‘60, esta tecnología solo era capaz de comprender números y letras, y presentaba muchas limitaciones. Pero actualmente esta tecnología ha avanzado mucho, y ya es capaz de comprender frases complejas, empleando la tecnología de procesamiento del lenguaje natural (PNL), que está íntimamente ligada a la IA.

Análisis del habla

Esta tecnología permite el análisis de voz a tiempo real en llamadas, y se usa comúnmente en el ámbito de la atención al cliente y el comercio minorista, con el fin de detectar características más subjetivas como las emociones, el tono o el nivel de estrés que hay detrás del lenguaje empleado. Así, mediante el análisis es posible identificar si un usuario está enfadado o frustrado, pudiendo aplicar estrategias específicas a la respuesta. Esta tecnología va a seguir evolucionando gracias a la apuesta de sus desarrolladores, que ven un enorme potencial para sus clientes en campos como la experiencia del cliente.

Voice Engine Optimization (VEO)

Esta tecnología forma parte de los actuales altavoces inteligentes domésticos, que están proliferando con rapidez en el mercado de electrónica de consumo. Y en los próximos años se prevé que más de la mitad de los hogares tendrán al menos uno de estos dispositivos, cuya evolución es imparable. El desarrollo de este tipo de dispositivos IoT va a continuar con rapidez, y se espera que además del ámbito del gran consumo, logren saltar a mercados profesionales, gracias a los nuevos asistentes virtuales para uso empresarial, donde las tecnologías VEO tendrá un papel clave.

Su objetivo es mejorar la capacidad de interacción entre personas y tecnología mediante preguntas y respuestas, creando palabras clave extraídas de la conversación, que permiten elaborar respuestas bien enfocadas. Los expertos opinan que esto tendrá un papel muy importante en la elaboración de estrategias de martketing en el futuro.

Biometría de voz

La seguridad está dando grandes pasos hacia el futuro, integrando diferentes tecnologías de reconocimiento biométrico que permiten identificar sin asomo de duda a las personas. Las más utilizadas son el reconocimiento facial y de huellas dactilares, pero también se está desarrollando el reconocimiento de la huella boca, que se considera como una característica personal igualmente única, que podría usarse para la identificación. Pero la voz parece poco fiable, dada la tecnología de edición de audio actual, pero la clave de la biometría de voz es que emplea tanto el sonido como los rasgos físicos de la boca con la que se pronuncian las palabras, lo que aporta un nivel adicional de fiabilidad.

Los expertos afirman que esta tecnología encontrará aplicaciones en numerosos ámbitos, desde autorización de operaciones bancarias a la votación en las elecciones, pasando por usos tan comunes como solicitar contraseñas olvidadas o identificarse en servicios de atención al cliente telemáticos. Por ahora parece algo pronto para ver funcionando esta tecnología en usos que impliquen riesgos de ser suplantado en transacciones económicas o gestiones gubernamentales, pero se espera que los avances en biometría permitan alcanzar el nivel de seguridad necesario en el futuro.

En palabras de Alfred Nesweda, CEO de masvoz, “Gracias a estas nuevas tecnologías, las posibilidades de realizar acciones con la voz se amplían de manera exponencial y cada vez son más las empresas que apuestan por ellas. La capacidad de análisis de los datos que proporcionan permite dar un valor diferencial y personalizar la relación con el usuario, ofreciendo así un servicio más eficiente”.