fbpx

Blog

Blog

Reconocimiento de voz, speech analytics y otros cuentos

img-post

La primera vez que escuché sobre tecnologías vocales, fue hace muchos años, muchos, cuando un compañero de trabajo estaba todo el día repitiéndole a una diadema “Pozuelo”, “Alcorcón” y me mató la curiosidad. Fui y le dije, “¿se puede saber qué estás haciendo?”. Y me dijo, estoy entrenando al software de reconocimiento de voz.

A partir de allí, se abrió un nuevo mundo para mí. Hasta el momento conocía bastante sobre tecnologías de contact center, pero la posibilidad de incorporar además tecnologías vocales abría un mundo de posibilidades infinitas con respecto a la interacción con los clientes.

Empecemos por lo primero:

¿Qué son las Tecnologías de Voz?

La sabiduría de Wikipedia dice que las “Speech Technologies” son tecnologías diseñadas para duplicar y responder la voz humana. Es decir, son tecnologías que permiten reproducir palabras con sonido asombrosamente igual a la voz humana y además reconocer lo que un humano dice.

En esta entrada quiero resaltar tres, que son las que principalmente se utilizan a nivel de contact center:

Automatic Speech Recognition (ASR), reconocimiento automático de voz.

Esta tecnología lo que permite es convertir palabras “habladas” a texto.

¿Para qué puede servir esto?

Para que por ejemplo quien llame a tu contact center pueda hablarle al IVR y que sea el software quien digitalice y luego interprete lo dicho.

Bajado a tierra de una forma básica y con algunas omisiones para simplificar la explicación, si en vez de que el IVR diga “Para comunicarse con soporte digite 1, para atención al cliente digite 2, con una operadora digite 3”, el IVR dice “Con qué área se quiere comunicar?”, y entonces el usuario, en vez de digitar “1”, vocaliza la palabra “Soporte”, la interacción es mucho más breve pero además mucho más “humana”, intuitiva e inclusiva.

¿A quién no le ha pasado que después de escuchar un largo menú de opciones no se acordaba qué número era el que tenía que digitar? Con esta tecnología es posible un “diálogo” menos robotizado y más sencillo. 

Text to Speech (TTS), texto a voz.

Lo que hace el “Text to Speech” es convertir un texto escrito en voz artificial (las buenas tecnologías tienen voces sintéticas increíblemente similares a la voz humana!).

Las aplicaciones de este tipo de tecnología en el mundo de los contact center son numerosas, una de las más importantes es la posibilidad de “leer” información de la base de datos y reproducírsela a tus clientes.

Un ejemplo podría ser una campaña de actualización de datos: “Queremos verificar que tu dirección continúe siendo Reforma 222”.

Sin esta tecnología, las opciones para hacer esto mismo serían mediante un operador (humano) o teniendo un mensaje pre-grabado de los millones de registros que tiene tu base (inviable, por supuesto). 

Las ventajas quedan claras. Reduce costos significativamente, optimiza procesos, facilita la interacción con los clientes y viabiliza la implementación de muchas de las campañas de tu centro de contactos.

Voice Biometrics,  biometrías de voz

Por último, y la que más me fascina, es la biometría de voz.

La voz es una característica única de la persona, así como la huella digital. Aunque siempre que atiendas el teléfono te confundan con tu madre/padre, hermana/hermano, lo cierto es que tu voz es exclusiva, siendo ésta una de las herramientas más seguras para verificar tu identidad.

La aplicabilidad de esta tecnología en el centro de contactos también es variada, pero claramente uno de los usos más frecuentes es con respecto a la utilización de la voz como contraseña para establecer o verificar la identidad de la persona que se comunica.

Llamas a tu banco y quieres hacer una transacción. En vez de que el IVR o un operador te soliciten el ingreso de PIN y te hagan responder 15 preguntas de seguridad, con esta tecnología simplemente tu voz será tú contraseña. Da miedo, ¿no?. 

Ya se volverá tan natural que dejará todos los miedos de lado. Hace unos años atrás, abrir una puerta con un lector de huellas digitales parecía de película policial futurista, hoy en día el ingreso a mi gimnasio lo realizo mediante la autenticación de mi huella. Una experiencia simple, libre y segura. Como lo es la biometría de voz para los centros de contacto.

Y Speech Analytics?

La mayoría de las veces Speech Analytics cae dentro la bolsa de tecnologías vocales, pero lo cierto es que Speech Analytics en una categoría en sí misma, una combinación de tecnologías más que interesante, que se potencia día a día con los avances en inteligencia artificial.

Speech Analytics combina reconocimiento de voz, texto to speech y reconocimiento cualitativo de las conversaciones, el cual permite identificar, mediante patrones sonoros, edades, idiomas, estados emocionales, etc., y obtener de esta forma valiosos insights del cliente y del negocio.

El tema no es nuevo, como mencionaba al principio de esta publicación, hace muchos años que se viene invirtiendo en la investigación y evolución de estas soluciones, pero no cabe dudas que estamos frente a una nueva generación de tecnologías vocales y aplicaciones de speech analytics, potenciadas con Inteligencia Artificial.

Esto ha provocado una mejora sustancial en los casos de aplicación y se refleja, lógicamente, en un aumento muy significativo en la inversión y la adopción por parte de las empresas en este tipo de tecnología.

Ya para finalizar este post, no quiero dejar de mencionar que más allá de la tecnología, que claramente es importante y que forma parte fundamental de la transformación en las empresas, la estrategia de negocio detrás de esa tecnología es la que, a la larga, va a marcar la diferencia.

Espero que este artículo haya sido de utilidad para aclarar algunos asuntos con respecto a las tecnologías vocales y lo que éstas pueden hacer por la rentabilidad de tu operación y la satisfacción de tus clientes.