Chatbots de voz

La escritura marca el comienzo de nuestra historia. Aunque no tenemos claro cuándo sucede (si 3000 o 6000 años antes de Cristo, una diferencia de nada) sí sabemos que lo cambió todo.

Desde el momento en el que se inventó la escritura las personas nos hemos apoyado cada vez más en ella. Con la llegada de las máquinas y de Internet poder escribir, y sobre todo leer, pasó a ser una condición indispensable para acceder a la tecnología.

Con la digitalización del trabajo esto no hizo más que acentuarse. Muchas de las cosas que hacemos en nuestro día a día se apoyan en la escritura: emails, conversaciones, búsquedas, prensa, informes, calendarios… Si no pudiéramos escribir y leer seríamos incapaces de usarlas.

Se calcula que globalmente hay 775 millones de personas que no saben leer. El 66% son mujeres. Supone casi un 10% de la población mundial, más personas que en Europa.

La idea de que el analfabetismo es un mal del tercer mundo está erróneamente extendida. A pesar de que sí se trata de los países que tienen tasas de analfabetismo más alto, los países de los países con rentas per capita bajas no son los únicos en los que encontramos personas con capacidades lectoras insuficientes. Los datos de Estados Unidos de 2017 dan que pensar.

https://www.statisticbrain.com/

Gracias a una interesante combinación de avances tecnológicos en hardware, software y redes, la voz está posicionándose como la experiencia de uso del futuro. Y eso son buenas noticias: La forma natural de comunicarse del ser humano es el habla, y a través de ella será más fácil que nos comuniquemos con las máquinas.

El uso de interfaces de voz comenzó con aplicaciones simples de marcado por voz y dictado de mensaje. Hace unos años avanzó a un primer plano de la experiencia de uso con su inclusión en sistemas operativos móviles con Siri, el asistente virtual de voz del iPhone.

Hoy la voz se usa frecuentemente en las aplicaciones de mensajería: un tercio de los 1200 millones de usuarios de Messenger usa regularmente las funciones de llamada de voz y de video, y muchos más usan la grabación de mensajes para mantener conversaciones asíncronas con sus contactos.

Durante 2016 y 2017 han surgido más implementaciones de chatbots de voz: Alexa, Google Assistant, Bixby… y esto es sólo el principio.

A pesar de que la voz está, por ahora, sólo al alcance de unos cuantos, hay ya SDKs que te permiten experimentar con la creación de habilidades para estos asistentes: crear pequeñas aplicaciones que, por ejemplo, Alexa puede incorporar a sus funciones de fábrica.

Antes de que corras a crear tu propia app de voz o a cambiar la estrategia de tu empresa para 2018 quiero llamar tu atención sobre un hecho: es una nueva tecnología, así que tiene retos de implementación tanto técnicos como organizativos.

En el plano técnico destacaría las incógnitas sobre la adopción y fidelización de usuarios y las expectativas de los usuarios, infladas por el cine y la ciencia ficción, que necesitamos gestionar. Con las soluciones técnicas actuales nos enfrentamos a un gran número de interesantes problemas de diseño. Como con cualquier nueva tecnología hay retos y es necesaria mucha experimentación y mucho aprendizaje hasta cubrir las expectativas del mercado.

En el plano organizativo, al tratarse de una manera de interactuar con las máquinas completamente nueva, los equipos de diseño e implementación necesitarán no sólo nuevas herramientas para crear estas nuevas interfaces conversacionales, sino nuevos procesos, nuevos paradigmas y nuevas métricas. Estamos pasando de un mundo de tipografías, bordes y colores a uno de palabras, tonos y timbres. Se abre la puerta a la incorporación al mundo de la tecnología de expertos en lenguaje y acentos, profesionales del mundo del cine y el teatro, expertos en paisajismo auditivo, diseñadores de voces y sonidos… Si desarrollar chatbots de texto es complejo imagínate hacer uno de voz.

La llegada de estos nuevos profesionales va a suponer un cambio radical en los equipos. Unido a la nueva naturaleza de los productos y su ciclo productivo necesitaremos, como industria, nuevas maneras de trabajar. ¿Qué es lo siguiente a Agile? ¿Qué metodologías nos pueden ayudar en el nuevo mundo de las interfaces conversacionales? En estos equipos de mayor diversidad profesional, ¿veremos también más de otras diversidades? ¿Qué cambios culturales son necesarios hoy para sobrevivir como organización mañana?

Como persona aficionada a las letras me hago una última pregunta.

Los SMS cambiaron la manera en la que escribimos con abreviaturas como “bss”, “qtl?”, “cnt xfa!” o “tqm”. ¿Cambiarán las interfaces de voz la manera en la que hablamos?