Nunca antes en la historia una tecnología había tenido tal capacidad de penetración y tal velocidad de adopción por parte de los usuarios como la tecnología de voz. La voz ha vuelto mainstream el Deep Learning, es decir, la suma de tecnologías (como Procesamiento del Lenguaje Natural, Reconocimiento Automático del Habla, Text To Speech…), la Inteligencia Artificial y el Machine Learning, lo que ha propiciado que los asistentes virtuales, los asistentes personales y los interfaces conversacionales sean una realidad imparable.
Por primera vez, las empresas tienen la oportunidad de pensar de forma estratégica cómo quieren construir relaciones en este nuevo entorno de voz y audio. Hace un tiempo, en los inicios de la Era Mobile, las compañías y los diferentes proveedores de las mismas creaban aplicaciones tácticas para todo, sin pensar de forma estratégica en la globalidad, es decir, en el porqué y el para qué. Hoy, en la Era de la Voz, tenemos la oportunidad de dibujar el escenario ideal, de re-pensar un nuevo marco de relación, de crear una relación directa, relevante, significante y duradera con la comunidad (empleados, clientes, consumidores, proveedores, partners…) a través de la tecnología, pero, sobre todo, a través de la voz, a través de las conversaciones y a través de las emociones. La Tecnología de Voz nos permite desarrollar un marco relacional entre marcas y personas a través de la voz.
Asistentes virtuales, asistentes personales, interfaces conversacionales… y el cambio de comportamiento de los usuarios
Muchas compañías han visto la necesidad de “hacer cosas en voz” pero solamente parándose a pensar en “qué hacer”, pero no para qué, por qué y cómo hacerlo. Ello también debido a la falta de compañeros que asesoren profundamente en este viaje y que apuesten por la estrategia frente a la táctica. Quizá, lo que no hayan investigado en profundidad es el cambio de comportamiento que se está produciendo en las personas a la hora de relacionarse con la tecnología, con los contenidos y con las experiencias a través de la voz y el audio. Cuando la tecnología provoca un cambio de comportamiento, no podemos ir contra él, sino que debemos liderarlo e ir de la mano de los usuarios. Sirva como ejemplo la industria musical; cuando nació Napster en 1998 las grandes compañías discográficas empezaron a perseguir a sus clientes llamándoles “piratas”, mientras que una compañía tecnológica como Apple, lideró el cambio de comportamiento de los usuarios y lanzó, en 2001, iTunes, un servicio que revolucionó la forma en la que la música se consumía y que anticipó el declive del consumo de copias físicas. Ahí, fue la primera vez en la que la música dejó de ser un producto para convertirse en un servicio.
A este cambio de comportamiento se une la gran apuesta que están llevando a cabo compañías como Amazon (con su asistente virtual Alexa y sus asistentes personales Echo y compañía), Google (con su Google Assistant y su uso en Google Home, dispositivos Android), Samsung (con Bixby), Microsoft, Facebook, Apple… Un nuevo interfaz, la voz, se abre camino no sólo en nuestras casas, sino también en nuestros móviles y, muy pronto, en nuestros coches, en nuestras neveras…, hasta llegar a los 7.500 millones de dispositivos con asistentes virtuales en 2021, tal como predice la consultora OVUM.
La revolución de la voz está impulsando a las empresas a evolucionar sus ecosistemas digitales para tratar de aportar valor a los consumidores que ya buscan de forma natural emplear la voz en sus interacciones digitales. Así, la voz está experimentando una amplia gama de aplicaciones en diferentes industrias, lo que demuestra que no es solo una tecnología novedosa para un caso de uso vertical o limitado, sino una tecnología ubicua, que impacta de lleno en los cimientos de la relación entre marcas, empresas y personas. La suerte está echada, el tablero en la mesa y la partida acaba de comenzar…, las organizaciones que quieran mantenerse relevantes deberán adoptar la tecnología de voz como parte de su presencia, de su estrategia digital y de la relación de omnicanalidad con sus diferentes públicos, tanto internos como externos a la organización.
Según Canalys (abril 2019), las bases de smart speakers instaladas en todo el mundo superarán los 200 millones de unidades a finales de 2019, un aumento interanual del 82,4% respecto a 2018. Una de las conclusiones más interesantes del estudio es que en sólo un par de años los altavoces inteligentes podrían convertirse en un dispositivo más popular que las tablets. Según la consultora, la instalación de bases para altavoces inteligentes podría situarse en torno a los 400 millones para 2021, lo que la situaría ligeramente por encima de las estimaciones proyectadas para las tablets a nivel mundial. El término ‘base de instalación’ contabiliza únicamente el número de altavoces inteligentes que están siendo utilizados por los consumidores, no el número total de unidades vendidas. Estos datos son la muestra clara de que la tecnología de voz representa un cambio de comportamiento muy importante en los hábitos tecnológicos de los usuarios.
Según eMarketer, la tecnología de voz ha pasado de la fase de adopción inicial a ser la tendencia dominante. Según un estudio de eMarketer, se estima que 111,8 millones de personas en Estados Unidos utilizarán un asistente de voz al menos una vez al mes este año, lo que supone un aumento del 9,5% respecto a los 102 millones de 2018. Esta cifra equivale al 39,4% de los usuarios de internet de Estados Unidos y al 33,8% de la población general del país. Para 2021, el número de usuarios de asistentes de voz en EE. UU. llegará a los 122,7 millones, lo que representa el 42,2% de los estadounidenses usuarios de internet y el 36,6% de la población total.
¿Cómo planificar una estrategia sólida en tecnología de voz y audio?
En este contexto, la clave está en identificar y priorizar posibles soluciones, entender el contexto e implementar productos y servicios que aporten valor a la organización en su conjunto, tanto a nivel interno (en forma de mejora de procesos, ahorro de costes u optimización de los recursos), como a nivel externo (un nuevo marco de relación entre marcas y consumidores, procesos de innovación, etc.)
Es entorno al año 2015 y 2016 cuando la tecnología de voz experimenta un crecimiento exponencial debido a la confluencia de las tecnologías que hablábamos anteriormente: PLN, TTS, ML, AI, Cloud Computing… Por tanto, es tan novedoso, que no existen expertos en su conjunto, así que lo que hicimos desde VOIKERS fue sumar un equipo multidisciplinar que provenía de diferentes ámbitos como: la inteligencia artificial, la investigación de la interacción humano-máquina, la consultoría, el marketing, los call centers, la investigación, la neurociencia, el mundo del audio, la universidad… Ello nos ha permitido convertirnos en un proyecto pionero en consultoría estratégica para compañías. Así, hemos creado una serie de metodologías propias, procesos y herramientas que nos permiten trabajar en ecosistema con nuestro equipo, diferentes proveedores y partners y la compañía en su totalidad.
Desde VOIKERS hemos desarrollado metodologías propias para que las compañías puedan desarrollar una estrategia de tecnología de voz y audio en diferentes horizontes temporales, marcados, no sólo por la estrategia de la compañía, sus KPI’s de negocio o de engagement y sus diferentes áreas, sino por realidades que no debemos dejar a un lado por su radical importancia, como son: el estado de la tecnología, el estado del español en la tecnología de voz, las grandes plataformas, el ecosistema de startups, las implicaciones legales o los niveles de adopción de la tecnología por parte de los usuarios, entre otras. Así, entendemos que para llevar a cabo una sólida estrategia debemos aplicar diferentes metodologías y marcos contextuales: la tecnología, la empresa y sus áreas y la comunidad (empleados, proveedores, partners, consumidores, etc.)
Detrás de este proceso hay muchas horas de trabajo y consultoría que hacen que nuestras metodologías y marcos aplicados a las particularidades y necesidades de cada empresa supongan una gran innovación, ya que permiten a las compañías, por primera vez, no pensar de forma aislada qué hacer, sino tener una visión global sobre cómo, por qué, para quién y para qué llevar a cabo proyectos de tecnología de voz y contenidos de audio. Es decir, no pensar únicamente si hacen o no una “skill” para Alexa o si transforman su web a búsquedas por voz, sino plantearse el por qué y para qué implementar diferentes productos y servicios de tecnología de voz en un marco contextual y temporal que persigue desarrollar un nuevo modelo relacional entre marcas y personas a través de la voz. El objetivo, permitir a las compañías liderar la revolución de la voz y apostar por la estrategia frente a las acciones tácticas, que tiene sentido cuando los cimientos son sólidos, no antes. Por ello, entendemos que:
- Una estrategia de voz comienza en el conocimiento profundo de nuestra razón de ser como empresa.
- Una estrategia de voz se basa en el conocimiento profundo de la comunidad.
- Una estrategia de voz se fundamenta en la profunda investigación y conocimiento de las diferentes tecnologías implicados, de la investigación puntera y de los productos y servicios de compañías en voz, inteligencia artificial, PLN, ASR…
- Una estrategia de voz apuesta por la transformación para adaptarse al cambio de comportamiento de los usuarios (nuevos entornos de relación, apuesta por la conversación, transformación a contenidos de audio, apuesta por las búsquedas de voz, del SEO al AEO, del UX al Conversational UX…)
- Una estrategia de voz permite la identificación, priorización e implementación de tecnologías (no sólo aplicaciones para Smart Speakers) que posibiliten hacer eficientes los procesos, optimizar recursos, ahorrar costes, generar experiencias…
- Una estrategia de voz es la materialización de la apuesta de las empresas por la creación y el mantenimiento de una relación directa, relevante, significante y duradera con su comunidad.
Las marcas necesitan re-pensarse, entender qué tipo de relación quieren establecer con sus consumidores, con sus partners, con sus empleados y con la sociedad, como quieren ser vistos, como seguir siendo importantes, como ofrecer valor real para generar confianza y vinculación duradera. La Era de la Voz es la gran oportunidad para ello y el futuro será de quiénes lo construyan, no de quienes lo vean pasar mientras piensan qué hacer hasta que desde el futuro miren al pasado pensando en aquello que pudieron haber hecho y nunca hicieron.
Leer también: