8 tendances de contenu vocal pour 2020
Publié: 2019-08-01La voix est la nouvelle interface qui nous entourera bientôt dans de nombreux endroits et de bien des façons. Le contenu vocal pour les appareils Amazon Echo, Google Home et Samsung est développé par des marques grandes et petites.
Chez Convince & Convert, nous élaborons des stratégies de contenu activées par la voix pour nos clients, en les aidant à tirer parti de cette opportunité d'interaction client en pleine croissance (pour en savoir plus sur ce que nous faisons dans le domaine du contenu vocal, consultez Why The Time is Now for Voice- Contenu activé).
J'ai récemment assisté au Voice Summit 2019, qui serait le plus grand rassemblement jamais organisé par l'industrie de stratèges, de développeurs, de technologues, de fournisseurs et de plates-formes matérielles de contenu vocal.
Voici les 8 principales tendances de contenu vocal que j'ai synthétisées lors de mon passage à l'événement et via notre travail avec les clients sur les applications vocales.
Le meilleur contenu vocal commence par les besoins des utilisateurs
Semblable aux débuts des applications mobiles, et même des sites Web, les stratèges et les développeurs ont tendance à penser : "créons une application vocale !" Au lieu de cela, la meilleure approche consiste à examiner attentivement et à rechercher comment les consommateurs interagissent avec la marque, ce qu'ils ont réellement besoin de savoir de cette marque et si/si le contenu vocal est un moyen approprié de diffuser. Après tout, aucune loi ne dit que vous DEVEZ avoir un contenu activé par la voix. Est-ce vraiment une Youtility ? Si oui, construisez-le. Si non, ne le faites pas !
Par exemple, la compétence Alexa "Ask Purina" de Purina est née du besoin des consommateurs de comprendre le comportement des différentes races de chiens et quelle race pourrait être la plus appropriée en tant que nouvel animal de compagnie. Selon des représentants de Mobiquity, l'entreprise qui a développé la compétence, ils ont envisagé d'inclure des promotions audio pour les achats d'aliments pour chiens, mais ont rejeté cette notion après avoir réalisé que cela encombrerait l'actif informationnel.
Convergence de la voix et du chat
Les applications vocales les plus efficaces aujourd'hui sont généralement les actualités, les questions-réponses de recherche d'informations ou les jeux. Sur le front des « questions-réponses sur la marque », comme dans l'exemple Purina mentionné ci-dessus, le flux d'interaction de ces applications est très similaire à la façon dont les consommateurs utilisent les chatbots.

En fait, la compétence Alexa d'informations sur la race de chien Ask Purina fonctionnerait très bien comme chatbot sur un site Web et/ou via Facebook Messenger ou WhatsApp.
KLM Airlines a également vu cette convergence mais est venue dans la direction opposée. Ils ont pris leur application de messagerie très réussie (et souvent utilisée) et l'ont portée sur une compétence vocale Alexa pour les appareils Amazon Echo.
Que vous passiez de la voix au chat ou du chat à la voix, il est vrai que de nombreux cas d'utilisation basés sur l'information fonctionneront de la même manière dans les deux scénarios.
Ce n'est qu'une des raisons pour lesquelles nous sommes heureux de nous associer à Voicify. Voicify est un système de gestion de contenu vocal qui permet également à Alexa Skills et Google Apps d'être instantanément portés sur un chatbot avec très peu de travail de développement supplémentaire.
Convergence de la voix et des visuels
Comme cela a été mentionné sur scène lors de l'événement Voice Summit 19, les interfaces qui étaient historiquement d'abord visuelles (comme votre ordinateur portable ou l'écran de votre véhicule) ajoutent désormais de la voix. J'utilise Siri sur mon MacBook tous les jours. À l'inverse, les interfaces qui étaient historiquement axées sur la voix (comme Amazon Echo) incluent désormais des éléments visuels.
La plupart des haut-parleurs intelligents nouvellement achetés incluent des écrans, et les appareils Amazon Echo Show et Google Home Hub sont régulièrement vendus à moins de 100 $.
Cela a quelques ramifications.
Premièrement, cela augmente géométriquement la complexité du développement d'applications vocales.
Deuxièmement, cela ouvre beaucoup d'utilité supplémentaire. L'application Purina serait plus utile si vous pouviez voir des photos de races de chiens sur un haut-parleur intelligent avec un écran. Sans parler du fait que la voix est plus rapide en entrée mais plus lente en sortie. Selon Tobias Dengel de Willowtree, nous tapons 40 mots par minute (wpm) en moyenne, mais parlons 130. À l'inverse, nous pouvons lire 250 mots par minute, mais ne pouvons en écouter que 130. Cela a beaucoup de potentiel pour rendre le contenu vocal vraiment multi. -modal et convivial si nous pouvons dire ce que nous voulons et lire les résultats.
Nous tapons 40 mots par minute (wpm) en moyenne, mais en parlons 130. #voice Cliquez pour tweeterMais troisièmement, si les haut-parleurs intelligents deviennent principalement des appareils avec écrans, qu'est-ce qui les différencie des tablettes, des petits ordinateurs portables ou des gros téléphones ?
Bien que je préfère les haut-parleurs intelligents avec écran (je suis un adepte de Google Home Hub, personnellement), je ne suis pas sûr que brouiller les différences entre un haut-parleur intelligent et un iPad soit finalement une victoire pour ces appareils.
Le conflit de format devient un problème
Au cours de la courte histoire des haut-parleurs intelligents et de l'époque du contenu vocal, Amazon a été le grand patron. Leurs appareils Echo ont essentiellement créé la catégorie, et cet avantage du premier arrivé ainsi que leur énorme puissance promotionnelle ont permis à Amazon de se démarquer dans le monde des haut-parleurs intelligents.
Plus récemment, cependant, Google (et dans une bien moindre mesure, Apple) se sont lancés dans la mêlée avec leurs propres périphériques matériels, cherchant à surpasser Echo the Echo, avec plus ou moins de succès. Des rapports récents de l'industrie suggèrent que la part de marché de Google sur les haut-parleurs intelligents approche les 25 % maintenant, et compte tenu de leurs poches profondes et de leur intérêt à dominer tout ce qui est lié à la recherche (plus leur propriété de l'entité de maison intelligente Nest), ils ne vont nulle part.
Cela offre aux consommateurs un éventail croissant de choix de haut-parleurs intelligents du côté matériel, mais crée un processus compliqué et inefficace pour les développeurs de contenu vocal. Aujourd'hui, les fondements technologiques d'une compétence Amazon Alexa et d'une application Google Home sont assez différents. Sans parler de la toute nouvelle plate-forme vocale Samsung Bixby, qui est conçue presque à l'inverse de la façon dont Amazon/Google le font.
Ainsi, le monde du contenu vocal est au milieu d'un dilemme normatif qui évoque Betamax contre VHS, Internet Explorer contre Netscape, ios contre Android et Joe Jonas contre les prénoms de ses frères.

Ce serait BEAUCOUP mieux s'il n'y avait qu'un seul chemin de développement pour le contenu vocal. Mais je ne retiens pas mon souffle que nous verrons une telle chose, c'est pourquoi les systèmes de gestion de contenu vocal comme Voicify sont essentiels aujourd'hui. À l'intérieur de Voicify, lorsque nous créons du contenu vocal, la technologie Voicify ajuste et tord automatiquement les interactions et les scripts pour qu'ils fonctionnent à la fois sur les appareils Amazon et Google, sans avoir à réécrire l'application vocale. Une victoire, assurément.
Le marketing et le déploiement sont cruciaux
En tant qu'écosystème le plus grand et le plus ancien, Amazon possède bien sûr le plus grand nombre d'applications vocales approuvées et en cours d'exécution, plus de 60 000 aux États-Unis seulement. Quelques dizaines de nouvelles compétences sont ajoutées chaque jour. Et la capacité des consommateurs à découvrir de nouvelles compétences utiles n'est pas un point fort du système Alexa actuel. C'est essentiellement l'équivalent en ligne et / ou activé par la voix de parcourir une très grande bibliothèque avec une variété stupéfiante de livres, dont beaucoup sont merdiques, et un bibliothécaire de quatrième ordre répondant sans enthousiasme aux questions entre les bouchées de casserole maison.
En d'autres termes : si vous voulez que les gens trouvent et utilisent votre contenu activé par la voix, cette responsabilité incombe à VOS épaules. N'attendez RIEN d'Amazon et de Google en termes de promotion et de découverte. De cette façon, vous ne serez pas déçu lorsque c'est exactement ce que vous recevez.
Lors du lancement de contenu vocal, vous devez simplement activer une campagne de sensibilisation et d'essai approfondie et multimodale qui tire parti d'une combinaison d'affichage extérieur, d'e-mails, de réseaux sociaux, de publipostage, de notes d'otages et de personnes se déguisant en clowns et debout aux coins des rues. Votre kilométrage peut varier.
Aujourd'hui, les capacités du contenu vocal dépassent en réalité la compréhension de ces capacités par les consommateurs. C'est une inversion intéressante. Comcast (l'un de nos clients préférés) a pris la parole lors d'un panel lors du Voice Summit 19 et a signalé que ses clients avaient prononcé quelque 9 MILLIARDS de commandes dans leurs télécommandes X1 à commande vocale en 2018. Mais la grande majorité de ces commandes vocales sont destinées au même petit ensemble de demandes. Ils travaillent actuellement sur de nouvelles façons d'enseigner aux clients toutes les autres choses que la télécommande vocale peut faire. À votre manière, vous devrez faire de même lorsque vous déploierez votre contenu activé par la voix.
Fonctionnalité délibérément limitée

L'un de mes points préférés au Voice Summit 19 est venu de Martine van der Lee de KLM Airlines qui a noté que lorsque les applications vocales ont beaucoup de fonctionnalités, travailler avec elles devient plus frustrant, pas moins.
Elle a souligné avec précision que le contenu vocal avec plusieurs options (essentiellement une collection d'applications dans l'application parapluie) nécessite une interaction IVResque entre le consommateur et l'appareil. « Veux-tu faire ceci, ou ceci, ou ceci, ou ceci, ou cela ? C'est l'enfer de l'arborescence téléphonique, mais via un haut-parleur intelligent. Pas bon.
Pour l'instant, la meilleure approche consiste à trouver un cas d'utilisation qui en vaut la peine et à créer votre application de contenu vocal pour ne faire que quelques choses, extrêmement bien. Vous feriez mieux d'avoir plusieurs applications ou compétences plutôt que de bourrer plus d'options dans une exécution vocale existante. Notez que l'utilisation d'écrans dans les haut-parleurs intelligents (voir ci-dessus) peut éventuellement atténuer ce problème.
Les opportunités de contenu vocal interne abondent
Bien que la plupart des compétences vocales et des applications aient été développées pour un usage grand public, il existe de nombreux cas d'utilisation intéressants pour le contenu activé par la voix et axé sur l'interne. D'autant plus que l'utilisation de l'application peut être verrouillée afin que seules les personnes/adresses e-mail approuvées y aient accès, le potentiel de communication interne est important.
Par exemple, une application vocale "Ask HR" qui traite les questions courantes sur la paie, les assurances, les politiques de vacances, etc. Une application vocale "vérification des stocks" qui analyse instantanément les fournitures actuelles disponibles pour voir si une pièce particulière est en stock. Ou une application "tueur de réunions" où les participants d'une équipe enregistrent chacun une courte mise à jour du projet, et toutes les mises à jour sont regroupées dans un seul fichier audio. Écoute facile, gain de temps et aucune salle de conférence nécessaire !
L'éthique est à l'avant-plan
Il y a eu beaucoup de discussions sur l'éthique lors du Voice Summit 19. Il est rafraîchissant de voir les pionniers d'une industrie émergente réfléchir à certaines des ramifications sociétales de leur travail dès le départ, plutôt que d'essayer de gerrymander des considérations éthiques après que le train a depuis longtemps a quitté la station (toux, toux — médias sociaux — toux, toux).
Le New York Times a mené une étude approfondie des abonnés sur la viabilité et les attitudes à l'égard des haut-parleurs intelligents et du contenu vocal et a constaté que l'écrasante majorité des utilisateurs de haut-parleurs intelligents pensent que la voix par défaut utilisée par les haut-parleurs est « blanche » dans leur inflexion et leur perspective. Ceci, en soi, a des implications.
Pour lutter contre cela, KLM Airlines a enregistré les voix de centaines d'employés et a construit un moteur de langage poly-voix personnalisé qui se veut aussi neutre que possible.
D'autres considérations éthiques à ce stade précoce incluent la capacité (ou l'absence de capacité) des haut-parleurs intelligents à écouter la tonalité et à répondre différemment en fonction des besoins d'empathie perçus, etc.
Et bien sûr, une grande considération est la méfiance des consommateurs à l'égard de la nature d'écoute des haut-parleurs intelligents en général. Mon bon ami Tom Webster d'Edison Research a présenté ses données qui montraient que les préoccupations des consommateurs concernant la confidentialité des haut-parleurs intelligents avaient considérablement augmenté au cours de la dernière année.
60 % des personnes s'inquiètent de la confidentialité et de la possibilité que des pirates informatiques accèdent à leurs informations via des haut-parleurs intelligents. #voix Cliquez pour tweeterPourquoi c'est important
Le contenu activé par la voix via des haut-parleurs intelligents et d'autres appareils est un domaine émergent à un stade précoce. Pourtant, l'adoption rapide de ces appareils suggère que la voix continuera de se développer en tant qu'écosystème d'interaction. Nous vous tiendrons informés de l'évolution et de l'évolution de ces tendances vocales au fil du temps. En attendant, si nous pouvons vous aider à réfléchir à votre propre approche de la voix, veuillez nous en informer.