8 tendenze dei contenuti vocali per il 2020
Pubblicato: 2019-08-01Voice è la nuova interfaccia che presto ci circonderà in molti luoghi e in molti modi. I contenuti vocali per dispositivi Amazon Echo, Google Home e Samsung sono sviluppati da marchi grandi e piccoli.
Stiamo costruendo strategie per i contenuti ad attivazione vocale per i nostri clienti qui a Convince & Convert, aiutandoli a sfruttare questa opportunità di interazione con i consumatori in rapida crescita (per ulteriori informazioni su ciò che facciamo nei contenuti vocali, vedere Perché è ora il momento per la voce- Contenuto attivato).
Di recente ho partecipato al Voice Summit 2019, considerato il più grande raduno del settore di strateghi di contenuti vocali, sviluppatori, tecnici, fornitori e piattaforme hardware.
Ecco le 8 principali tendenze dei contenuti vocali che ho sintetizzato durante la mia permanenza all'evento e tramite il nostro lavoro con i clienti sulle app vocali.
Il miglior contenuto vocale inizia con le esigenze degli utenti
Simile all'inizio delle app mobili e persino dei siti Web, c'è una tendenza tra strateghi e sviluppatori a pensare: "Facciamo un'app vocale!" Invece, l'approccio migliore consiste nel considerare attentamente e ricercare in che modo i consumatori interagiscono con il marchio, cosa hanno effettivamente bisogno di sapere da quel marchio e se/se il contenuto vocale è un modo adatto per fornire. Dopotutto, non esiste una legge che dice che DEVI avere contenuti ad attivazione vocale. È davvero una Youtility? Se è così, costruiscilo. Se no, non farlo!
Ad esempio, l'abilità Alexa "Chiedi a Purina" di Purina è nata dal bisogno dei consumatori di capire come si comportano le diverse razze di cani e quale razza potrebbe essere più appropriata come nuovo animale domestico. Secondo i rappresentanti di Mobiquity, l'azienda che ha sviluppato l'abilità, hanno considerato di includere promozioni audio per l'acquisto di cibo per cani, ma hanno scartato quell'idea dopo aver realizzato che avrebbe ingombrato il patrimonio informativo.
Convergenza di voce e chat
Le applicazioni vocali più efficaci oggi sono in genere notizie, domande e risposte per il recupero di informazioni o giochi. Sul fronte delle "domande e risposte sul marchio", come nell'esempio di Purina sopra menzionato, il flusso di interazione di queste app è molto simile al modo in cui i consumatori utilizzano i chatbot.

In effetti, l'abilità di Alexa di Chiedi informazioni sulla razza del cane di Purina funzionerebbe abbastanza bene come chatbot su un sito Web e/o tramite Facebook Messenger o WhatsApp.
Anche KLM Airlines ha visto questa convergenza, ma ci è arrivata dalla direzione opposta. Hanno preso la loro app di messaggistica di grande successo (e spesso utilizzata) e l'hanno trasferita su un'abilità vocale Alexa per i dispositivi Amazon Echo.
Sia che tu stia passando dalla voce alla chat o dalla chat alla voce, è vero che molti casi d'uso basati sulle informazioni funzioneranno in modo simile in entrambi gli scenari.
Questo è solo uno dei motivi per cui siamo felici di collaborare con Voicify. Voicify è un sistema di gestione dei contenuti vocali che consente anche di trasferire istantaneamente Alexa Skills e Google Apps su un chatbot con pochissimo lavoro di sviluppo aggiuntivo.
Convergenza di voce e immagini
Come accennato sul palco dell'evento Voice Summit 19, le interfacce che storicamente erano prima elementi visivi (come il laptop o il display del veicolo) ora aggiungono voce. Uso Siri sul mio MacBook ogni giorno. Al contrario, le interfacce che storicamente sono state prima voce (come Amazon Echo) ora includono immagini.
Molti degli altoparlanti intelligenti appena acquistati includono schermi e i dispositivi Amazon Echo Show e Google Home Hub hanno normalmente un prezzo inferiore a $ 100.
Questo ha alcune ramificazioni.
Innanzitutto, aumenta geometricamente la complessità dello sviluppo di app vocali.
In secondo luogo, apre molte utilità aggiuntive. L'app Purina sarebbe più utile se potessi vedere le immagini di razze canine su un altoparlante intelligente con uno schermo. Per non parlare del fatto che la voce è più veloce come input ma più lenta come output. Secondo Tobias Dengel di Willowtree, digitiamo in media 40 parole al minuto (wpm), ma ne parliamo 130. Al contrario, possiamo leggere 250 wpm, ma possiamo ascoltarne solo 130. Questo ha molto potenziale per rendere i contenuti vocali davvero multi -modale e facile da usare se possiamo parlare quello che vogliamo e leggere i risultati.
Digitiamo in media 40 parole al minuto (wpm), ma ne parliamo 130. #voice Clicca per twittareMa terzo, se gli altoparlanti intelligenti diventano principalmente dispositivi con schermi, cosa li differenzia da tablet, piccoli laptop o telefoni di grandi dimensioni?
Anche se preferisco gli altoparlanti intelligenti con uno schermo (personalmente sono un devoto di Google Home Hub), non sono sicuro che offuscare le differenze tra un altoparlante intelligente e un iPad sia in definitiva una vittoria per questi dispositivi.
Formatta scontro che diventa un problema
Durante la breve storia degli altoparlanti intelligenti e dell'epoca dei contenuti vocali, Amazon è stato il grande capo. I loro dispositivi Echo hanno essenzialmente creato la categoria e quel vantaggio di first mover, oltre al loro enorme potere promozionale, ha permesso ad Amazon di correre in testa nel mondo degli altoparlanti intelligenti.
Più recentemente, tuttavia, Google (e, in misura molto minore, Apple) si sono lanciati nella mischia con i propri dispositivi hardware, cercando di superare Echo the Echo, con vari gradi di successo. Rapporti recenti del settore suggeriscono che la quota di mercato di Google degli altoparlanti intelligenti si sta avvicinando al 25% e, date le loro tasche profonde e l'interesse a dominare qualsiasi cosa relativa alla ricerca (oltre alla proprietà dell'entità di casa intelligente Nest), non stanno andando da nessuna parte.
Ciò offre ai consumatori una gamma crescente di scelte di altoparlanti intelligenti sul lato hardware, ma crea un processo fastidioso e inefficiente per gli sviluppatori di contenuti vocali. Oggi, le basi tecnologiche di un'abilità Amazon Alexa e di un'app Google Home sono piuttosto diverse. Per non parlare della nuovissima piattaforma vocale Samsung Bixby, progettata quasi al contrario di come lo fanno Amazon/Google.
Pertanto, il mondo dei contenuti vocali si trova nel mezzo di un dilemma sugli standard che ricorda Betamax contro VHS, Internet Explorer contro Netscape, ios contro Android e Joe Jonas contro qualunque siano i nomi dei suoi fratelli.

Sarebbe MOLTO meglio se ci fosse un unico percorso di sviluppo per i contenuti vocali. Ma non sto trattenendo il respiro che vedremo una cosa del genere, motivo per cui i sistemi di gestione dei contenuti vocali come Voicify sono fondamentali oggi. All'interno di Voicify, quando creiamo contenuti vocali, la tecnologia Voicify modifica e modifica automaticamente le interazioni e gli script per funzionare sia sui dispositivi Amazon che su Google, senza dover riscrivere l'applicazione vocale. Una vittoria, certo.
Il marketing e il lancio sono fondamentali
Essendo l'ecosistema più grande e più longevo, Amazon ha ovviamente il maggior numero di applicazioni vocali approvate e in esecuzione, oltre 60.000 solo negli Stati Uniti. Ogni giorno vengono aggiunte alcune dozzine di nuove abilità. E la capacità dei consumatori di scoprire nuove utili competenze non è un punto culminante dell'attuale sistema Alexa. È essenzialmente l'equivalente online e/o ad attivazione vocale di camminare in una biblioteca molto grande con una varietà sbalorditiva di libri, molti dei quali di merda, e un bibliotecario di quarta categoria che risponde a malincuore alle domande tra un boccone e l'altro di una casseruola fatta in casa.
Mettiamola in questo modo: se vuoi che le persone trovino e utilizzino i tuoi contenuti ad attivazione vocale, quella responsabilità ricade sulle TUE spalle. Non aspettarti NIENTE da Amazon e Google in termini di promozione e rilevabilità. In questo modo, non rimarrai deluso quando sarà esattamente ciò che riceverai.
Quando si lanciano contenuti vocali, è sufficiente attivare una campagna di sensibilizzazione e di prova approfondita e multimodale che sfrutti una combinazione di fuori casa, e-mail, social, posta diretta, note di ostaggi e persone che si travestono da clown e in piedi agli angoli delle strade. Il tuo chilometraggio può variare.
Oggi, le capacità dei contenuti vocali superano in realtà la comprensione di tali capacità da parte dei consumatori. È un'inversione interessante. Comcast (uno dei nostri clienti preferiti) ha parlato in un panel al Voice Summit 19 e ha riferito che i suoi clienti hanno pronunciato circa 9 MILIARDI di comandi nei loro telecomandi X1 ad attivazione vocale nel 2018. Ma la stragrande maggioranza di questi comandi vocali sono per lo stesso piccolo insieme di richieste. Attualmente stanno lavorando a nuovi modi per insegnare ai clienti tutte le altre cose che il telecomando vocale può fare. A modo tuo, dovrai fare lo stesso quando distribuirai i tuoi contenuti ad attivazione vocale.
Funzionalità volutamente limitata

Uno dei miei punti preferiti al Voice Summit 19 è arrivato da Martine van der Lee di KLM Airlines che ha notato che quando le app vocali hanno molte funzionalità, lavorare con esse diventa più frustrante, non meno.
Ha accuratamente sottolineato che il contenuto vocale con diverse opzioni (essenzialmente una raccolta di app all'interno dell'app ombrello) richiede un'interazione IVResque tra consumatore e dispositivo. "Vuoi fare questo, o questo, o questo, o questo, o questo?" È l'inferno dell'albero del telefono ma attraverso un altoparlante intelligente. Non bene.
Per ora, l'approccio migliore è trovare un caso d'uso degno e creare la tua app di contenuti vocali per fare solo un paio di cose, estremamente bene. È meglio avere più app o abilità piuttosto che inserire più opzioni in un'esecuzione vocale esistente. Si noti che l'uso di schermi negli altoparlanti intelligenti (vedi sopra) potrebbe migliorare questo problema, alla fine.
Le opportunità di contenuti vocali interni abbondano
Sebbene la maggior parte delle competenze vocali e delle app siano state sviluppate per l'uso da parte dei consumatori, esistono molti casi d'uso interessanti per i contenuti ad attivazione vocale incentrati sull'interno. Soprattutto dal momento che l'utilizzo dell'app può essere bloccato in modo che solo le persone/l'indirizzo e-mail autorizzati abbiano accesso, il potenziale di comunicazione interna è significativo.
Ad esempio, un'app vocale "Chiedi alle risorse umane" che gestisce domande comuni su buste paga, assicurazioni, polizze ferie, ecc. Un'app vocale "verifica inventario" che scansiona istantaneamente le forniture attuali per vedere se una parte particolare è disponibile. O un'app "meeting killer" in cui i partecipanti di un team registrano ciascuno un breve aggiornamento del progetto e tutti gli aggiornamenti vengono raggruppati insieme come un unico file audio. Ascolto facile, risparmio di tempo e nessuna sala conferenze necessaria!
L'etica è in prima linea
Si è parlato molto di etica al Voice Summit 19. È piacevole vedere i pionieri di un settore emergente pensare ad alcune delle ramificazioni sociali del loro lavoro fin dall'inizio, piuttosto che cercare di manipolare considerazioni etiche dopo che il treno è passato da tempo ha lasciato la stazione (tosse, tosse — social media — tosse, tosse).
Il New York Times ha condotto uno studio approfondito sugli abbonati sulla fattibilità e sugli atteggiamenti nei confronti degli altoparlanti intelligenti e dei contenuti vocali e ha scoperto che la stragrande maggioranza degli utenti di altoparlanti intelligenti ritiene che la voce predefinita utilizzata dagli altoparlanti sia "bianca" nella loro inflessione e prospettiva. Questo, di per sé, ha delle implicazioni.
Per combattere questo, KLM Airlines ha registrato le voci di centinaia di dipendenti e ha costruito un motore di lingua poli-voce personalizzato che dovrebbe essere il più neutrale possibile.
Altre considerazioni etiche in questa fase iniziale includono la capacità (o la mancanza) degli altoparlanti intelligenti di ascoltare la tonalità e rispondere in modo diverso in base ai bisogni di empatia percepiti, ecc.
E, naturalmente, una grande considerazione è la sfiducia dei consumatori nei confronti della natura di ascolto degli altoparlanti intelligenti in generale. Il mio buon amico Tom Webster di Edison Research ha mostrato i suoi dati che hanno mostrato che la preoccupazione dei consumatori per la privacy degli altoparlanti intelligenti è aumentata notevolmente nell'ultimo anno.
Il 60% delle persone è preoccupato per la privacy e il potenziale degli hacker che accedono alle proprie informazioni tramite altoparlanti intelligenti. #voice Clicca per twittarePerché questo è importante
I contenuti ad attivazione vocale tramite altoparlanti intelligenti e altri dispositivi sono un campo emergente in una fase iniziale. Tuttavia, la rapida adozione di questi dispositivi suggerisce che la voce continuerà a crescere come ecosistema di interazione. Ti terremo informato man mano che vediamo queste tendenze vocali svilupparsi e cambiare nel tempo. Nel frattempo, se possiamo aiutarti a pensare attraverso il tuo approccio alla voce, faccelo sapere.