8 tendințe de conținut vocal pentru 2020

Publicat: 2019-08-01

Vocea este noua interfață care ne va înconjura în curând în multe locuri și în multe feluri. Conținutul vocal pentru dispozitivele Amazon Echo, Google Home și Samsung este dezvoltat de mărci mari și mici.

Construim strategii de conținut activat prin voce pentru clienții noștri aici, la Convince & Convert — ajutându-i să profite de această oportunitate de interacțiune cu consumatorii în creștere rapidă (pentru mai multe despre ceea ce facem în conținutul vocal, consultați De ce este timpul acum pentru Voice- Conținut activat).

Am participat recent la Voice Summit 2019, despre care se spune că este cea mai mare întâlnire din industrie de strategi de conținut vocal, dezvoltatori, tehnologi, furnizori și platforme hardware.

Iată primele 8 tendințe de conținut vocal pe care le-am sintetizat în timpul petrecut la eveniment și prin munca noastră cu clienții în aplicațiile de voce.

Cel mai bun conținut vocal începe cu nevoile utilizatorilor

Similar cu primele aplicații mobile și chiar site-uri web, există o tendință în rândul strategilor și dezvoltatorilor de a gândi: „Hai să creăm o aplicație vocală!” În schimb, cea mai bună abordare este să luați în considerare și să cercetați cu atenție modul în care consumatorii interacționează cu marca, ceea ce trebuie să știe de fapt de la marca respectivă și dacă/dacă conținutul vocal este o modalitate adecvată de livrare. La urma urmei, nu există nicio lege care să spună că TREBUIE să aveți conținut activat prin voce. Este cu adevărat o Youtility? Dacă da, construiește-l. Dacă nu, nu!

De exemplu, abilitatea Alexa „Întreabă-l pe Purina” a lui Purina a luat naștere din nevoia consumatorilor de a înțelege cum se comportă diferite rase de câini și care rasă ar putea fi cea mai potrivită ca un nou animal de companie. Ei s-au gândit să includă promoții audio pentru achizițiile de hrană pentru câini, dar au renunțat la această noțiune după ce și-au dat seama că ar aglomera informația, potrivit reprezentanților de la Mobiquity, firma care a dezvoltat abilitățile.

Convergența vocii și a chatului

Cele mai eficiente aplicații vocale din ziua de azi sunt de obicei știri, întrebări și răspunsuri de recuperare a informațiilor sau jocuri. În ceea ce privește „Întrebări și răspunsuri despre mărci”, ca și în exemplul Purina menționat mai sus, fluxul de interacțiune al acestor aplicații este foarte asemănător cu modul în care consumatorii folosesc chatbot-urile.

Exemplu de Messenger — Sursa imagine: Newsroom KLM – KLM Royal Dutch Airlines

De fapt, abilitate Alexa Ask Purina despre rasa de câini ar funcționa destul de bine ca chatbot pe un site web și/sau prin Facebook Messenger sau WhatsApp.

KLM Airlines a văzut și această convergență, dar a ajuns la ea din direcția opusă. Au luat aplicația lor de mesagerie de mare succes (și des folosită) și au portat-o la o abilitate vocală Alexa pentru dispozitivele Amazon Echo.

Fie că treci de la voce la chat sau de la chat la voce, este adevărat că multe cazuri de utilizare bazate pe informații vor funcționa similar în ambele scenarii.

Acesta este doar unul dintre motivele pentru care suntem bucuroși să colaborăm cu Voicify. Voicify este un sistem de gestionare a conținutului vocal care permite, de asemenea, ca Alexa Skills și Google Apps să fie portate instantaneu la un chatbot cu foarte puțină activitate de dezvoltare suplimentară.

Convergența vocii și a imaginilor

După cum sa menționat pe scenă la evenimentul Voice Summit 19, interfețele care au fost mai întâi vizuale (cum ar fi laptopul sau afișajul vehiculului) acum adaugă voce. Folosesc Siri pe MacBook-ul meu în fiecare zi. Dimpotrivă, interfețele care au fost în trecut mai întâi voce (cum ar fi Amazon Echo) includ acum elemente vizuale.

Multe dintre boxele inteligente nou achiziționate includ ecrane, iar dispozitivele Amazon Echo Show și Google Home Hub au un preț de obicei sub 100 USD.

Acest lucru are câteva ramificații.

În primul rând, crește geometric complexitatea dezvoltării aplicațiilor de voce.

În al doilea rând, deschide multă utilitate suplimentară. Aplicația Purina ar fi mai utilă dacă ați putea vedea imagini cu rase de câini pe un difuzor inteligent cu ecran. Ca să nu mai vorbim de faptul că vocea este mai rapidă ca intrare, dar mai lentă ca ieșire. Potrivit lui Tobias Dengel de la Willowtree, tastăm în medie 40 de cuvinte pe minut (wpm), dar vorbim 130. În schimb, putem citi 250 de cuvinte pe minut, dar putem asculta doar 130. Acest lucru are un mare potențial de a face conținutul vocal cu adevărat multiplu. -modal și ușor de utilizat dacă putem vorbi ceea ce vrem și citim rezultatele.

Introducem 40 de cuvinte pe minut (wpm) în medie, dar vorbim 130. #voice Click To Tweet

Dar în al treilea rând, dacă difuzoarele inteligente devin în primul rând dispozitive cu ecrane, ce le diferențiază de tablete, laptopuri mici sau telefoane mari?

Deși prefer difuzoarele inteligente cu ecran (sunt un devot Google Home Hub, personal), nu sunt sigur că estomparea diferențelor dintre un difuzor inteligent și un iPad este în cele din urmă un câștig pentru aceste dispozitive.

Ciocnirea formatului devine o problemă

În timpul scurtului istoric al epocii difuzoarelor inteligente și a conținutului vocal, Amazon a fost marele șef. Dispozitivele lor Echo au creat, în esență, categoria, iar acest avantaj de primă schimbare plus puterea lor de promovare masivă au permis lui Amazon să fie în fața lumii difuzoarelor inteligente.

Mai recent, însă, Google (și într-o măsură mult mai mică, Apple) au intrat în luptă cu propriile dispozitive hardware, căutând să depășească Echo the Echo, cu diferite grade de succes. Rapoarte recente din industrie sugerează că cota de piață a difuzoarelor inteligente a Google se apropie de 25% acum și, având în vedere buzunarele lor adânci și interesul de a domina orice legat de căutare (plus deținerea entității de casă inteligentă Nest), nu merg nicăieri.

Acest lucru oferă consumatorilor o gamă din ce în ce mai mare de opțiuni de difuzoare inteligente pe partea hardware, dar creează un proces îngrozitor și ineficient pentru dezvoltatorii de conținut vocal. Astăzi, bazele tehnologice ale unei abilități Amazon Alexa și ale unei aplicații Google Home sunt destul de diferite. Ca să nu mai vorbim de noua platformă vocală Samsung Bixby, care este proiectată aproape invers față de modul în care Amazon/Google o fac.

Astfel, lumea conținutului vocal se află în mijlocul unei dileme de standarde care miroase a Betamax vs. VHS, Internet Explorer vs. Netscape, ios vs. Android și Joe Jonas vs. oricare ar fi prenumele fraților săi.

Ar fi mult mai bine dacă ar exista o singură cale de dezvoltare pentru conținutul vocal. Dar nu îmi țin respirația că vom vedea așa ceva, motiv pentru care sistemele de gestionare a conținutului vocal precum Voicify sunt esențiale astăzi. În interiorul Voicify, atunci când construim conținut vocal, tehnologia Voicify modifică și răsucește automat interacțiunile și scripturile pentru a funcționa atât pe dispozitivele Amazon, cât și pe Google, fără a fi nevoie să rescrie aplicația de voce. O victorie, cu siguranță.

Marketingul și lansarea sunt esențiale

Fiind cel mai mare și mai longeviv ecosistem, Amazon, desigur, are cele mai multe aplicații vocale aprobate și rulante, peste 60.000 numai în Statele Unite. Câteva zeci de abilități noi sunt adăugate în fiecare zi. Iar capacitatea consumatorilor de a descoperi noi abilități utile nu este un punct culminant al sistemului Alexa actual. Este, în esență, echivalentul online și/sau activat prin voce a plimbării printr-o bibliotecă foarte mare, cu o varietate uluitoare de cărți, multe dintre ele de rahat, și un bibliotecar de clasa a patra care răspunde cu jumătate de inimă la întrebări între mușcături de caserolă de casă.

Spuneți astfel: dacă doriți ca oamenii să găsească și să folosească conținutul dvs. activat prin voce, acea responsabilitate cade pe umerii VOI. Nu vă așteptați la NIMIC de la Amazon și Google în ceea ce privește promovarea și descoperirea. Astfel, nu vei fi dezamăgit când exact asta primești.

Când lansați conținut vocal, trebuie pur și simplu să activați o campanie de conștientizare și de probă amănunțită, multimodală, care profită de o combinație de e-mail, socializare, poștă directă, note de ostatici și oameni îmbrăcați ca clovnii și în picioare. la colțurile străzilor. Kilometrajul dvs. poate varia.

Astăzi, capacitățile conținutului vocal depășesc de fapt înțelegerea de către consumatori a acestor capacități. Este o inversare interesantă. Comcast (unul dintre clienții noștri preferați) a vorbit la un panou la Voice Summit 19 și a raportat că clienții săi au rostit aproximativ 9 MILIARDE de comenzi în telecomenzile X1 activate vocal în 2018. Dar marea majoritate a acestor comenzi vocale sunt pentru aceleași mici comenzi. set de cereri. În prezent, lucrează la noi modalități de a-i învăța pe clienți toate celelalte lucruri pe care le poate face telecomanda vocală. În felul tău, va trebui să faci același lucru atunci când lansezi conținutul activat vocal.

Funcționalitate limitată intenționat

Unul dintre punctele mele preferate la Voice Summit 19 a venit de la Martine van der Lee de la KLM Airlines, care a remarcat că atunci când aplicațiile de voce au multe funcționalități, lucrul cu ele devine mai frustrant, nu mai puțin.

Ea a subliniat cu acuratețe că conținutul vocal cu mai multe opțiuni (în esență o colecție de aplicații în cadrul aplicației umbrelă) necesită o interacțiune IVResque între consumator și dispozitiv. „Vrei să faci asta, sau asta, sau asta, sau asta, sau asta?” Este iadul arborelui telefonului, dar printr-un difuzor inteligent. Nu e bine.

Deocamdată, cea mai bună abordare este să găsești un caz de utilizare care să fie demn și să-ți construiești aplicația de conținut vocal pentru a face doar câteva lucruri, extrem de bine. Este mai bine să aveți mai multe aplicații sau abilități decât să introduceți mai multe opțiuni într-o execuție vocală existentă. Rețineți că utilizarea ecranelor în difuzoarele inteligente (vezi mai sus) poate ameliora această problemă, în cele din urmă.

Oportunități de conținut vocal intern abundă

În timp ce majoritatea abilităților și aplicațiilor vocale au fost dezvoltate pentru uzul consumatorilor, există multe cazuri de utilizare interesante pentru conținutul activat vocal concentrat intern. Mai ales că utilizarea aplicației poate fi blocată, astfel încât doar persoanele aprobate/adresa de e-mail să aibă acces, potențialul de comunicare internă este semnificativ.

De exemplu, o aplicație vocală „Ask HR” care se ocupă de întrebări obișnuite despre salarizare, asigurări, politici de vacanță etc. O aplicație vocală de „verificare a inventarului” care scanează instantaneu proviziile curente la îndemână pentru a vedea dacă o anumită piesă este în stoc. Sau o aplicație „meeting killer” în care participanții dintr-o echipă înregistrează fiecare o scurtă actualizare a proiectului, iar toate actualizările sunt grupate ca un singur fișier audio. Ascultare ușoară, eficientă în timp și nu este nevoie de sală de conferințe!

Etica este în față

S-a vorbit mult despre etică la Voice Summit 19. Este reconfortant să-i vezi pe pionierii unei industrii emergente gândindu-se la unele dintre ramificațiile societale ale muncii lor de la început, mai degrabă decât să încerce să gestioneze considerațiile etice după ce trenul a trecut de mult. a părăsit stația (tuse, tuse — social media — tuse, tuse).

New York Times a efectuat un studiu amănunțit al abonaților cu privire la viabilitatea și atitudinile față de difuzoarele inteligente și conținutul vocal și a constatat că majoritatea covârșitoare a utilizatorilor de difuzoare inteligente consideră că vocea implicită folosită de difuzoare este „albă” în inflexiunea și perspectiva lor. Acest lucru, în sine, are implicații.

Pentru a combate acest lucru, KLM Airlines a înregistrat vocile a sute de angajați și a construit un motor personalizat de limbă multi-voce care se dorește să fie cât mai neutru posibil.

Alte considerații etice în acest stadiu incipient includ capacitatea (sau lipsa acesteia) a difuzoarelor inteligente de a asculta tonalitate și de a răspunde diferit în funcție de nevoile percepute de empatie etc.

Și, desigur, o mare considerație este neîncrederea consumatorilor față de natura de ascultare a difuzoarelor inteligente în general. Bunul meu prieten Tom Webster de la Edison Research și-a prezentat datele care au arătat că îngrijorarea consumatorilor cu privire la confidențialitatea difuzoarelor inteligente a crescut considerabil în ultimul an.

60% dintre oameni sunt îngrijorați de confidențialitate și de potențialul hackerilor de a-și accesa informațiile prin difuzoare inteligente. #voice Faceți clic pentru a trimite pe Tweet

De ce contează asta

Conținutul activat prin voce prin difuzoare inteligente și alte dispozitive este un domeniu în stadiu incipient, în curs de dezvoltare. Cu toate acestea, adoptarea rapidă a acestor dispozitive sugerează că vocea va continua să crească ca ecosistem de interacțiune. Vă vom ține la curent pe măsură ce vedem că aceste tendințe de voce se dezvoltă și se schimbă în timp. Între timp, dacă vă putem ajuta să vă gândiți la propria abordare a vocii, vă rugăm să ne anunțați.