8 tendências de conteúdo de voz para 2020

Publicados: 2019-08-01

Tendências de conteúdo de voz

A voz é a nova interface que em breve nos cercará em muitos lugares e de muitas maneiras. O conteúdo de voz para dispositivos Amazon Echo, Google Home e Samsung está sendo desenvolvido por marcas grandes e pequenas.

encontro de voz 2019 Estamos criando estratégias de conteúdo ativado por voz para nossos clientes aqui na Convince & Convert, ajudando-os a aproveitar essa oportunidade de interação com o consumidor em rápido crescimento (para saber mais sobre o que fazemos em conteúdo de voz, consulte Por que a hora é agora para voz- Conteúdo Ativado).

Recentemente, participei do Voice Summit 2019, considerado o maior encontro do setor de estrategistas de conteúdo de voz, desenvolvedores, tecnólogos, fornecedores e plataformas de hardware.

Aqui estão as 8 principais tendências de conteúdo de voz que sintetizei durante meu tempo no evento e por meio de nosso trabalho com clientes em aplicativos de voz.

O melhor conteúdo de voz começa com as necessidades do usuário

Semelhante ao início dos aplicativos móveis, e até sites, há uma tendência entre estrategistas e desenvolvedores de pensar: “Vamos fazer um aplicativo de voz!” Em vez disso, a melhor abordagem é considerar e pesquisar cuidadosamente como os consumidores interagem com a marca, o que eles realmente precisam saber dessa marca e se/se o conteúdo de voz é uma maneira adequada de entregar. Afinal, não há lei que diga que você DEVE ter conteúdo ativado por voz. É genuinamente um Youtility? Se sim, construa-o. Se não, não!

Por exemplo, a habilidade Alexa “Ask Purina” da Purina nasceu da necessidade dos consumidores de entender como as diferentes raças de cães se comportam e qual raça pode ser mais apropriada como um novo animal de estimação. Eles consideraram incluir promoções de áudio para compras de ração para cães, mas descartaram essa noção depois de perceber que isso atrapalharia o ativo de informações, de acordo com representantes da Mobiquity, empresa que desenvolveu a habilidade.

Pergunte ao conteúdo de voz Purina

Convergência de voz e bate-papo

Os aplicativos de voz mais eficazes hoje são normalmente notícias, perguntas e respostas de recuperação de informações ou jogos. Na frente de “perguntas e respostas da marca”, como no exemplo da Purina mencionado acima, o fluxo de interação desses aplicativos é muito semelhante ao modo como os consumidores usam os chatbots.

Exemplo de mensageiro
Fonte da imagem: Sala de imprensa KLM – KLM Royal Dutch Airlines

Na verdade, a habilidade Alexa de informações sobre raças de cães Ask Purina funcionaria muito bem como um chatbot em um site e/ou via Facebook Messenger ou WhatsApp.

A KLM Airlines também viu essa convergência, mas veio na direção oposta. Eles pegaram seu aplicativo de mensagens muito bem-sucedido (e frequentemente usado) e o portaram para uma habilidade de voz Alexa para dispositivos Amazon Echo.

Esteja você indo de voz para bate-papo ou de bate-papo para voz, é verdade que muitos casos de uso baseados em informações funcionarão de maneira semelhante em ambos os cenários.

Esta é apenas uma das razões pelas quais estamos felizes em fazer parceria com a Voicify. O Voicify é um sistema de gerenciamento de conteúdo de voz que também permite que o Alexa Skills e o Google Apps sejam instantaneamente portados para um chatbot com muito pouco trabalho de desenvolvimento adicional.

Convergência de Voz e Visual

Como foi mencionado no palco do evento Voice Summit 19, as interfaces que historicamente eram visuais em primeiro lugar (como seu laptop ou tela de veículo) agora estão adicionando voz. Eu uso Siri no meu MacBook todos os dias. Por outro lado, as interfaces que historicamente eram de voz (como o Amazon Echo) agora incluem recursos visuais.

Central do Google Home Muitos dos alto-falantes inteligentes recém-adquiridos incluem telas, e os dispositivos Amazon Echo Show e Google Home Hub costumam custar menos de US$ 100.

Isso tem algumas ramificações.

Primeiro, aumenta geometricamente a complexidade do desenvolvimento de aplicativos de voz.

Em segundo lugar, abre muitas utilidades adicionais. O aplicativo Purina seria mais útil se você pudesse ver fotos de raças de cães em um alto-falante inteligente com tela. Sem mencionar o fato de que a voz é mais rápida como entrada, mas mais lenta como saída. De acordo com Tobias Dengel da Willowtree, digitamos em média 40 palavras por minuto (ppm), mas falamos 130. Por outro lado, podemos ler 250 ppm, mas só podemos ouvir 130. Isso tem muito potencial para tornar o conteúdo de voz verdadeiramente multi -modal e amigável se pudermos falar o que queremos e ler os resultados.

Digitamos em média 40 palavras por minuto (wpm), mas falamos 130. #voice Click To Tweet

Mas, terceiro, se os alto-falantes inteligentes se tornarem principalmente dispositivos com telas, o que os diferencia de tablets, laptops pequenos ou telefones grandes?

Embora eu prefira alto-falantes inteligentes com tela (eu sou um devoto do Google Home Hub, pessoalmente), não tenho certeza se desfocar as diferenças entre um alto-falante inteligente e um iPad é uma vitória para esses dispositivos.

Format Clash se tornando um problema

Durante a curta história dos alto-falantes inteligentes e da época do conteúdo de voz, a Amazon tem sido o grande chefe. Seus dispositivos Echo criaram essencialmente a categoria, e essa vantagem pioneira, além de seu enorme poder promocional, permitiu que a Amazon saísse na frente no mundo dos alto-falantes inteligentes.

Mais recentemente, no entanto, o Google (e, em menor grau, a Apple) entrou na briga com seus próprios dispositivos de hardware, procurando superar o Echo, com vários graus de sucesso. Relatórios recentes do setor sugerem que a participação de mercado de alto-falantes inteligentes do Google está se aproximando de 25% agora e, devido aos seus bolsos profundos e interesse em dominar qualquer coisa relacionada à pesquisa (além da propriedade da entidade doméstica inteligente Nest), eles não vão a lugar nenhum.

Isso oferece aos consumidores uma gama crescente de opções de alto-falantes inteligentes no lado do hardware, mas cria um processo ineficiente e atormentador para os desenvolvedores de conteúdo de voz. Hoje, os fundamentos tecnológicos de uma habilidade Amazon Alexa e um aplicativo Google Home são bem diferentes. Sem mencionar a novíssima plataforma de voz Samsung Bixby, que é arquitetada quase ao contrário de como a Amazon/Google faz isso.

Assim, o mundo do conteúdo de voz está no meio de um dilema de padrões que remete a Betamax vs. VHS, Internet Explorer vs. Netscape, ios vs. Android, e Joe Jonas vs. quaisquer que sejam os primeiros nomes de seus irmãos.

Seria MUITO melhor se houvesse um único caminho de desenvolvimento para conteúdo de voz. Mas não estou prendendo a respiração que veremos uma coisa dessas, e é por isso que sistemas de gerenciamento de conteúdo de voz como o Voicify são essenciais hoje. Dentro do Voicify, quando criamos conteúdo de voz, a tecnologia Voicify ajusta e distorce automaticamente as interações e os scripts para funcionar nos dispositivos Amazon e Google, sem precisar reescrever o aplicativo de voz. Uma vitória, com certeza.

Marketing e lançamento são cruciais

Como o maior e mais antigo ecossistema, a Amazon, é claro, tem o maior número de aplicativos de voz aprovados e em execução, mais de 60.000 somente nos Estados Unidos. Algumas dezenas de novas habilidades são adicionadas a cada dia. E a capacidade dos consumidores de descobrir novas habilidades úteis não é um destaque do atual sistema Alexa. É essencialmente o equivalente on-line e/ou ativado por voz de andar por uma biblioteca muito grande com uma variedade impressionante de livros, muitos deles de merda, e um bibliotecário de quarta categoria respondendo perguntas sem entusiasmo entre mordidas de caçarola caseira.

Coloque desta forma: se você quer que as pessoas encontrem e usem seu conteúdo ativado por voz, essa responsabilidade recai sobre SEUS ombros. Não espere NADA da Amazon e do Google em termos de promoção e descoberta. Dessa forma, você não ficará desapontado quando for exatamente isso que você receber.

Ao lançar conteúdo de voz, você simplesmente deve ativar uma campanha de teste e conscientização multimodal completa que aproveite alguma combinação de fora de casa, e-mail, social, mala direta, notas de reféns e pessoas se vestindo como palhaços e em pé nas esquinas das ruas. Sua milhagem pode variar.

Hoje, os recursos do conteúdo de voz superam a compreensão dos consumidores sobre esses recursos. É uma inversão interessante. A Comcast (um de nossos clientes favoritos) falou em um painel no Voice Summit 19 e relatou que seus clientes emitiram cerca de 9 BILHÕES de comandos em seus controles remotos X1 ativados por voz em 2018. Mas a grande maioria desses comandos de voz são para os mesmos pequenos conjunto de solicitações. Atualmente, eles estão trabalhando em novas maneiras de ensinar aos clientes todas as outras coisas que o controle remoto por voz pode fazer. À sua maneira, você precisará fazer o mesmo ao lançar seu conteúdo ativado por voz.

Funcionalidade Propositadamente Limitada

Martine van der Lee da KLM
Martine van der Lee da KLM Airlines

Um dos meus pontos favoritos no Voice Summit 19 veio de Martine van der Lee, da KLM Airlines, que observou que, quando os aplicativos de voz têm muitas funcionalidades, trabalhar com eles se torna mais frustrante, não menos.

Ela ressaltou com precisão que o conteúdo de voz com várias opções (essencialmente uma coleção de aplicativos dentro do aplicativo guarda-chuva) requer uma interação IVResque entre consumidor e dispositivo. “Você quer fazer isso, ou isso, ou isso, ou isso, ou isso?” É o inferno da árvore do telefone, mas através de um alto-falante inteligente. Não é bom.

Por enquanto, a melhor abordagem é encontrar um caso de uso que valha a pena e criar seu aplicativo de conteúdo de voz para fazer apenas algumas coisas, extremamente bem. É melhor ter vários aplicativos ou habilidades do que colocar mais opções em uma execução de voz existente. Observe que o uso de telas em alto-falantes inteligentes (veja acima) pode melhorar esse problema, eventualmente.

Abundam as oportunidades de conteúdo de voz interno

Embora a maioria das habilidades e aplicativos de voz tenham sido desenvolvidos para uso do consumidor, há muitos casos de uso interessantes para conteúdo ativado por voz com foco interno. Especialmente porque o uso do aplicativo pode ser bloqueado para que apenas pessoas/endereços de e-mail aprovados tenham acesso, o potencial de comunicação interna é significativo.

Por exemplo, um aplicativo de voz "Pergunte ao RH" que lida com perguntas comuns sobre folha de pagamento, seguro, políticas de férias etc. Um aplicativo de voz de "verificação de estoque" que verifica instantaneamente os suprimentos atuais disponíveis para ver se uma determinada peça está em estoque. Ou um aplicativo “meeting killer” em que os participantes de uma equipe gravam uma pequena atualização do projeto e todas as atualizações são agrupadas em um único arquivo de áudio. Audição fácil, economia de tempo e sem necessidade de sala de conferência!

A ética está na frente

Falou-se muito sobre ética no Voice Summit 19. É animador ver os pioneiros de uma indústria emergente pensarem em algumas das ramificações sociais de seu trabalho desde o início, em vez de tentar manipular considerações éticas depois que o trem já saiu da estação (tosse, tosse — redes sociais — tosse, tosse).

O New York Times realizou um estudo completo de assinantes sobre a viabilidade e atitudes em relação a alto-falantes inteligentes e conteúdo de voz e descobriu que a esmagadora maioria dos usuários de alto-falantes inteligentes acredita que a voz padrão usada pelos alto-falantes é “branca” em sua inflexão e perspectiva. Isso, por si só, tem implicações.

Para combater isso, a KLM Airlines gravou as vozes de centenas de funcionários e construiu um mecanismo de linguagem poli-voz personalizado que deve ser o mais neutro possível.

Outras considerações éticas neste estágio inicial incluem a capacidade (ou falta dela) dos alto-falantes inteligentes de ouvir a tonalidade e responder de maneira diferente com base nas necessidades de empatia percebidas, etc.

E, claro, uma grande consideração é a desconfiança dos consumidores na natureza auditiva dos alto-falantes inteligentes em geral. Meu bom amigo Tom Webster, da Edison Research, apresentou seus dados que mostraram que a preocupação do consumidor com a privacidade do alto-falante inteligente aumentou acentuadamente no ano passado.

60% das pessoas estão preocupadas com a privacidade e o potencial de hackers acessarem suas informações por meio de alto-falantes inteligentes. #voice Clique para Tweetar

Por que isso importa

O conteúdo ativado por voz por meio de alto-falantes inteligentes e outros dispositivos é um campo emergente em estágio inicial. No entanto, a rápida adoção desses dispositivos sugere que a voz continuará a crescer como um ecossistema de interação. Manteremos você informado à medida que vemos essas tendências de voz se desenvolvendo e mudando ao longo do tempo. Enquanto isso, se pudermos ajudá-lo a pensar em sua própria abordagem de voz, informe-nos.