8 трендов голосового контента на 2020 год

Опубликовано: 2019-08-01

Голос — это новый интерфейс, который скоро окружит нас во многих местах и во многих отношениях. Голосовой контент для устройств Amazon Echo, Google Home и Samsung разрабатывается крупными и малыми брендами.

Здесь, в Convince & Convert, мы разрабатываем стратегии голосового контента для наших клиентов, помогая им воспользоваться этой быстрорастущей возможностью взаимодействия с потребителями (подробнее о том, что мы делаем в голосовом контенте, см. Активированный контент).

Недавно я посетил Voice Summit 2019, который, как сообщается, является крупнейшим отраслевым собранием специалистов по голосовому контенту, разработчиков, технологов, поставщиков и аппаратных платформ.

Вот 8 основных тенденций голосового контента, которые я синтезировал во время своего пребывания на мероприятии и в ходе нашей работы с клиентами над голосовыми приложениями.

Лучший голосовой контент начинается с потребностей пользователей

Как и в первые дни мобильных приложений и даже веб-сайтов, среди стратегов и разработчиков существует тенденция думать: «Давайте сделаем голосовое приложение!» Вместо этого лучше тщательно рассмотреть и изучить, как потребители взаимодействуют с брендом, что им действительно нужно знать об этом бренде и является ли голосовой контент подходящим способом доставки. В конце концов, нет закона, согласно которому у вас ДОЛЖЕН быть контент, активируемый голосом. Это действительно Youtility? Если да, то стройте. Если нет, то не надо!

Например, навык Alexa «Спроси Purina» компании Purina родился из потребности потребителей понять, как ведут себя разные породы собак, и какая порода может быть наиболее подходящей в качестве нового питомца. По словам представителей Mobiquity, фирмы, разработавшей этот навык, они рассматривали возможность включения аудиорекламы при покупке корма для собак, но отказались от этой идеи, поняв, что она загромождает информационный актив.

Конвергенция голоса и чата

Наиболее эффективными голосовыми приложениями сегодня обычно являются новости, вопросы и ответы по поиску информации или игры. Что касается «брендовых вопросов и ответов», то, как и в упомянутом выше примере Purina, поток взаимодействия этих приложений очень похож на то, как потребители используют чат-ботов.

Пример мессенджера — Источник изображения: Отдел новостей KLM – KLM Royal Dutch Airlines

На самом деле, навык Alexa Ask Purina о породе собак вполне может работать в качестве чат-бота на веб-сайте и/или через Facebook Messenger или WhatsApp.

KLM Airlines тоже заметила это сближение, но подошла к нему с противоположной стороны. Они взяли свое очень успешное (и часто используемое) приложение для обмена сообщениями и портировали его на голосовой навык Alexa для устройств Amazon Echo.

Независимо от того, переходите ли вы от голосового к чату или от чата к голосовому, верно то, что многие варианты использования на основе информации будут работать одинаково в обоих сценариях.

Это лишь одна из причин, по которой мы рады сотрудничеству с Voicify. Voicify — это система управления голосовым контентом, которая также позволяет мгновенно портировать Alexa Skills и Google Apps в чат-бот с минимальными дополнительными усилиями по разработке.

Конвергенция голоса и визуальных эффектов

Как было упомянуто на мероприятии Voice Summit 19, интерфейсы, которые исторически были сначала визуальными (например, ваш ноутбук или дисплей автомобиля), теперь добавляют голос. Я использую Siri на своем MacBook каждый день. И наоборот, интерфейсы, которые исторически изначально были голосовыми (например, Amazon Echo), теперь включают визуальные эффекты.

Многие из недавно приобретенных интеллектуальных динамиков включают в себя экраны, а устройства Amazon Echo Show и Google Home Hub обычно стоят менее 100 долларов.

Это имеет несколько разветвлений.

Во-первых, это увеличивает сложность разработки голосовых приложений в геометрической прогрессии.

Во-вторых, это открывает множество дополнительных возможностей. Приложение Purina было бы полезнее, если бы вы могли видеть изображения пород собак на умной колонке с экраном. Не говоря уже о том, что голос быстрее на входе, но медленнее на выходе. По словам Тобиаса Денгеля из Willowtree, мы набираем в среднем 40 слов в минуту (слов в минуту), но произносим 130. И наоборот, мы можем читать со скоростью 250 слов в минуту, но можем слушать только 130. У этого есть большой потенциал для того, чтобы сделать голосовой контент по-настоящему многофункциональным. -модальный и удобный, если мы можем говорить то, что хотим, и читать результаты.

Мы набираем в среднем 40 слов в минуту (wpm), но произносим 130 слов. #voice Click To Tweet

Но в-третьих, если умные колонки станут в первую очередь устройствами с экранами, что отличает их от планшетов, маленьких ноутбуков или больших телефонов?

Хотя я предпочитаю умные колонки с экраном (лично я приверженец Google Home Hub), я не уверен, что стирание различий между умной колонкой и iPad в конечном итоге является победой для этих устройств.

Конфликт форматов становится проблемой

В течение короткой истории эпохи умных динамиков и голосового контента Amazon был большим боссом. Их устройства Echo, по сути, создали эту категорию, и это преимущество первопроходца плюс их мощная рекламная мощь позволили Amazon выйти далеко вперед в мире умных колонок.

Однако совсем недавно Google (и, в гораздо меньшей степени, Apple) вступили в бой со своими собственными аппаратными устройствами, стремясь превзойти эхо-эхо, с разной степенью успеха. Недавние отраслевые отчеты показывают, что доля Google на рынке умных колонок сейчас приближается к 25%, и, учитывая их глубокие карманы и заинтересованность в доминировании во всем, что связано с поиском (плюс их владение компанией умного дома Nest), они никуда не денутся.

Это предоставляет потребителям растущий выбор интеллектуальных динамиков с точки зрения аппаратного обеспечения, но создает запутанный и неэффективный процесс для разработчиков голосового контента. Сегодня технологические основы навыков Amazon Alexa и приложения Google Home сильно различаются. Не говоря уже о совершенно новой голосовой платформе Samsung Bixby, архитектура которой полностью противоположна тому, как это делают Amazon/Google.

Таким образом, мир голосового контента находится посреди дилеммы стандартов, которая пахнет Betamax против VHS, Internet Explorer против Netscape, ios против Android и Джо Джонас против имени его братьев.

Было бы НАМНОГО лучше, если бы существовал единый путь разработки голосового контента. Но я не сомневаюсь, что мы увидим подобное, поэтому системы управления голосовым контентом, такие как Voicify, сегодня критически важны. Внутри Voicify, когда мы создаем голосовой контент, технология Voicify автоматически настраивает и искажает взаимодействия и сценарии для работы как на устройствах Amazon, так и на устройствах Google без необходимости переписывать голосовое приложение. Победа, однозначно.

Маркетинг и развертывание имеют решающее значение

Как крупнейшая и старейшая экосистема, Amazon, конечно же, имеет наибольшее количество одобренных и запущенных голосовых приложений, более 60 000 только в Соединенных Штатах. Каждый день добавляется несколько десятков новых умений. И способность потребителей открывать для себя новые полезные навыки не является изюминкой нынешней системы Alexa. По сути, это онлайн и/или голосовой эквивалент прогулки по очень большой библиотеке с ошеломляющим разнообразием книг, многие из которых дерьмовые, и четвертого разряда библиотекаря, нерешительно отвечающего на вопросы между кусочками домашней запеканки.

Скажем так: если вы хотите, чтобы люди находили и использовали ваш голосовой контент, эта ответственность ложится на ВАШИ плечи. НИЧЕГО не ожидайте от Amazon и Google с точки зрения продвижения и доступности. Таким образом, вы не будете разочарованы, когда получите именно это.

При запуске голосового контента вам просто необходимо активировать тщательную, мультимодальную информационную и пробную кампанию, в которой используется комбинация вне дома, электронной почты, социальных сетей, прямой почтовой рассылки, заметок о заложниках и людей, переодевающихся как клоуны и стоящих. на углах улиц. Ваш пробег может отличаться.

Сегодня возможности голосового контента фактически превосходят понимание этих возможностей потребителями. Это интересная инверсия. Компания Comcast (один из наших любимых клиентов) выступила на панели Voice Summit 19 и сообщила, что в 2018 году ее клиенты произнесли около 9 МИЛЛИАРДОВ команд на свои голосовые пульты дистанционного управления X1. Но подавляющее большинство этих голосовых команд предназначено для тех же самых маленьких набор запросов. В настоящее время они работают над новыми способами научить клиентов всем остальным вещам, которые может делать голосовой пульт. По-своему вам нужно будет делать то же самое, когда вы развертываете свой голосовой контент.

Целенаправленно ограниченная функциональность

Один из моих любимых моментов на Voice Summit 19 высказала Мартина ван дер Ли из KLM Airlines, которая отметила, что, когда голосовые приложения имеют много функций, работа с ними становится более неприятной, а не менее.

Она точно подчеркнула, что голосовой контент с несколькими вариантами (по сути, набор приложений в зонтичном приложении) требует интерактивного взаимодействия между потребителем и устройством. «Вы хотите сделать это, или это, или это, или это, или это?» Это ад телефонного дерева, но через смарт-динамик. Нехорошо.

На данный момент лучший подход — найти достойный вариант использования и создать приложение голосового контента, которое будет делать всего пару вещей, причем очень хорошо. Лучше иметь несколько приложений или навыков, чем добавлять больше опций в существующее голосовое исполнение. Обратите внимание, что использование экранов в умных колонках (см. выше) может в конечном итоге решить эту проблему.

Изобилие возможностей внутреннего голосового контента

Хотя большинство голосовых навыков и приложений были разработаны для использования потребителем, существует много интересных вариантов использования голосового контента, ориентированного на внутреннюю аудиторию. Тем более, что использование приложения может быть заблокировано, так что доступ имеют только утвержденные лица/адреса электронной почты, потенциал внутренних коммуникаций значителен.

Например, голосовое приложение «Спросите HR», которое отвечает на распространенные вопросы о заработной плате, страховании, отпускных правилах и т. д. Голосовое приложение «Проверка запасов», которое мгновенно сканирует имеющиеся запасы, чтобы узнать, есть ли на складе конкретная деталь. Или приложение «Убийца встреч», в котором каждый участник команды записывает короткое обновление проекта, и все обновления объединяются в один аудиофайл. Простота прослушивания, экономия времени и отсутствие необходимости в конференц-зале!

Этика превыше всего

На Voice Summit 19 было много разговоров об этике. Приятно видеть, что пионеры в развивающейся отрасли с самого начала обдумывают некоторые социальные последствия своей работы, а не пытаются манипулировать этическими соображениями после того, как поезд уже давно ушел. покинули станцию (кашель, кашель — соцсети — кашель, кашель).

The New York Times провела тщательное исследование среди подписчиков жизнеспособности и отношения к умным колонкам и голосовому контенту и обнаружила, что подавляющее большинство пользователей умных колонок считают голос по умолчанию, используемый говорящими, «белым» в их интонации и внешнем виде. Это само по себе имеет последствия.

Чтобы бороться с этим, KLM Airlines записала голоса сотен сотрудников и создала специальный многоголосый языковой механизм, который должен быть максимально нейтральным.

Другие этические соображения на этом раннем этапе включают способность (или ее отсутствие) умных ораторов прислушиваться к тональности и реагировать по-разному в зависимости от предполагаемых потребностей в эмпатии и т. д.

И, конечно же, большое значение имеет недоверие потребителей к умным колонкам в целом. Мой хороший друг Том Вебстер из Edison Research продемонстрировал свои данные, которые показали, что беспокойство потребителей по поводу конфиденциальности умных колонок заметно возросло за последний год.

60% людей обеспокоены конфиденциальностью и возможностью хакеров получить доступ к их информации через умные колонки. #voice Нажмите, чтобы твитнуть

Почему это важно

Активируемый голосом контент с помощью интеллектуальных динамиков и других устройств — это новая область, находящаяся на ранней стадии развития. Тем не менее, быстрое внедрение этих устройств предполагает, что голосовая связь будет продолжать развиваться как экосистема взаимодействия. Мы будем держать вас в курсе, поскольку мы видим, что эти голосовые тенденции развиваются и меняются с течением времени. Между тем, если мы можем помочь вам продумать собственный подход к озвучиванию, сообщите нам об этом.