O futuro da pesquisa em 2023: o Google torna-se multimodal

Publicados: 2022-12-15

O futuro da pesquisa em 2023 Google torna-se multimodal

Nos últimos meses, o Google vem lentamente aclimatando o público a uma nova maneira de pensar sobre a pesquisa que provavelmente será uma marca registrada de nossas futuras interações com a plataforma.

A pesquisa na Internet tem sido, desde o início, uma atividade baseada em texto, baseada no conceito de localizar a melhor correspondência entre a intenção do pesquisador e um conjunto de resultados exibidos na forma de links de texto e trechos de conteúdo.

Mas nesta fase emergente, a busca está se tornando cada vez mais multimodal – capaz, em outras palavras, de lidar com entrada e saída em vários formatos, incluindo texto, imagens e som. Na melhor das hipóteses, a pesquisa multimodal é mais intuitiva e conveniente do que os métodos tradicionais.

Pelo menos parte do ímpeto para o movimento do Google em pensar na pesquisa como uma atividade multimodal vem do surgimento de plataformas de mídia social como Instagram, Snapchat e TikTok, todas as quais evoluíram as expectativas do usuário na direção de recursos altamente visuais e imediatos. interação com o conteúdo. Como uma empresa de internet veterana, o Google se moveu para acompanhar essas expectativas em constante mudança.

O surgimento da pesquisa múltipla

Representando a próxima evolução de ferramentas como o Google Images, a empresa concentrou imensos recursos de desenvolvimento no Google Lens, Vision AI e outros componentes de sua sofisticada tecnologia de reconhecimento de imagem.

O Google Lens está bem estabelecido como uma ferramenta de pesquisa que permite traduzir rapidamente sinais de trânsito e menus, pesquisar produtos, identificar plantas ou procurar receitas simplesmente apontando a câmera do telefone para o objeto que deseja pesquisar.

Este ano, o Google introduziu o conceito de “multipesquisa”, que permite aos usuários adicionar qualificadores de texto às pesquisas de imagens no Lens. Agora você pode tirar uma foto de um vestido azul e pedir ao Google para procurá-lo em verde ou adicionar “perto de mim” para ver os restaurantes locais que oferecem pratos correspondentes a uma imagem.

O ícone de imagem junta-se ao ícone de voz

Em mais um passo para atrair o público para a pesquisa baseada em imagens, o Google também adicionou recentemente um ícone de imagem à caixa de pesquisa principal em google.com.

O ícone do Google Voice
Nova página inicial do Google com microfone e ícones de imagem para pesquisa por voz e foto

O ícone da imagem ocupa seu lugar ao lado do microfone, o prompt do Google para pesquisar por voz. Nos primeiros dias do Amazon Alexa e seus semelhantes, a pesquisa por voz deveria dominar a Internet. Isso não aconteceu exatamente, mas a pesquisa por voz desde então cresceu para ocupar um nicho útil em nosso arsenal de métodos para interagir com dispositivos, conveniente quando falar é mais rápido ou seguro do que digitar. Da mesma forma, ouvir o Google Assistant ou o Alexa lendo os resultados da pesquisa em voz alta às vezes é preferível a ler o texto na tela.

Isso nos leva à visão de uma interface de pesquisa multimodal: os usuários devem ser capazes de pesquisar por, com e para qualquer meio que seja mais útil e conveniente para uma dada circunstância.

Um comando de voz para “mostre-me fotos de unicórnios” pode funcionar melhor para uma criança que ainda está aprendendo a ler; uma entrada baseada em imagem potencialmente transmite mais informações do que qualquer frase de texto curta em relação à cor, textura e recursos detalhados de um produto de varejo. É seguro presumir que qualquer combinação de texto, voz e imagem será suportada em breve para entradas e saídas.

Marketing no mundo da busca multimodal

O que tudo isso significa para os profissionais de marketing? Aqueles com metas de aumentar a exposição de negócios e suas ofertas online farão bem em focar sua atenção em duas prioridades.

A primeira é fornecer conteúdo para consumo em buscas que não seja apenas promocional, mas também útil. Com os consumidores sendo treinados para fazer perguntas de todos os tipos e receber respostas que os ajudem a se manter informados e tomar melhores decisões , os profissionais de marketing precisam competir para fornecer respostas e conselhos, além de promover a disponibilidade de seus produtos ou serviços. O Google usa Featured Snippets, por exemplo – as respostas exibidas no topo dos resultados de pesquisa – como conteúdo a ser lido em voz alta pelo Google Assistant quando os usuários fazem perguntas, oferecendo uma grande oportunidade de aumentar a exposição da marca e ser reconhecido como uma voz autoritária do setor.

Trecho em destaque de leitura do Assistente do Google
Aqui, a Nike ganha uma posição de destaque como um trecho em destaque para uma consulta informativa; O Google Assistant lerá esta resposta quando um usuário fizer a mesma pergunta por meio da interface de voz

Otimização de imagem é a chave

A outra grande prioridade para os profissionais de marketing na era da pesquisa multimodal é a otimização da imagem. A tecnologia Vision AI do Google fornece à empresa um meio automatizado de entender o conteúdo das imagens. Com sua tecnologia de reconhecimento de imagem - uma faceta importante do Knowledge Graph do Google, que cria vínculos entre entidades como uma forma de entender o conteúdo da Internet - a empresa está transformando os resultados de pesquisa para pesquisas locais e de produtos em experiências imersivas de primeira imagem, combinando imagens em destaque com intenção de busca.

Os profissionais de marketing que publicam conteúdo de fotos atraentes em locais estratégicos vencerão nos resultados de pesquisa ricos em imagens do Google. Em particular, sites de comércio eletrônico e páginas de destino de lojas, perfis de negócios do Google e listas de produtos carregadas no Merchant Center do Google devem exibir fotos que correspondam aos termos de pesquisa para os quais uma empresa espera classificar. As fotos devem ser complementadas com texto descritivo, mas o Google pode interpretar e exibir fotos que correspondam à consulta de um pesquisador, mesmo sem descrições de texto.

Uma busca por “joias feitas à mão em Sedona, Arizona”, por exemplo, retorna os Perfis de negócios do Google no resultado, cada um exibindo uma foto extraída da galeria de imagens do perfil que corresponde ao que o usuário estava procurando.

Galeria de imagens de pesquisa do Google
Uma pesquisa por “joias feitas à mão sedona az” mostra fotos correspondentes extraídas dinamicamente pelo Google da galeria de imagens de cada perfil comercial

Subindo na Pesquisa

A nova experiência de compra na busca, anunciada pelo Google neste outono, pode ser invocada digitando “comprar” no início de qualquer consulta de um produto. Os resultados são dominados por imagens de sites de varejo, correspondentes precisamente à consulta de pesquisa inserida pelo usuário.

Alimentos e varejo estão na vanguarda da pesquisa multimodal. Nessas categorias, os profissionais de marketing já precisam estar trabalhando ativamente na otimização de imagem e marketing de conteúdo com vários casos de uso de mídia em mente. Para outras categorias de negócios, a pesquisa multimodal está chegando.

Sempre que for mais conveniente usar imagens no lugar do texto ou voz no lugar da exibição visual, o Google desejará disponibilizar essas opções em todas as categorias de negócios. É melhor se preparar agora para o futuro multimodal.


Sobre o autor

Com mais de uma década de experiência em pesquisa local, Damian Rollison , diretor de insights de mercado da SOCi , concentrou sua carreira na descoberta de maneiras inovadoras de ajudar empresas grandes e pequenas a serem notadas online. As colunas de Damian aparecem com frequência em Street Fight, Search Engine Land e outras publicações, e ele é um palestrante frequente em conferências do setor, como Localogy, Brand Innovators, State of Search, SMX e muito mais.