Przyszłość wyszukiwania w 2023 r.: Google przechodzi na tryb multimodalny
Opublikowany: 2022-12-15
W ostatnich miesiącach Google powoli przyzwyczajał opinię publiczną do nowego sposobu myślenia o wyszukiwaniu, który prawdopodobnie będzie znakiem rozpoznawczym naszych przyszłych interakcji z platformą.
Wyszukiwanie w Internecie od samego początku było czynnością tekstową, opartą na koncepcji zlokalizowania najlepszego dopasowania między intencją osoby wyszukującej a zbiorem wyników wyświetlanych w postaci linków tekstowych i fragmentów treści.
Ale w tej wschodzącej fazie wyszukiwanie staje się coraz bardziej multimodalne — innymi słowy, może obsługiwać dane wejściowe i wyjściowe w różnych formatach, w tym tekst, obrazy i dźwięk. W najlepszym przypadku wyszukiwanie multimodalne jest bardziej intuicyjne i wygodne niż tradycyjne metody.
Przynajmniej część bodźca dla Google w kierunku myślenia o wyszukiwaniu jako działalności multimodalnej pochodzi z rozwoju platform mediów społecznościowych, takich jak Instagram, Snapchat i TikTok, z których wszystkie ewoluowały oczekiwania użytkowników w kierunku wysoce wizualnych i natychmiastowych interakcja z treścią. Jako doświadczona firma internetowa, Google postanowił nadążyć za tymi zmieniającymi się oczekiwaniami.
Pojawienie się Multisearch
Reprezentując kolejną ewolucję narzędzi, takich jak Obrazy Google, firma skoncentrowała ogromne zasoby rozwojowe na Google Lens, Vision AI i innych komponentach swojej zaawansowanej technologii rozpoznawania obrazów.
Google Lens ma dość ugruntowaną pozycję jako narzędzie wyszukiwania, które pozwala szybko tłumaczyć znaki drogowe i menu, badać produkty, identyfikować rośliny lub wyszukiwać przepisy, po prostu kierując aparat telefonu na obiekt, którego chcesz szukać.
W tym roku Google wprowadził koncepcję „multisearch”, która umożliwia użytkownikom dodawanie kwalifikatorów tekstowych do wyszukiwania obrazów w Lens. Możesz teraz zrobić zdjęcie niebieskiej sukience i poprosić Google o wyszukanie jej na zielono lub dodać „w pobliżu”, aby zobaczyć lokalne restauracje oferujące dania pasujące do zdjęcia.
Ikona obrazu dołącza do ikony głosu
W kolejnym kroku w kierunku nakłonienia opinii publicznej do wyszukiwania opartego na obrazie, Google dodał ostatnio także ikonę obrazu do głównego pola wyszukiwania na google.com.

Ikona obrazu zajmuje miejsce obok mikrofonu, zachęcając Google do wyszukiwania głosowego. We wczesnych latach Amazon Alexa i im podobnych wyszukiwanie głosowe miało przejąć Internet. Tak się nie stało, ale od tego czasu wyszukiwanie głosowe zajęło użyteczną niszę w naszym arsenale metod interakcji z urządzeniami, co jest wygodne, gdy mówienie jest szybsze lub bezpieczniejsze niż pisanie na klawiaturze. Tak samo słuchanie Asystenta Google lub Alexy czytających na głos wyniki wyszukiwania będzie czasami lepsze niż czytanie tekstu na ekranie.
To prowadzi nas do wizji multimodalnego interfejsu wyszukiwania: użytkownicy powinni mieć możliwość wyszukiwania za pomocą dowolnego medium, które jest najbardziej przydatne i wygodne w danych okolicznościach, za pomocą i za pomocą takiego medium.
Polecenie głosowe „pokaż mi obrazki jednorożców” może najlepiej działać dla dziecka, które wciąż uczy się czytać; wejście oparte na obrazie potencjalnie przekazuje więcej informacji niż jakakolwiek krótka fraza tekstowa dotycząca koloru, tekstury i szczegółowych cech produktu detalicznego. Można bezpiecznie założyć, że dowolna kombinacja tekstu, głosu i obrazu będzie wkrótce obsługiwana zarówno dla danych wejściowych, jak i wyjściowych.
Marketing w świecie wyszukiwania multimodalnego
Co to wszystko oznacza dla marketerów? Ci, których celem jest zwiększenie widoczności firm i ich ofert online, dobrze zrobią, jeśli skupią swoją uwagę na dwóch priorytetach.
Pierwszym z nich jest dostarczanie treści do wykorzystania w wyszukiwaniu, które są nie tylko promocyjne, ale także przydatne. Ponieważ konsumenci są szkoleni w zadawaniu wszelkiego rodzaju pytań i otrzymywaniu odpowiedzi, które pomagają im być na bieżąco i podejmować lepsze decyzje , marketerzy muszą konkurować, aby udzielać odpowiedzi i porad, oprócz promowania dostępności ich produktów lub usług. Google używa na przykład fragmentów polecanych — odpowiedzi wyświetlanych u góry wyników wyszukiwania — jako treści do odczytania na głos przez Asystenta Google, gdy użytkownicy zadają pytania, co daje doskonałą okazję do zwiększenia widoczności marki i zyskania uznania jako autorytatywny głos w branży.


Optymalizacja obrazu jest kluczem
Drugim ważnym priorytetem dla marketerów w dobie wyszukiwania multimodalnego jest optymalizacja obrazu. Technologia Google Vision AI zapewnia firmie zautomatyzowany sposób rozumienia treści zdjęć. Dzięki technologii rozpoznawania obrazów — ważnemu aspektowi Grafu wiedzy Google, który tworzy powiązania między jednostkami w celu zrozumienia treści internetowych — firma przekształca wyniki wyszukiwania dla wyszukiwań lokalnych i produktów w wciągające, oparte na obrazie doświadczenia, dopasowując polecane obrazy do intencja wyszukiwania.
Marketerzy, którzy publikują angażujące zdjęcia w strategicznych miejscach, zyskają przewagę w bogatych w obrazy wynikach wyszukiwania Google. W szczególności witryny handlu elektronicznego i strony docelowe sklepów, profile firm Google i wykazy produktów przesyłane do Merchant Center Google powinny przedstawiać zdjęcia odpowiadające wyszukiwanym hasłom, dla których firma ma nadzieję znaleźć się w rankingu. Zdjęcia powinny być uzupełnione tekstem opisowym, ale Google może interpretować i wyświetlać zdjęcia pasujące do zapytania wyszukującego nawet bez opisów tekstowych.
Na przykład wyszukiwanie hasła „ręcznie robiona biżuteria w Sedona w Arizonie” zwróci w wyniku profile firm Google, z których każdy wyświetla zdjęcie pobrane z galerii zdjęć profilu, które odpowiada temu, czego szukał użytkownik.

Powstanie w wyszukiwaniu
Nowy sposób zakupów w wyszukiwarce, ogłoszony jesienią tego roku przez Google, można wywołać, wpisując „sklep” na początku dowolnego zapytania o produkt. W wynikach dominują obrazy z serwisów detalicznych, dopasowane precyzyjnie do zapytania wprowadzonego przez użytkownika.
Żywność i handel detaliczny znajdują się w czołówce wyszukiwań multimodalnych. W tych kategoriach marketerzy muszą już aktywnie pracować nad optymalizacją obrazu i marketingiem treści, mając na uwadze różne przypadki użycia mediów. W przypadku innych kategorii biznesowych nadchodzi wyszukiwanie multimodalne.
Wszędzie tam, gdzie wygodniej jest używać obrazów zamiast tekstu lub głosu zamiast wyświetlania wizualnego, Google będzie chciał udostępnić te opcje we wszystkich kategoriach biznesowych. Najlepiej już teraz przygotować się na multimodalną przyszłość.
o autorze
Mając ponad dziesięcioletnie doświadczenie w wyszukiwaniu lokalnym, Damian Rollison , dyrektor SOCi ds. analiz rynkowych, skoncentrował swoją karierę na odkrywaniu innowacyjnych sposobów pomagania dużym i małym firmom w zostaniu zauważonym w Internecie. Felietony Damiana często pojawiają się w Street Fight, Search Engine Land i innych publikacjach, a on jest częstym prelegentem na konferencjach branżowych, takich jak Localogy, Brand Innovators, State of Search, SMX i inne.
