Co to jest Googlebot? Wszystko, co musisz wiedzieć o indeksowaniu Google
Opublikowany: 2022-04-22Zoptymalizowana strona internetowa ma kluczowe znaczenie dla rankingu w Google i znalezienia się przez grupę docelową. Optymalizacja pod kątem wyszukiwarek (SEO) pomaga uczynić Twoją witrynę bardziej czytelną i dostępną zarówno dla robotów wyszukiwarek, jak i dla ludzi.
Każda wyszukiwarka ma własne unikalne roboty sieciowe, ale większość strategów wyszukiwania skupia się tylko na jednym — Googlebocie.
Czym więc jest Googlebot i jak możesz zoptymalizować pod nim swoją witrynę?
Co to jest Googlebot?
Googlebot to nazwa robota indeksującego Google. „Odczytuje” strony internetowe i indeksuje je, dzięki czemu mogą być udostępniane wyszukiwarkom w odpowiedzi na ich wyszukiwane hasła.
Googlebot ma dwa kluczowe zadania:
- Nieustannie eksploruje strony internetowe w poszukiwaniu nowych linków, dzięki czemu może indeksować jak najwięcej treści, oraz
- Gromadzi nowe informacje o stronach, aby zapewnić aktualność indeksu Google.
Chociaż jest tylko jedna nazwa, w rzeczywistości istnieją dwa rodzaje Googlebotów: jeden na telefon komórkowy (Googlebot Smartphone) i jeden na komputer (Googlebot Desktop). Pierwszy z nich sprawdza, jak dobrze Twoja witryna renderuje się na smartfonach i tabletach, a drugi skupia się na wersji na komputery stacjonarne.
Optymalizacja Googlebota polega na ułatwieniu Google dostępu, indeksowania i „odczytywania” Twojej witryny. Chociaż wiele taktyk SEO wpływa na wydajność wyszukiwania, istnieje kilka niezbędnych implementacji, które poprawiają „indeksowalność” Twojej witryny i mogą bezpośrednio wpływać na to, czy Twoje strony są dostępne dla użytkowników Google. Oprócz taktyk SEO na stronie i poza nią, Twoja strategia SEO powinna obejmować techniczne cele SEO, które pomogą Ci zwiększyć szanse na pojawienie się w wynikach wyszukiwania.
Po co skupiać się tylko na Googlebocie? A co z robotami indeksującymi innych wyszukiwarek? Cóż, ponieważ Google ma obecnie 92% rynku wyszukiwania, większość docelowych odbiorców prawdopodobnie z niego korzysta. Poniższe zalecenia powinny jednak ułatwić wszystkim robotom indeksującym czytanie Twoich stron.
Jak działa indeksowanie Google?
Kiedy Google indeksuje witrynę, zasadniczo dodaje ją do swojej bazy wiedzy i odnotowuje, o czym są strony, jak są przyjazne dla użytkownika i nie tylko. Ale skąd Googlebot w ogóle wie, że witryna istnieje i powinna być zaindeksowana?
Jeśli tworzyłeś wcześniej stronę internetową, prawdopodobnie zauważyłeś, że nie uzyskałeś żadnego ruchu organicznego od razu po jej opublikowaniu. Dzieje się tak, ponieważ musisz poinformować Googlebota o swojej witrynie, aby mógł indeksować Twoje strony. Możesz to zrobić, przesyłając mapę witryny XML do Google Search Console (wcześniej Narzędzia Google dla webmasterów).
Googlebot indeksuje Twoją witrynę za pomocą map witryn i baz danych linków z poprzednich indeksowań. Gdy znajdzie nowy link w Twojej witrynie, dodaje go do listy stron do odwiedzenia. Zarówno Googlebot Desktop, jak i Googlebot Smartphone zaktualizują indeks w przypadku napotkania uszkodzonych linków lub innych problemów.
Jest to indeks, z którego pobiera Google po otrzymaniu zapytania. Następnie wykorzystuje wskazówki kontekstowe z wyszukiwania, aby określić, jak uszeregować odpowiednie wyniki.
Jak często Google indeksuje moją witrynę?
Google indeksuje adresy URL z różnymi częstotliwościami. Podczas gdy niektóre adresy URL mogą być indeksowane codziennie, inne mogą być indeksowane tylko co tydzień lub co miesiąc. O ile nie zaznaczysz inaczej w pliku robots.txt lub w tagach meta robots, Googlebot będzie próbował przejść do każdej strony w Twojej witrynie i po drodze rejestrować informacje, aby lepiej zrozumieć treść i zaktualizować jej indeks.
Chociaż do tej pory koncentrowałem się głównie na robotach Googlebot, chcę zauważyć, że w rzeczywistości istnieje wiele robotów Google. Pełną listę robotów Google znajdziesz tutaj.
Jeśli zastanawiasz się, jak często Google przemierza i indeksuje Twoją witrynę, przejdź do Google Search Console (GSC). Raport statystyk indeksowania znajdziesz w ustawieniach.

5 kroków do optymalizacji witryny pod kątem Googlebota
Wykonaj te pięć prostych kroków, aby Twoja witryna była dostępna dla robotów-pająków wyszukiwarek, aby Twoje strony można było znaleźć w wynikach wyszukiwania.
1. Niech Twój kod będzie prosty
Dużą częścią zwiększania indeksowania witryny jest prostota. Google nie indeksuje Flasha, Ajaxa, ramek, plików cookie, identyfikatorów sesji ani DHTML, a indeksowanie kodu JavaScript trwa dłużej, ponieważ musi go renderować.
Podczas tworzenia witryny należy przestrzegać ogólnych i jakościowych wskazówek Google, aby uniknąć problemów z indeksowaniem i ułatwić indeksowanie stron.
2. Sprawdź swój robots.txt
Plik robots.txt informuje Googlebota, do których adresów URL może uzyskać dostęp w Twojej witrynie. Użyj dyrektyw robot.txt, aby uniknąć przeładowania witryny żądaniami i zaoszczędzić więcej budżetu na indeksowanie stron, które mają być indeksowane przez wyszukiwarki. Bez pliku robots.txt Googlebot może spędzać zbyt dużo czasu na indeksowaniu multimediów, plików zasobów lub innych nieistotnych stron, których nie chcesz uwzględniać w wynikach wyszukiwania. Robots.txt to dyrektywa obejmująca cały protokół. Powinieneś mieć tylko jedną w swojej witrynie, chyba że masz wiele subdomen. Aby zarządzać Googlebotem i robotami dla poszczególnych stron, użyj metatagów robotów.
3. Użyj linków wewnętrznych
Linki wewnętrzne to hiperłącza, które przenoszą Cię z jednej strony na drugą w tej samej witrynie. Mogą być nawigacyjne (menu, paski boczne, nagłówki, stopki) lub kontekstowe (umieszczone w treści strony). Aby ułatwić Googlebotowi znajdowanie Twoich stron i zrozumienie ich wzajemnych powiązań, użyj linków wewnętrznych w celu podkreślenia hierarchii witryny. Wszystkie Twoje strony powinny być ze sobą w jakiś sposób połączone. Na przykład strona główna powinna zawierać linki do stron usług, studiów przypadku i bloga. Każdy z nich powinien następnie zawierać linki do odpowiednich stron.
Dowiedz się więcej o sprawdzonych metodach tworzenia linków wewnętrznych tutaj.
Sprawdź swój raport linków w GSC, aby upewnić się, że najważniejsze strony — takie jak strona główna i strony usług — otrzymują najwięcej linków. Oznacza to dla Google, że są to najważniejsze strony w Twojej witrynie.

4. Utwórz mapę witryny XML
Aby ułatwić Googlebotowi indeksowanie Twojej witryny, udostępnij mapę witryny XML, która porządkuje wszystkie Twoje strony, aby robot indeksujący mógł szybko zrozumieć hierarchię witryny. (Nie masz pewności, czym jest mapa witryny XML, zobacz przykład mapy witryny i dowiedz się więcej tutaj).
Prześlij mapę witryny XML do Google za pośrednictwem GSC podczas procesu weryfikacji.
Jeśli nie korzystasz z systemu zarządzania treścią (CMS), który dynamicznie aktualizuje mapę witryny, pamiętaj, aby ręcznie zaktualizować mapę witryny XML i przesłać ją ponownie po wprowadzeniu zmian w hierarchii witryny. Wystarczy kliknąć „Mapy witryn” na lewym pasku bocznym. Pomoże to upewnić się, że Google indeksuje odpowiednie strony w Twojej witrynie.


5. Poproś o indeksowanie Google
Gdy publikujesz nową stronę lub wprowadzasz istotne aktualizacje istniejącej treści, nie musisz czekać, aż Google je znajdzie — poinformuj Google, że masz nową lub zaktualizowaną stronę do przeskanowania, prosząc o indeksowanie.

Zaloguj się do swojego GSC i wprowadź adres URL, który chcesz zindeksować, po lewej stronie ikony lupy u góry strony i naciśnij Enter.
Google zauważy, że pobiera dane.

A następnie poinformuje Cię, czy Twoja strona jest już zindeksowana.

Jeśli tak nie jest, możesz poprosić o indeksowanie. Jeśli Twoja strona jest zaindeksowana i dokonałeś na niej istotnych zmian, możesz również poprosić o indeksowanie.

Jeśli często dodajesz strony do swojej witryny, na przykład nowy wpis na blogu lub stronę produktu, uwzględnij ten proces w swoich najlepszych praktykach, aby mieć pewność, że wszystkie Twoje strony zostaną bezzwłocznie zindeksowane.
rekomendowane lektury
- Jak korzystać z Google Search Console
- Jak dodać użytkowników do Google Search Console
Cztery sposoby analizowania sposobu, w jaki Googlebot indeksuje Twoją witrynę
Po zoptymalizowaniu witryny, aby ułatwić jej odczytanie robotowi indeksującemu wyszukiwarki, warto dwukrotnie sprawdzić, czy jest ona prawidłowo przeszukiwana i indeksowana.
Statystyki indeksowania
Twoje statystyki indeksowania pokazują, ile wszystkich żądań indeksowania wysłał Googlebot do Twojego serwera oraz kiedy i czy wystąpiły jakiekolwiek problemy.

Raport statystyk indeksowania w Google Search Console pokazuje również, co znalazł Googlebot (odpowiedzi na indeksowanie), typy plików, które napotkał, czy Googlebot odkrywał nowe strony, czy ponownie indeksował stare oraz jakie typy Googlebotów zostały użyte do zindeksowania Twojej witryny.
Kliknięcie elementu zamówienia w raporcie statystyk indeksowania dostarczy dodatkowych informacji. Na przykład, jeśli chcesz dowiedzieć się, które strony zwracają błąd 404, kliknij ten wiersz w polu odpowiedzi na indeksowanie, aby przejść do listy adresów URL, których Googlebot nie mógł znaleźć i kiedy ostatnio próbował indeksować te strony.
Klikając elementy zamówienia „odśwież” lub „odkrycie” w obszarze Cel indeksowania, możesz sprawdzić, które adresy URL ostatnio zindeksował Googlebot. Jeśli zauważysz, że Twoje najnowsze strony nie zostały zindeksowane, możesz je łatwo przesłać za pomocą paska wyszukiwania u góry raportu.

Błędy indeksowania
Błędy indeksowania występują, gdy wyszukiwarki nie mogą uzyskać dostępu do jednej z Twoich stron. W raporcie indeksowania możesz zidentyfikować dwa rodzaje błędów indeksowania przez Googlebota, które mogą negatywnie wpłynąć na SEO:
- Błędy witryny: w przypadku wystąpienia błędu witryny Googlebot może nie być w stanie zaindeksować Twojej witryny. Błędy witryny mogą być spowodowane brakującymi lub niedostępnymi plikami robot.txt, błędami rozpoznawania DNS lub problemami z łącznością z serwerem.
- Błędy adresu URL: w przypadku błędu adresu URL Googlebot nie może zaindeksować określonej strony. Możesz mieć wiele błędów URL naraz.
Moz wykonuje świetną robotę, dzieląc się sposobami naprawiania błędów indeksowania.
Zablokowane adresy URL
Jeśli istnieją sekcje Twojej witryny, do których robot indeksujący Google nie ma mieć dostępu, możesz określić te katalogi w pliku robots.txt, aby uzyskać informacje o tym, jak roboty powinny indeksować Twoją treść.
Sprawdź w GSC liczbę zablokowanych adresów URL rozpoznawanych przez Google, aby upewnić się, że plik robots.txt działa. Jeśli liczba zablokowanych adresów URL jest mniejsza niż powinna, konieczna będzie edycja pliku robots.txt. I odwrotnie, jeśli liczba jest wyższa niż powinna, mogą istnieć strony nieumyślnie zablokowane przed indeksowaniem, które mają pojawiać się w wynikach wyszukiwania.
Parametry adresu URL
Parametry adresu URL, znane również jako ciągi zapytań, umożliwiają dodanie dodatkowych informacji na końcu dynamicznych adresów URL. Jeśli odwiedzałeś treści podzielone na strony, takie jak wyniki wyszukiwania produktów w witrynie e-commerce, prawdopodobnie widzisz „?page=2” lub coś podobnego na końcu adresu URL strony. To jest parametr adresu URL. Te parametry można również wykorzystać do:
- Filtry treści
- Tłumaczenia
- Wyszukiwanie w witrynie
- Śledzenie
Jeśli chcesz używać parametrów w swoich adresach URL, zastanów się, czy chcesz, aby były one dostępne i indeksowane, ponieważ mogą one prowadzić do poważnych problemów, takich jak powielanie treści, marnowanie budżetu na indeksowanie i problemy ze śledzeniem.
Możesz wykonać te kroki, aby zablokować indeksowanie sparametryzowanej zawartości.
Dowiedz się więcej o narzędziach Google dla SEO
Google oferuje różnorodne narzędzia, które pomogą Ci mierzyć wydajność Twojej witryny. Skorzystaj z nich, aby monitorować i ulepszać swoją strategię SEO.
Nasz Przewodnik po Narzędziach Google przeprowadzi Cię przez każde z bezpłatnych narzędzi SEO od Google i podzieli koncepcje techniczne na praktyczne i łatwe do zrozumienia rozdziały pełne dodatkowych zasobów.

Przewodnik po narzędziach Google dla SEO
Pobierz ten przewodnik, aby dowiedzieć się, jak najlepiej wykorzystać bezpłatne, zaawansowane narzędzia udostępniane przez Google w celu poprawy procesów i wydajności SEO.