Dlaczego Google nie indeksuje strony?

  • Share

Stworzyłeś stronę, dodałeś nowy materiał, ale mimo to nie jest on widoczny w Google? Gdzie popełniłeś błąd? Przyczyn braku indeksacji danej podstrony może być wiele, dlatego warto, abyś wiedział, co może być powodem takiej sytuacji w tym konkretnym przypadku. Powinna Ci pomóc weryfikacja kilku kwestii.

Strony nie ma w Googale – dlaczego?

Wpisujesz tytuł danego materiału i nie znajdujesz go w Google? To jednak jeszcze nie oznacza, że wyszukiwarka go nie zindeksowała. Możliwe, że inne materiały zostały ocenione przez algorytm lepiej i to one z wielu względów są widoczne na wysokich pozycjach. Najprostszym sposobem na sprawdzenie tego, czy dana podstrona znajduje się w indeksie Google jest skorzystanie z polecenia site:. Jeśli nie ma jej w bazie, to wtedy zobaczysz następujący komunikat:

W przeciwnym wypadku wyświetli Ci się informacja o tym materiale. 

Jeśli chcesz sprawdzić, z jakiej przyczyny Google nie indeksuje contentu, skorzystaj z Google Search Console. Na górze strony znajduje się pole: „Sprawdź dowolny URL w…”. Wprowadź tam adres niezindeksowanego materiału i kliknij enter.

W tym przypadku za brak indeksacji odpowiada przekierowanie 301. Google zindeksowało podstronę, po czym znikała ona z bazy wyszukiwarki i powtarzanie tego nic nie daje. 

To tylko jedna z wielu możliwych przyczyn braku indeksacji witryny. Prześledźmy zatem, jakie mogą być inne powody.

Tag no index na stronie

Blokada indeksacji na etapie tworzenia witryny to zdecydowanie dobry krok, ale musisz pamiętać o tym, aby usunąć odpowiedzialny za to kod przed publikacją serwisu. 

Jeśli chcesz sprawdzić, czy problem tkwi w blokadzie indeksacji, to zerknij do kodu HTML strony. O tego typu problemie świadczy następująca treść:

Aby pozbyć się kłopotu, zmień kod na następujący:

Bez zaglądania do kodu strony możesz sprawdzić tę kwestię, korzystając z tego narzędzia. Jeśli wszystko jest w porządku, to wśród wyświetlonych informacji pojawi się również następująca:

Jeżeli jednak dowiesz się, że na stronie jest tag no noindexindex, to już musisz zerknąć do kodu strony i wprowadzić w nim zmiany. 

Twoja strona jest nowa i niepodlinkowana

Dopiero niedawno założyłeś stronę WWW, nie prowadzą do niej żadnej odnośniki? Robot Google nie ma jak dowiedzieć się o jej istnieniu. W przypadku witryn, do których nie kierują linki albo jest ich bardzo mało, oczekiwanie na indeksację może wymagać nawet tygodni. Skorzystaj wtedy z Google Search Console i ręcznie zgłoś dany materiał do indeksacji – w zdecydowanej większości przypadków w taki sposób przyśpieszysz moment, w którym materiał znajdzie się w Google. 

Nie zapominaj również o mapie strony – kiedy już ją utworzysz, to dodaj ją w Google Search Console. To również może pozytywnie wpłynąć na szybkość indeksacji.

Google nałożyło karę na Twoją witrynę

Strona może zniknąć z wyników wyszukiwania ze względu na to, że łamie prawo, nie stosuje się do wytycznych jakościowych od Google, znajduje się na niej wyłącznie SPAM, powstała po to, aby manipulować wynikami wyszukiwania i z innych powodów. 

W przypadku gdy na witrynę zostanie nałożona kara ręczna lub dojdzie do jej zbanowania, to wtedy w Google Search Console powinna się pojawić informacja na ten temat. To, czy strona została całkowicie usunięta z wyników wyszukiwania możesz bardzo łatwo zweryfikować – wystarczy, że wyślesz do Google zapytanie:

site:adresstrony.pl np. site:https://xann.pl/

Jeśli nie zobaczysz żadnych wyników ze swojego serwisu, to prawdopodobnie witryna została zbanowana.  

Blokada w pliku robots.txt

Ten błąd również często jest efektem tego, że osoba projektująca serwis zablokowała na ten czas dostęp do witryny internetowym botom, a po jej uruchomieniu nie usunęła kodu, który jest za to odpowiedzialny. Roboty, które analizują strony WWW, zaczynają wizytę w serwisie od robots.txt, gdyż na tej podstawie wiedzą, czy godzisz się na indeksowanie zasobów. Jeśli chodzi o boty popularnych wyszukiwarek, to generalnie stosują się one do Twoich zaleceń, ale fakt, że zablokujesz dostęp robotowi Google, nie daje gwarancji, że dany zasób nie pojawi się w SERP-ach. Wystarczy, że do materiału prowadzą linki – wtedy bot może ocenić, że podstrona jest wartościowa i należy ją zindeksować bez odwiedzania witryny. Wówczas jednak w wynikach wyszukiwania pojawi się informacja, że materiał został zindeksowany pomimo blokady.

Źródło: https://developers.google.com/search/docs/advanced/robots/intro?hl=pl

Kod, który powoduje, że witryna nie zostanie zindeksowana wygląda następująco:

User-agent: *

Disallow: /

Jeśli nie chcesz blokować robotom dostępu do strony, to zmień go na następujący:

User-agent: *

Disallow:

Zawartość pliku robots.txt możesz sprawdzić bez logowania się na serwer – wykorzystaj do tego tester od Google

Blokada w nagłówku HTTP

Kolejną przyczyną braku indeksowania jest blokada w nagłówku odpowiedzi HTTP. Jeśli znajduje się tam dyrektywa X-Robots-Tag: no index, to wtedy robot Google nie zindeksuje strony. Jeśli chcesz naprawić błąd, to musisz dokonać zmiany na serwerze. W zależności od tego, jakie jest oprogramowanie maszyny, będą to następujące pliki:

  • .htaccess – w przypadku serwerów z oprogramowaniem Apache,
  • główny plik .conf – na serwerach Nginx.

Te dwa rodzaje oprogramowania są najpopularniejsze – mają ponad 30 proc. udziału w rynku. Jak naprawić błąd? Wspomnianą dyrektywę zmień na X-Robots-Tag: index.

Jak wykryć, że takie jest źródło problemu? Nie musisz sprawdzać zawartości pliku na serwerze – skorzystaj z darmowego narzędzia: HTTP Header Checker

Dostęp do materiału zablokowany hasłem

W przypadku gdy dana podstrona Twojego serwisu dostępna jest wyłącznie po wprowadzeniu hasła, to trudno oczekiwać, że robot Google je odgadnie i zindeksuje zasób. Prawdopodobnie do SERP-ów trafi ewentualnie podstrona, na której należy podać wymagane dane. Jeśli chcesz, aby materiał znalazł się w Google, usuń wymóg podawania hasła. 

Blokada w systemie WordPress

Nawet jeśli żadna z osób, które pracują przy stronie nie zaglądała do pliku robots.txt., to blokada mogła zostać wprowadzona przypadkiem – w systemie WordPress. Jeśli chcesz to sprawdzić, to zaloguj się do panelu administracyjnego witryny, wybierz „Ustawienia”, a następnie „Czytanie”. Upewnij się, czy zaznaczona jest poniższa opcja:

Jak widzisz, programiści WordPress również wspominają, że nie ma gwarancji co do tego, że roboty wyszukiwarek zaakceptują te ustawienia. 

Dlaczego strona nie trafia do indeksu Google?

Opisaliśmy najczęstsze przyczyny, które skutkują tym, że witryna nie jest indeksowana przez robota. Możliwości jest więcej – choćby niedostępność serwisu. Bardzo prawdopodobne, że kłopoty z indeksowaniem wynikają z przeprowadzanej aktualizacji Google i powód nie leży po Twojej stronie. Każdy przypadek należy zatem rozpatrywać indywidualnie.