Googlebot

Co je to Googlebot? Co se děje dříve, než něco napíšete do vyhledávače?

Princip vyhledávání na Internetu

Než začne uživatel hledat na Internetu prostřednictvím vyhledávače, je ze strany vyhledávače potřeba naplnit databázi ve které uživatel bude vyhledávat. K jejímu naplnění slouží roboti (boti), kteří soustavně prohledávají internetové stránky a provádějí jejich tzv. indexaci.

Na základě mnoha různých analýz je nakonec internetové stránce přiřazeno nějaké hodnocení („rank“).

Pro největší světový vyhledávač Google pracuje Googlebot.

Činnost Googlebota

Googlebot provádí 2 ze tří činností, ze kterých je složeno internetové vyhledávání. Jedná se o:

  • Crawling,
  • Indexing
  • a Serving

Crawling

Crawling je plavání v Internetu. Jde o proces, při kterém Googlebot prochází internetové stránky, objevuje nové, registruje jejich změny a přidává je do databáze (indexu). Algoritmus procesu procházení určuje, které stránky navštívit, jak často a také v jakém počtu z každé domény.

V průběhu procházení stránek jsou zaznamenávány nové odkazy, změny na stránkách a také zaniklé stránky.

Četnost návštěv není možné komercializovat a Google to ani neumožňuje. Pokud chce vlastník stránek získat lepší návštěvnost od Googlebota, je třeba stránky pravidelně aktualizovat a případně je možné poskytnout mapu stránek prostřednictvím Google Webmaster Tools.

Indexing

Indexing – indexování je proces zařazování stránek do databáze. Jde prakticky o přiřazení stránky k jednotlivým slovům v databázi tak, aby po zadání slov mohlo dojít k zobrazení stránky ve výsledcích vyhledávání. V procesu zařazení dochází k načtení textové části stránky (včetně alternativních textů u obrázků a netextových prvků). Google na svých stránkách v této souvislosti upozorňuje, že tímto procesem nemůže projít většina Flashových animací a dynamických stránek. Také v případě příliš dlouhých stránek nemusí být načten úplně celý jejich obsah.

Serving

Po zadání dotazu do vyhledávače je prohledána databáze a jsou vybrány výsledky. Výsledky hledání je nutné řadit a řazení se provádí na základě více než dvou set různých faktorů mezi něž patří rovněž PageRank. Jde o vyjádření míry důležitosti stránky na základě odkazů z jiných stránek. Zjednudušeně lze říci, že každý odkaz vedoucí na danou stránku zvyšuje její pagerank. Není to ale úplná pravda, protože některé odkazy vznikají zneužíváním této znalosti a dochází k vytváření tzv. spamových odkazů. Google pracuje na algoritmech pro rozpoznávání „důležitosti“ odkazů a nekalé praktiky penalizuje. Odkazy získávají svoji váhu, pokud jde o odkazy související s kvalitním obsahem.

Další podrobnosti uvádí Google na svých stránkách anglicky.

Zdroje

  • http://www.google.com/support/webmasters/bin/answer.py?answer=70897&topic=8460