Tento projekt již není aktivní. Obsah je ponechán z archivních důvodů.

Tajné informace Google se dostaly ven!

Někdo ze společnosti Google zveřejnil informace na internetu, které jsou velmi přínosné těm, kdo se snaží o lepší umístění ve výsledcích ve vyhledávači Google. Jsou to informace o tom, jak lidští posuzovatelé v Google ručně hodnotí naše stránky (říká se jim Google Quality Raters). Čtěte dále, jak dosáhnout lepších výsledků.

O jaký dokument se jedná?

Tento dokument rozepisuje pokyny a pravidla, podle kterých Google (nikoliv algoritmus) raters ručně známkují stránky, nakládají se SPAMem a klasifikují vyhledávací výrazy.

Tento soubor má 44 stránek, takže teď vytáhnu pouze ty nejdůležitější informace, ale všem, kdo jsou odborníci na angličtinu, doporučuji nejdříve si dokument důkladně přečíst, jelikož obsahuje informace, které opravdu chcete vědět, pokud jste aktivním hráčem v SEO.

Role posuzovatele kvality

Každý z těchto posuzovatelů dostane tento dokument při příchodu do Google a toto jsou první pokyny, které obdrží. Google Rater musí:

  • prozkoumat a porozumět konkrétnímu výrazu, aby dokázal správně oznámkovat stránku
  • zhodnotit stránku (nikoli celý web) s pohledem na její relevanci k vyhledávacímu dotazu
  • vžít se do pohledu uživatele, který očekává co nejrelevantnější výsledek
  • přiřadit známku, kterou si vybere ze stupnice

Našel jsem také zajímavý článek, který dokonce tvrdí, že Google platí studentům $20 za hodinu, aby posuzovali výsledky vyhledávání.

Posuzují stránky, nikoli celé domény

Tyto posuzovatelé mají za úkol pouze hodnotit konkrétní stránku neboli landing page, na kterou se dokliknou přes výsledky vyhledávání (SERP). Hodnocení celých domén nebo celého webu je na administrátorech (např. Matt Cutts).

Hlavní je porozumět dotazům

Jak jsem tak pochopil z toho dokumentu, každý posuzovatel musí určovat relevanci s pohledem na jazyk a lokaci. Musí se vžít do každého jazyku, aby správně porozuměl uživateli. Zde je příklad, jak to funguje v praxi:

Směrnice na posuzovaní jazyku a lokace

Dejme tomu, že posuzovatel hodnotí výraz „George Bush”, a to v různých zemích.

  • Zhodnotí to tak, aby když uživatel v USA zadá George Bush, prvním výsledkem byly oficiální stránky George Bushe, poněvadž tento uživatel touží najít oficiální stránky.
  • Pak v druhém řádku (viz obrázek) zadá uživatel George Bush v čínštině, takže se předpokládá, že chce najít stránky o George Bushovi v čínštině.
  • V třetím případě hledá uživatel z Taiwanu George Bush v angličtině, takže výsledek by měly být oficiální stránky George Bushe v angličtině.

Také je například rozdíl, jestli uživatel hledá „football” v Americe, anebo v Anglii, takže toto vše musejí posuzovatelé zvážit předtím, než udělí známku.

Typy vyhledávacích dotazů

  • Navigační (Navigational) – Tyto dotazy jsou jednoduché výrazy; hlavně se jedná o značku, kterou mají vlastní oficiální stránky, například u “aukro” bude cílové URL oficiální stránka aukro.cz
  • Informativní (Informative) – Zde je to čistě informativní, takže uživatel hledá výraz, o kterém si chce přečíst více informací. Vyhledává literaturu.
  • Transakční (Transactional) – V tomto případě hledá uživatel stránku, kde bude moci učinit transakci, respektive zakoupit konkrétní produkt.

Stupnice hodnocení

Posuzovatel má za úkol udělit známku konkrétní stránce a dostane na výběr z těchto možností:

Velmi důležité (Vital)

Daný výraz je dominantní a zároveň navigační, takže se vždy jedná o oficiální stránky, což  musí posuzovatel poznat.

Důležité výsledky pro ČR

Dotaz

Důležité

Cílové URL

Popis

[ Ruzyně ]

Ano

www.prg.aero

Oficiální web letiště Ruzyně

[ Apple ]

Ano

www.apple.cz

Oficiální web společnosti Apple, jelikož je to dominantní interpretace

[ Seznam ]

Ano

www.seznam.cz

Oficiální web společnosti Seznam a.s.

Prvního místa pro tyto výrazy nedosáhnete ani v případě, že vybudujete milióny zpětných odkazů.

Užitečné (Useful)

V tomto případě je hodnocení „užitečné” přiřazeno webům, které obsahují:

  • velmi kvalitní a uspokojivé informace – web by měl na prvním místě zodpovědět dotaz naprosto přesně a nejlépe ze všech
  • důležitou podstránku webu, například u dotazu [ apple ] výsledky nabídnou internetový obchod, kde lze učinit transakci

V některých případech se ve výsledcích objevuje třeba seznam firem jako např. u výrazu [ drogerie ], kde na 4. místě je seznam prodejců chemie a drogerie (Výpis z firmy.cz). Tato stránka je také považována za užitečnou.

Relevantní (Relevant)

Raters přiřazují toto hodnocení stránce, která:

  • odpovídá pouze části dotazu
  • je z méně autoritativního zdroje než užitečné

Také se může stát, že známka relevantní může být přiřazena stránce, která by byla důležitá, kdyby neexistovala více dominantní interpretace dotazu, tudíž například pro vyhledávací výraz [ megan fox ] vidíme jako první výsledek z IMDb, nikoli oficiální stránky Megansafox.com.

Nerelevantní (Non relevant) a Off Topic

Známka nerelevantní se přiřazuje stránkám, které:

  • nejsou využitelné a nepřinášejí uživateli žádné informace, nicméně jsou stále trochu spojené s dotazem
  • jsou zastaralé a uživateli přinesou akorát mylné informace
  • jsou příliš specifické
  • jsou příliš rozsáhlé
  • mají nedostatek informací

Tyto stránky dostanou tu nejnižší známku.

Nástroje používané posuzovateli

Google Raters využívají systém, skrze který jednoduše známkují relevanci, označují SPAM, flagy, připisují komentáře apod.

Zde můžete zhlédnout video, které prezentuje tento systém s ovládacím panelem posuzovatelů

Pokud stále nevěříte, tak zde je i oficiální pracovní nabídka od Google.

Závěr

Z toho všeho opět plyne, že „obsah je král”, a pokud tedy budete psát ten nejlepší obsah, který získá přirozené odkazy, budete na vrcholu.

Jinak máme opět důkaz o tom, že Google manuálně posuzuje a ladí výsledky, a to nikoliv jen ty nejdůležitější, ale většinu z nich. Algoritmus od Google není tak ideální, jak vypadá. Je to v tom, že najímají tisíce raters k manuálnímu upravení, za účelem zlepšit a opravit chyby algoritmu.

Podle Arona Walla z seobook.com Google najímá 10 000 Google raters. Nevím, co je na tom pravdy, ale něco na tom bude, poněvadž tento chlapík úzce spolupracuje s technology z Google. Každopádně jestli to pravda je, pak Seznam nemá nikdy šanci dosáhnout relevantních výsledku jen pomocí algoritmu.

Zdroje: http://vizualbod.com/f/googlespamguidelines.html

Komentáře (32)

Adam | January 14th, 2009 @ 15:00:

Zato informace o tom, že informace jsou neživotné podstatné jméno, vám, vidím zůstala utajena 🙂 Omlouvám se za rejpání, ale “informace se dostalY” je silná káva.

Miroslav Stibůrek | January 14th, 2009 @ 15:45:

🙂 tohle jako rejpání brát ani nemůžů. Díky za upozornění, nevím jak jsem si toho nemohl všimnout.

Martin Malý | January 14th, 2009 @ 16:11:

Přirýpnu:

“informace na internetu, které jsou velmi relevantní těm, kteří se snaží” – čeština nezná “být relevantní komu”, pouze “být relevantní k čemu”. Pravděpodobně jste chtěl napsat, že jsou těm lidem užitečné, že?

“Jsou to informace o tom jak lidský posuzovatelé v Google” – lidský posuzovatelé mají být “lidští posuzovatelé”, ne?

Třetí osoba je oni klasifikují, nikoli “klasifikujou”

“doporučuji si dokument důkladně přečíst, jelikož obsahují informace” – dokument obsahují?

Dál jsem ani nečetl…

vv | January 14th, 2009 @ 16:28:

Z ceho vlastne vyplyva, ze se manualni hodnoceni primo promita do razeni vysledku?
Kdyby meli idealni algoritmus, tak by se neustale nezabyvali jeho vyvojem a nepotrebovali srovnavaci data…

Miroslav Stibůrek | January 14th, 2009 @ 16:54:

K čemu jinému by je asi najímali? Tyto lidi hodnotí výsledky, které slouží jako jeden faktor při řazení, zřejmě jako ten nejdůležitější faktor, jelikož člověk dokáže s větší přesností posoudit relevanci stránky.

Tím, že se snaží Google stále zlepšovat algoritmus v podstatě usnadňuje práci posuzovatelů. Netvrdím, že je doslova ideální, ale rozhodně má méně chyb než jeho konkurenti a proto je z mého hlediska skoro ideální, ale výraz “ideální” v mém světě neznamená naprosto bezchybný. Angelina Jolie je pro mě také ideální ženská, ale přitom by vlastně nebyla, kdybych vzal slovo “ideální” doslova.

Martin Malý | January 14th, 2009 @ 17:18:

Já vím že mě nebudete mít rád, ale “přínosné pro koho”, ne “přínosné komu”, tedy “jsou přínosné pro ty, kteří…” Ale co, je to venkoncem vaše vizitka 🙂

Martin Kupec | January 14th, 2009 @ 18:27:

To nemáte pravdu, “přínosné pro koho” vypadá sice glancovněji a čistěji, ale “přínosné komu” je možné taky. Jsem už sice ze školy přes 30 let pryč a gramatiku hodnotím spíš podle citu, než pravidel, ale nevidím v tom zásadní problém.

Miroslav Stibůrek | January 14th, 2009 @ 18:55:

Martin Malý: Martine taky si myslím, že “přínosné komu” zní naprosto normálně. To už se opravdu chytáte každé věty. A jestli Vás mám rád :)? Já také dokážu kritizovat i kritiku přijmout, ale většinou se snažím psát komentáře, které mají něco společného s kontextem. Co mě dokáže naštvat je člověk, který začne kritizovat gramatiku apod v internetovém světě, obzvlášt v blogu.

Snažil jsem se informovat své čtenáře o zajímavostech. Jestli chcete napsat nějakou kritiku na gramatiku a stylistiku, tak mi zašlete osobní e-mail, místo tapetování komentářů s naprosto nepřínosnými informacemi pro čtenáře. Zkuste se spíše držet tématu a přinést do diskuze nějaké zajímavé informace nebo Váš názor na věc. Děkuji.

Miroslav Stibůrek | January 14th, 2009 @ 19:13:

Chápu a uznávám, ale co s tím teď nadělám, člověk občas tu chybu prostě udělá. Na weblogy.cz to pořád visí a pořád nejspíš bude, jelikož tam asi zůstane původní příspěvek i přestože to aktualizují.

Ondřej Sláma | January 14th, 2009 @ 19:34:

Velice zajimavé. Ani byste neveřil, kolik lidí v agenturním světě (online marketing) i v zahraničí nevěří na jakýkoliv větší lidský zásah do výsledků. Samozřejmě známe případy penalizace (i když neveřím na -990 penalty apod.), ale ta myšlenka na stádo 10k studentů mi vždycky přišla nereálně úsměvná. Úsměvná mi v podstatě přijde i teď, ale je dobře možné, že je skutečná.

A ad oprava češtiny. Hrubka v titulku holt zatahá, ale v žádné jiné kultuře jsem nezažil takovou prudérnost, co se jazykové správnosti týče, jako v Češtině. Já se nakonec něco skutečně nabiflovat musel, ale mám absolutní pochopení pro někoho, kdo upřednostňuje informaci, její čerstvost a hodnotu, před byť jen stylistickou formou prezentace. Možná teď vyzním příliš kriticky, ale číst, jak někdo někoho opravuje, mě nejen unavuje, ale i odrazuje od dalšího čtení.

Miroslav Stibůrek | January 14th, 2009 @ 20:04:

Ondřej: Tak člověk si řekne, jak by mohli zrovna kontrolovat dotaz na který optimalizuji. Nevím jak Google dokáže zaplatit tyto studenty, když jim platí $20 za hodinu, ale ostatně Sergey Brin a Larry Page byli vždy socialisté, když se jednalo o jejich vyhledávač a o to mít co nejrelevantnější výsledky. Vždy mysleli pouze na uživatele a monetizace jim byla ukradená. Takže si myslím, že možné to opravdu je.

Kalmir | January 15th, 2009 @ 00:29:

Pane Stibůrku, nemůžu nechat být vaši větu, v níž pravíte mj. “…začne kritizovat gramatiku apod v internetovém světě, obzvlášt v blogu.” To je alibismus težkého kalibru.

Neznat svou mateřštinu mi přijde hloupé, ale to je můj názor a pro spoustu lidí nemusí mít správné použití češtiny význam.

Pokud ovšem píšete blog, který není osobním deníkem, je propojen s vaším podnikáním (pokud jste jen zaměstnanec, na věci to nic nemění) a v neposlední řadě má ambici oslovit široké publikum (narážím na to, že blog je agregován Weblogy.cz), pak je prostě snaha o správné psaní na místě. V jistém smyslu se jedná o veřejný text (nečte ho pouze pár kamarádů), a s takovým textem se pojí i nároky na kulturu projevu.

Jen na okraj: v celém textu vám chybí nebo přebývá větší než malé množství čárek.

Miroslav Stibůrek | January 15th, 2009 @ 10:59:

Kalmir: Pane Kalous, mě to jako alibismus nepříjde. Ja jsem svou chybu uznal a odpovědnost za to vzal, na toto téma tu padlo dost mých komentářů. Z mojí větou si stojím, toto je blog v kterým informuji čtenáře, kteří se o internetový marketing zajímají nebo chtějí zajímat. Vám snad přijde, že zde publikuji články, které jsou cílené na klienty? Zaměřuji se spíše na specifické a odbornější témata, než třeba co je to optimalizace pro vyhledávače? Jinak pokud chcete diskutovat o tomto tématu, tak mi napište osobní e-mail a rád si s Váma vyměním nározy.

JH | January 15th, 2009 @ 21:34:

Tedy pánové, nechápu proč se zde řeší gramatika a ne SEO a Google???

Miroslav Stibůrek | January 16th, 2009 @ 17:01:

Bohužel někteří jedinci neměli na SEO a Google nejspíš co říct, tak se chytli něčeho jiného.
Jinak budu rád za každý komentář na téma tohoto článku. Podělte se s Vaším názorem a pokud víte něco co jsem nezmínil, tak šup sem s tím. Pokud by byl zájem, tak bych i napsal pokračování na to jak Google raters vyhodnocují SPAM, což je další žhavé téma.

Kalmir | January 16th, 2009 @ 17:26:

Pane Stibůrku, ty někteří jedinci řeší něco jiného než SEO a Google proto, že jste je k tomu přímo vybídl. Hrubka v titulku – i to se stane. Ale mít v textu tohoto rozsahu více než 20 hrubek, to je do nebe volající. Nechápu, jak se pak můžete divit kritickým komentářům. Opravdu nechápu.

Miroslav Stibůrek | January 16th, 2009 @ 18:23:

Na tohle už jsem svůj názor snad jasně napsal. Jinak já už se opravdu nedivím ničemu. Vy jste copywriter, takže jistě byste ke kontextu článku měl co říct, tak se podělte o své zkušenosti a názory.

P.S. V případě, že chcete prodiskutovat něco jiného než téma tohoto článku, tak klidně mi můžete poslat e-mail

pangi | January 17th, 2009 @ 12:52:

Tak ten článok preboha nečítaj, keď ti tak veľmi vadia hrubky.. alebo to napíš autorovi emailom a neznečisťuj diskusiu k téme.

BigLebowski | January 17th, 2009 @ 15:54:

Je sranda, jak se vždycky vynoří x češtinářů a začnou komentovat chyby a hrubky…

To nemáte nic lepšího na práci?

claudius | January 17th, 2009 @ 16:02:

po precitani som si vsimol poznamku administratora z google, kde potvdzuje ze tam je skryty text na stranke.
rad by som spravil na vlastnu stranku taby, kde treba samozrejme pouzit skryte div a az po kliknuti sa zobrazi div.
nemaju v google automaticku detekciou (cital som ze ano) skrytych divov? to je to posledne aby mi nezaindexoval velmi dolezite linky v tabe (div), ktory je skryty pokial na neho niekto neklikne.
da sa to z pozorovani potvrdit/vyvratit?

Tomáš | January 18th, 2009 @ 16:08:

Hezký, ve světě je už tohle k dispozici nějakou dobu, ale v Čechách se o tom moc nemluví. Jen pro porovnání poslední verze je tušim v3.4 z prosince 2008, ale jako základ postačí i tahle starší.

Práce Quality Raterů sama o sobě nemůže nijak přímo ovlivnit pozice v SERPs. Pokud však narazí na nějakou chybu (relevance, snippet atd.) vše reportují. Report se pak dostane přímo k Engineerům z Web Search, kteří na základě toho mohou změnit algoritmus hledání. Nejedná se tedy o žádné manuální zásahy do pozic výsledků.

Vladimír Matějíček | January 25th, 2009 @ 14:57:

Omlouvám se jestli mi něco v textu článku uniklo, kvůli těm hrubkám se to vážně nedalo dočíst. Z čeho prosím vyplývá, že výsledky vyhledávání jsou ručně upravovány? Jr to pouze Vaše domněnka založená na informaci “Google manuálně hodnotí relevanci výsledků vyhledávání (a má na to dokonce manuál a tisíce dobře placených studentů)” nebo je to fakt?
Ne že bych měl ambice věnovat se nějak hlouběji SEO, ale dost mne zajímají zákulisní informace ohledně fungování Google, navíc od opravdového Profesionála.

Miroslav Stibůrek | January 27th, 2009 @ 12:54:

Claudius: Ano, také mají za úkol identifikovat skrytý text. Ve většině případech to dokáže naprosto přesně identifikovat Google automaticky. Pokud máš v CSS místo viditelného loga (které je klikající) link, tak to samozřejmě Google rozpozná, ale nepenalizuje. Pokud text nahradíš za obrázek v CSS, tak to Google rozpozná jako povolený skrytý text. Ten text ale musí vystihovat text vykreslený na obrázku, nesmíš použít black hat techniky alá keyword stuffing.

Tomáš a Vladimír: O manuální zásahy se také jedná. Pokud Google rater nalezne SPAM, tak ho také i tak identifikuje. Předpokládám, že stránky flagované jako SPAM jsou předané do oddělení kde pracuje Matt Cutts a tam manuálně upraví výsledky. Google engineeři tyto data také použijí k upravení algoritmu.

Nicméně, že by Google najímal tolik lidí, které musí ohodnotit milióny dotazů a pak tyto data použil pouze k zlepšení algoritmu? Nesmysl. Ano, některé data používá k zlepšení algoritmu, ale především najímá tyto studentíky k upravení výsledků. Engineeři by museli vynaložit se spousty dat každý den, což se mi nezdá jako reálný proces. Pokud samozřejmě Google také nenajímá desetitisíce engineerů. Na druhou stranu předpokládám, že některé manuální zásahy jsou kontrolovány administrátory a ne jen ponechány v ruce Google raterů.

P.S. Doporučuji se také přečíst článek od Dannyho Sullivana, který mluví o návratu lidí a lidského faktoru.

Vladimír Matějíček | January 27th, 2009 @ 13:01:

Takže jsem to pochopil správně, jedná se pouze o Vaši domněnku a ne o fakta. Díky za odpověď.
Btw … ti ENGENEEŘI, chudáčci. Zpracovávat tolik dat jen kvůli nějakému hloupému algoritmu. To jim vůbec nezávidím. Jistě je lepší každý den upravovat výsledky všech možných i nemožných výsledků vyhledávání ručně. 😉

Miroslav Stibůrek | January 27th, 2009 @ 13:15:

Koukám, že sarkasmus ja Vaše druhé Já :). Netvrdím, že ty data nepoužívají. Ale ve světě vyhledávačů vše automatizovat nejde, obzvlášt řazení výsledků s tou nejlepší relevancí, nebo rozpoznání SPAMu. S růstem internetových stránek a rozvíjející se internetové ekomoniky je pro vyhledávače čím dál tím težší dosahovat relevantních výsledků.

ivzez | February 4th, 2009 @ 21:26:

Je myslím naprosto jasné, ža ani sebelepší algoritmus nemůže postihnout všechno. Je dobře, že si toho jsou v Google vědomi, a že se snaží vyhledávací algoritmus doplnit lidským faktorem. Relevantnost výsledků na určitý dotaz podle mého názoru lépe posoudí lidé.

Tomáš Martínek | March 1st, 2009 @ 17:43:

Jak si myslíte, že je to skrytým textem a obrázkem? Pokud grafik udělá občas nějaký prvek, který je v plánu použít jako nadpis, tak je občas nutné dát tento obrázek jako pozadí tagu H1 a skryje se tím text.

Je nějaké doporučené množství? Například budu mít obrázek, který má dvě slova, případně něco jiného (logo). Budu chtít z toho obrázku nadpis, tak za pomoci CSS dám skrytý text, který vystihne obsah obrázku. Kolik by mělo být slov? Určitě to nebude nějakých 20 slov, ale zda je něco rádoby doporučeného, aniž by to bylo posuzováno jako SPAM.

Miroslav Stibůrek | March 2nd, 2009 @ 00:07:

Tato metoda, také zvaná jako Fahrner Image Replacement (Shea) metoda je běžný postup a děláme to hlavně kvůli přístupnosti webu.

Pokud text vystihuje daný obrázek, tak je to naprosto legitimní a co se týče limitace v počtu slov, tak to je v podstatě jedno v nadpisech. Ty stejně bývají většinou krátký a výstižný. U klasických obrázků je dobré vyplnit alt atribut a spíše popsat ten obrázek v jeho okolí.

Jinak skrývání textu za obrázkem bude považováno za spam, až Vás vyhledávače zabanuje, takže je to spíše o experimentování. Co se týče Google Raters, tak jelikož to jsou lidi, tak poznají přesně jaký je záměr – jestli zpřístupnit obrázek, nebo oblafnout vyhledávače.

Kubin | November 5th, 2009 @ 23:32:

To je úplně normální, každý lepší výzkum testuje algoritmus na ručně vyhodnocených datech. To jsme dělali už ve škole při počítačovém rozpoznávání obrazu, při počítačovém zpracování mluveného slova. I ve firmě při zpracovávání bilologických signálů. Kvalitní testovací množina je základ kvalitního výrobku. Když si ji můžou dovolit české univerzity i české firmy, proč ne google.


Pingbacks

  1. Když máte značku, můžete vám být SEO někde | Domeček z Karet
  2. Úloha manuálnych hodnotení vo vyhľadávačoch | SEO chat
  3. Začínáme optimalizovat pro Live Search | Blog SEO-Profesionál.cz

Zanechte komentář




Pravdepodobne nemate nainstalovany flash player. Stahnete si ho a nainstalujte. Adobe Flash Player