Milan Kryl

Kryl Blog - RSS

Google analýza podle vzhledu stránek

05. 01. 2005 - 19:05

S nástupem do nového roku bych se chtěl dopustit malé předpovědi. Myslím si, že nás v blízké době čeká další novinka od Google. A tím bude zahrnutí vhledu stránky do hodnocení relevance výsledků vyhledávání.

V září jsem napsal článek na Lupu o Blokové analýze. Článek vychází z teorie, která je veřejně přístupná a všeobecně známá. Googlu ji jen zbývá zapracovat do svého vyhledávání.

Co k tomu bude ještě potřebovat?

  • screenshotovač stránek - není problém udělat z Gecka nějaký výstup do obrázkového souboru (ostatně i seznam.cz má nyní náhledy stránek v katalogu - ač nevím nakolik je to užitečné... )
  • systém který obrázek rozpozná - na OCR programu již pořádně zapracoval, protože již aktivně pracuje na indexaci několika miliónů knih univerzitních knihoven v programu Google Print.
  • zapracování algoritmu do hodnocení relevance

Co to přinese?

  • lepší relevanci - při rozčlenění na bloky může různým textům ve stránce dodat různý důraz
  • potlačí podvádění - skrytý text nebude vidět, takže se nemusí brát vůbec v úvahu
  • podpora firefoxu - pokud by použil pro screenshoty Geckové jádro, tak by ještě více podpořil používání prohlížečů na tomto jádře založených (ještě více tvůrců stránek by na něj brala ohled - ač již tak možná dávno činí... :) )

Kdy se dočkáme?

Pokud je již něco takového napadlo, troufám si tvrdit, že některý ze zaměstnanců se tímto problémem již dávno zaobírá (když ne pracovně, tak ve svém přiděleném volnu pro vlastní projekty).

Protože firma Google čítá již velký počet zaměstnanců, musíme počítat i se schvalovacími, testovacími procesy, než se produkt stane veřejně dostupným. V případě změny relevance výsledků hledání to může být ještě o něco déle.

Na tuto vychytávku bych se začal těšit někdy v polovině letošního roku nebo spíš koncem roku 2005. Uvidíme, jestli s něčím podobným Google přijde. ;o)

Napsal k tématu

 

Tip: Nevíte čím obdarovat nejbližší? Nechte je napsat Ježíškovi.

Související