Milan Kryl

Kryl Blog - RSS

Bloková analýza nahrazuje PageRank

30. 08. 2004 - 05:04

Poslední dobou ubývá PageRanku na významu. Pravděpodobně je tomu tak i pro zaměstnance Googlu. Vidět je to ale jinde, výzkumy pokračují a z publikovaných zpráv se dá leccos vyčíst.

Pro hodnocení stránek při vyhledávání ve vyhledávači Google se od samého počátku používá PageRank. Ten se počítá pro každou stránku, která je uložena v databázi. Po zadání hledané fráze se stránky třídí také podle tohoto magického čísla.

Klasický PageRank

PageRank se podle autorů vyhledávacího algoritmu počítají komplexně z celých stránek. Bere se v potaz počet odkazů na další stránky a jejich váha. Stránka, která má vysoké hodnocení a odkazuje na stránku jinou, jí také předává vyšší hodnotu. Naopak stránka s malým hodnocením nemůže odkazované stránce moc hodnoty přidat, protože ji sama moc nemá.

Při zkoumání těchto vzájemných odkazů se nesleduje z jaké části stránky odkaz je. Stejnou váhu mají odkazy, které jsou v menu a stejnou odkazy, které jsou v obsahu - textu stránky, nějakého článku nebo podobně.

Bloková analýza stránky

Tento nedostatek se již snaží vědci úspěšně řešit. V technické zprávě - Block-level Link Analysis najdete výsledky delšího výzkumu. Klasický PageRank je rozšířen tak, že se bere v potaz i umístění odkazu v některém z bloků. Tyto bloky jsou vytvořeny visuálním algoritmem, který stránku vyrenderuje do tvaru, jak by ji viděl uživatel a následně na ní hledá logické bloky.

Pokud vás tato problematika zajímá trochu víc, tak si přečtěte celou zprávu a případně další. Je zajímavé sledovat, jakým směrem se výzkumy ubírají. V budoucnosti se dočkáme takové kvality zpracování, že bude nerozpoznatelné zda stránku do databáze hodnotil člověk a nebo prošla výkonným programem.

 

Tip: Krátké zprávy a zajímavosti (rychlý přístup https://kryl.info/kratce)