Milan Kryl

Kryl Blog - RSS

Google vás sleduje

09. 03. 2005 - 21:39

Nastavením cookie pro celou doménu Google.com má jistě nějaké své důvody. Některé se dají vyvodit z obsahu cookie, ale některé informace se zatím vyvodit nepodařily. Slouží neznámé parametry pro jednoznačnou identifikaci a sledování uživatelů?

Sledovací cookie

Pokud se podíváte do cookies vašeho prohlížeče a někdy jste navštívili stránky Google.com, tak tam najdete cookie pro doménu google.com v podobném tvaru:

GPREF=ID=17b2159fe108b291:LD=en:NR=10:TM=1109766400:LM=1108736400:S=bA5DWyL8tVmJrILc

Dvojtečkou jsou oddělené proměnné a jejich hodnoty. Do této cookie byly uloženy proměnné ID, LD, NR, TM, LM a S. Od svých hodnot jsou odděleny rovnítkem a mezi sebou se oddělují dvojtečkou. Platnost cookie je nastavována velmi optimisticky až o 33 let dopředu.

Jednotlivé parametry podrobně

ID je pravděpodobně unikátní identifikátor každého uživatele, který Google navštívil. Je ve tvaru 16timístného hexadecimálního čísla. Je tedy 16^16 = 1,84467441 x 1019 možností, které lze přidělit. I pokud by službu Google používal každý, tak je šance kolize velmi malá. Můžeme jej tedy doopravdy brát jako unikátní číslo.

Další proměnnou je LD. To je nastavení jazyka, který jsem si zvolil v nastavení Google. Následuje ještě počet výsledků na stránku v proměnné nazvané jako NR. Pokud se nastavení bude lišit ještě v jiných volbách, je dost možné, že se bude projevovat také v této cookie přidáním dalších proměnných.

TM je timestamp, kdy byla cookie vygenerována. Pokud se jedná o klasický UNIX timestamp, tak je to počet vteřin od 1. ledna 1970 a převést na datum si jej můžete převést například na stránce Unix Timestamp Converter. Je vidět, že naše znamená datum vytvoření: 2. března 2005, 12:26:40.

LM vypadá nedůležitě, protože se jedná o timestamp, kdy uživatel naposled změnil nastavení služby. Lépe řečeno je to datum poslední změny hodnoty cookie (Last Modified).

Hodnota S bude pravděpodobně kontrolní součet celé cookie, aby nedošlo k nějaké její modifikaci a případnému narušení celého systému.

ID pro sledování uživatelů?

Proč je ale v cookie obsažena unikátní hodnota ID. Je to součást nějakého interního systému měření návštěvnosti v Google? Jedná se o vaše unikátní identifikační číslo, aby vás mohl Google sledovat. Pamatovat si vaše chování, stránky, které v systému vyhledáváte a informace, které navštěvujete? To bude vědět pravděpodobně jen několik programátorů vývojového oddělení v Google.

Google Print Hack

Celá tato analýza cookies vedla ještě kousek dál. Jeden z běžných uživatelů zjistil, že se podle cookies sleduje počet zobrazených stránek ve službě Google Print. Fulltextové vyhledávání je nad celou knihou, ale po nalezení knihy je uživatel limitován pouze na několik stránek. Je to omezení proti kopírování knih. Toto omezení se podařilo prolomit. O algoritmu, jak si takové stahovátko vyrobit se dočtete v článku Google's Cookie and Hacking Google Print

 

Tip: Krátké zprávy a zajímavosti (rychlý přístup https://kryl.info/kratce)

Související