Milan Kryl

Kryl Blog - RSS

Expresivní chyba Google

04. 07. 2006 - 22:11

Zobrazená chyba Google není výjimkou. Nicméně jednomu uživateli z diskusních fór Digital Point se podařilo zobrazit chybu, která není jen nic neříkající hláškou a s trochou znalostí pozadí může odhalit mnohé.

Stačilo refreshovat několikrát tuto stránku v archivu a zobrazila se následující hláška:

pacemaker-alarm-delay-in-ms-overall-sum 2341989
pacemaker-alarm-delay-in-ms-total-count 7776761
cpu-utilization 1.28
cpu-speed 2800000000
timedout-queries_total 14227
num-docinfo_total 10680907
avg-latency-ms_total 3545152552
num-docinfo_total 10680907
num-docinfo-disk_total 2200918
queries_total 1229799558
e_supplemental=150000 --pagerank_cutoff_decrease_per_round=100
--pagerank_cutoff_increase_per_round=500 
--parents=12,13,14,15,16,17,18,19,20,21,22,23 
--pass_country_to_leaves --phil_max_doc_activation=0.5 
--port_base=32311 --production --rewrite_noncompositional_compounds 
--rpc_resolve_unreachable_servers --scale_prvec4_to_prvec 
--sections_to_retrieve=body+url+compactanchors --servlets=ascorer 
--supplemental_tier_section=body+url+compactanchors --threaded_logging
--nouse_compressed_urls --use_domain_match 
--nouse_experimental_indyrank --use_experimental_spamscore --use_gwd 
--use_query_classifier --use_spamscore --using_borg

Jde opravdu o chybu Google?

Reálnost chybové hlášky potvrzují některé indicie, které ukazují na stromovou strukturu serverů/clusterů vyhledávacích strojů (parents, pass_country_to_leaves,...).

Zajímavé počty

Docela pěkné číslo počtu dotazů: 1 229 799 558 by bylo vhodné umístit do nějakého časového intervalu. Zajímavé je používání spamscore podobně jako v případě emailových antispamů. Pokud je tato hláška z jiného než testovacího stroje (pravděpodobně ano --production), tak je z ní vidět, že se se spamem experimentuje - use_experimental_spamscore. Možná jedna z novinek v updatu Big Daddy způsobující viditelné problémy.

Z celkového počtu 10 680 907 vyhovujících dotazů (num-docinfo_total) je jich 2 200 918 přímo na disku aktuálního stroje/clusteru (num-docinfo-disk_total).

Parametry PageRanku

I pro počítání PageRanku je možné najít několik nastavení:

  • pagerank_cutoff_decrease_per_round=100
  • pagerank_cutoff_increase_per_round=500
  • scale_prvec4_to_prvec - přepočet vektoru PR?
  • use_domain_match - používat match domény

Podaří se vám najít v hlášce ještě něco dalšího zajímavého? Podělte se v komentářích. ;o)

Digital Point - Google Server Errors

 

Tip: Krátké zprávy a zajímavosti (rychlý přístup https://kryl.info/kratce)

Související