Milan Kryl

Komentáře k příspěvku

Centrum - Inteligentní vyhledávání

[ 1 ] Pavel Prostřední - 10.6.05 01:26:50

Já jsem to tušil! :) Ale nečekal jsem, že tam bude i fulltext. To mi z betaverze nedošlo. Tím pádem se morfeo.cz stává okrajovou záležitostí.

[ 2 ] Kalda - 10.6.05 02:10:48

Moc hezké ;)
Obzvlášť kombinace fulltextu s katalogovými informacemi mě uchvátila.

Každopádně si neodpustím jedno malé rýpnutí. Jistě se shodneme na tom, že kromě počtu stránek ve fulltextu je důležitá i perioda, s jakou robot aktualizuje data z webu. U některých webů je dokonce třeba častá aktualizace, protože informace zastarávají. Tady bohužel už Morfeo trochu zaostává za Jyxem a Seznamem (zůstaneme-li v ČR), byť se to poslední dobou začíná poměrně lepšit.

Ačkoliv jsem s relevancí výsledků spokojen daleko více, než např. u Seznamu, je třeba při hledání aktuálních informací většinou šáhnout po jiném fulltextu.

[ 3 ] Milan Kryl (WWW) - 10.6.05 08:01:18

[3] Ano Morfeo má zatím o něco pomalejší aktualizaci, nicméně je to na druhou stranu zatím vyváženo tím, že během jednoho měsíce jsou všechny stránky obnoveny a aktualizovány (méně často se vám stane, že najdete stránku, která pak neexistuje).

Nicméně častější aktualizací bude jedna z prvních věcí, která se bude v blízké době napravovat. Díky za komentář.

[ 4 ] Radim Smicka (WWW) - 10.6.05 08:59:35

Kalda: Pokud mam seradit roboty tak jak prochazi cesky web tak od nejrychlejsiho
Jyxo
Google
MSN
Morfeo
Yahoo
Seznam

Podle meho nazoru patri robot Seznamu mezi nejpomalejsi (podle informace z logu nekolika serveru). Morfeo Holmes neni taky zadny rychlik, ale Seznam predjede ;).

[ 5 ] Kalda - 10.6.05 11:05:14

[4] Pokud to berete podle Bazose, tak taky vezmu pro porovnani jeden inzertni server (par tisic UIP)
Videl bych to tam takto
Jyxo
Google
Yahoo
MSN
Seznam
Holmes

Seznam stranku pomerne brzo najde... Bohuzel, jak psal Milan Kryl, v indexu mu strasne dlouho visi uz vyrazene stranky.

Kupodivu u tohoto serveru jsou odchylky poctu stahnutych stranek Google - Yahoo - MSN pomerne male, obcas se vzajemne preskakuji, ale z dlouhodobeho hlediska to tam vychazi takto.

[ 6 ] Pachollini (WWW) - 10.6.05 11:25:06

Mně to nové vyhledávání dvakrát nic nenašlo, čemuž jsem se dost divil, ale po chvíli studia té stránky jsem našel takovou malou hlášečku, že je server přetížen. Doporučoval bych tu chybovou stránku nějak upravit, aby bylo jasné, oč jde.

[ 7 ] Radim Smicka (WWW) - 10.6.05 12:28:05

Kalda: Ano Bazos je hlavni zdroj, ale nebojte porovnavam i konkurenci a jine stranky (ty ne z logu). Seznam mi z nejakeho duvodu odmita stahnout vic nez 1000 stranek z jedne subdomeny, asi nejaky limit podle dulezitosti stranky (doufam, ze ne rucni :) ). Coz ma ovsem za nasledek, ze nestahuje nove, ale ceka az vypadne nejaka starsi a pak to doplni na tu 1000.

Co se tyka starych stranek (ty co davaji 404), tak tam mam nejhorsi zkusenosti z Googlem. Pres rok mu hazu 404, stahl si to uz 10, ale v indexu to ma jako supplemental result. By me zajimalo jestli to vubec nekdy vyhodi. Podle zkusenosti Seznamu staci 2x 404 a je to z indexu venku.

[ 8 ] jilm (WWW) - 10.6.05 22:13:16

A v čem je ta změna, vyjma integrace odkazů na další služby Centra?

[ 9 ] Milan Kryl (WWW) - 10.6.05 23:21:34

[8] Hlavně v integraci fulltextu do výsledků hledání. Před změnou byly výsledky doplňovány fulltextem až po výpisu sekcí, nyní již je to fulltext a případně doplňovaný souvisejícími informacemi z katalogu.

[ 10 ] Yuhů (WWW) - 10.6.05 23:31:33

Milane, odkud je prosím ten druhý screenshot http://kryl.info/obrazek/centrum/hled ? Já to nějak nemůžu najít.

Stejně jsem to asi nepochopil. Když si dám na Centru hledat Krétu, tak je tam jedenáct katalogových zápisů, v nich nějak záhadně zanořená cestovní kancelář Iason a teprve od třináctého místa pokračují výsledky fulltextu. To je důraz na fulltext?

Na jiných dotazech to vypadá lépe. Podle mě je to krok správným směrem. Už skoro čtyři roky nemůžu pochopit, proč Centrum skoro vůbec nepoužívá fulltext, když ho má v Česku nejlepší.

[ 11 ] Acci (WWW) - 11.6.05 10:07:10

Yuhů, používáš Google?
http://www.google.com/search?hl=cs&am

[ 12 ] Cuba (WWW) - 11.6.05 10:10:00

Jeto všechno krásné, ale pr* platné když admini starajícíse o největší BFU(čti masy) nastaví jako HomePage seznam. To se pak těžko ukrajuje z internetového koláče že?

[ 13 ] Milan Kryl (WWW) - 11.6.05 16:57:49

[10] http://search.centrum.cz

To co vidíš jako pozice z katalogu jsou ještě koupené garance první stránky. Nicméně pokud nezadáš jednoslovné obecné dotazy, tak už ti ten fulltext vyjede čistý.

[12] Co se dá dělat, budou muset mít důvod, aby těm BFU dávali HP Centrum.cz .)

[ 14 ] Radim Smicka (WWW) - 11.6.05 17:31:41

[13]To vysvětluje to, kde se berou sem tam dupicity. Je to tím, že ta stránka má garanci první strany a pak se objevila ještě v normálních výsledcích.

Ta odpověď zněla jako kdyby se garance první stránky úplně zrušily. Ten postup, že se již nebudou prodávat, ale doběhnou ty zakoupené mi připadá logický.

Centrum rozhodně vykročilo správným směrem.

[ 15 ] Milan Kryl (WWW) - 11.6.05 18:53:42

[14] To ja zajímavé, pokud vím, tak by k zobrazování duplicitních stránek nemělo docházet. Pokud se tomu tak někde děje, tak se jedná o chybu. (kdyžtak pošlete na email milan.kryl@netcentrum.cz)

[ 16 ] Kalda - 12.6.05 11:37:12

[7]Radim Smicka: Snad se Milan nebude zlobit, ze mu tu rozebirame Seznam ;)
Pamatuji si, jak po spusteni fulltextu na Seznamu se na klicove slovo objevovaly vysledky z jednoho serveru, pokud mel hodne subodmen. Napr. si pamatuji, ze na prvnich vice nez 230 strankach vysledku bylo 6 ruznych webu. Takze doufam, ze mate pravdu, ze to neni rucni limit...
Jinak problem se zhruba max. 1000 odkazy mam take. Navic ono seznamu funguje nejak divne parametr site, abych urcil pocet indexovanych stranek (na ruzna klicova slova z menu, ktera jsou v kazde strance, vraci vyrazne ruzny pocet vysledku)

Google 404 - mam stejny problem, jeste horsi je to s Google Images. Navic mam problem se strankou, ktera byla v minulosti v robots.txt, ze ji nechce Google stale zaindexovat.

Pro Milana Kryla:
Skoda, ze v samotnem katalogu neni rozsireni, ktere by nabidlo v okenku archiv dane stranky, protoze jsem ted narazil na stranku, ktera mela momentalne nedostupny server, takze jsem ji musel nejprve vyhledat fulltextem.
Jeste jsem zjistil, ze do vyhledavani mi to dalo vysledek z katalogu, ale tuhle stranku vubec neznal fulltext, ackoliv je stranka v katalogu jiz dele nez mesic.
A posledni pripominka - jeste nedavno mi fungovalo wap.centrum.cz , nyni mi nefunguje. Skoda, tu sluzbu jsem mel rad, treba na PocketPC + GPRS jsem to mel radsi, nez webovou verzi. Navic, kdyby k tomu Centrum zprovoznilo fulltext ve WAPovych strankach, byla by to bomba ;) Ale uznavam, WAP neni v techto koncinach prilis uzivanou sluzbou.

[ 17 ] Milan Kryl (WWW) - 12.6.05 15:47:55

[16] Archiv stránek v katalogu by neměl být problém dodělat.

Na wap se zkusím poptat a případně dám vědět (kdyžtak mi pošlete na sebe nějaký kontakt).

[ 18 ] Yuhů (WWW) - 13.6.05 17:01:11

[13] děkuju za odpověď.

Opravdu mi to zní jako kdyby se garance první strany na Centru rušily. Je to tak?

[ 19 ] Milan Kryl (WWW) - 13.6.05 18:58:45

[18] Asi to znáš z vlastní zkušenosti. Požadavky produktového oddělení se většinou diametrálně liší od požadavků oddělení obchodního.

Momentálně je stav takový, že byly navázány na přesnou shodu se zadávanými dotazy. (tedy by pro uživatele měly být mnohem relevantnější než v minulosti)

Jestli dojde k jejich zrušení bohužel momentálně nejsem schopný říct. Ale osobně bych to strašně rád uvítal.

Tyto stránky obsahují jen moje vlastní názory a pohledy. Nemusí se shodovat s oficiálním pohledem firmy.

Přidání komentáře

Přidávání komentářů bylo pozastaveno.