Hlavní obsah

Vyhledávač od Xeroxu pracuje podobně jako člověk

Tlačítkem Sledovat můžete odebírat oblíbené autory a témata. Články najdete v sekci Moje sledované a také vám pošleme upozornění do emailu.

18. 7. 2007, 9:17

V první polovině července představil Xerox FactSpotter - nový softwarový nástroj pro prohledávání dokumentů. Vědci z Evropského výzkumného centra Xeroxu (XRCE) v Grenoblu v něm spojili pokročilé lingvistické metody s poměrně intuitivním rozhraním, které dovoluje vyhledávat informace prostřednictvím běžného jazyka.

Článek

Narozdíl od tradičních vyhledávacích systémů pátrá FactSpotter nejen po klíčových slovech v rámci dokumentu, ale hodnotí také kontext dokumentu, který hledané výrazy obsahuje. FactSpotter například při vyhledávání hesla "Jan Svěrák" zobrazí nejen výsledky, které obsahují jeho celé jméno, ale i dokumenty, které jméno neosahují a přesto se ho týkají.

FactSpotter umí podle Xeroxu pročesat téměř jakýkoliv dokument bez ohledu na jazyk v němž je napsán, na jeho umístění, formát nebo typ. "Simuluje přitom způsob, jakým lidé přemýšlejí, hovoří a ptají se. Ve výsledku zobrazí pouze několik výstupů, které obsahují relevantní odpovědi na položený dotaz namísto stovek nepodstatných dokumentů," uvedli vývojáři.

Analýza významu dotazu a prohledávaného dokumentu by měla FactSpotteru výrazně usnadnit a zrychlit pátrání po konkrétních informacích. Například vyhledávání podkladů pro soudní líčení může díky FactSpotteru proběhnout velice rychle i při prohledávání miliónů stran dokumentace, tvrdí jeho výrobce.

"Náš vyhledávací engine překonal omezení typická pro vyhledávání podle klíčových slov a algoritmů současných nástrojů, které v praxi prohledávají pouze 40 % relevantních dokumentů, protože zadaná hesla jsou příliš omezující," uvedl Frédérique Segond, vedoucí výzkumu v oblasti sémantiky Evropského výzkumného centra Xeroxu.

Co říká Xerox o FactSpotteru

Systém umí vyhledávat prostřednictvím přirozeného jazyka namísto nutnosti přizpůsobit dotaz počítačové logice. Tradiční systémy pracují pouze s jednotlivými slovy a vyhledají dokumenty, které obsahují pouze přesný obraz zadaných slov bez ohledu na jejich funkci.

FactSpotter bere do úvahy kontext celého dokumentu namísto shluku několika slov v blízkosti klíčového slova a pracuje se vztahy mezi větami a odstavci.

FactSpotter dokáže rozpoznat obecné termíny jako "lidé" nebo "budova" a vyhledá slova, která spadají do takto definované kategorie

Výběr článků

Načítám

Vyhledat

Hlavní menu

záhlaví