Článek
Narozdíl od tradičních vyhledávacích systémů pátrá FactSpotter nejen po klíčových slovech v rámci dokumentu, ale hodnotí také kontext dokumentu, který hledané výrazy obsahuje. FactSpotter například při vyhledávání hesla "Jan Svěrák" zobrazí nejen výsledky, které obsahují jeho celé jméno, ale i dokumenty, které jméno neosahují a přesto se ho týkají.
FactSpotter umí podle Xeroxu pročesat téměř jakýkoliv dokument bez ohledu na jazyk v němž je napsán, na jeho umístění, formát nebo typ. "Simuluje přitom způsob, jakým lidé přemýšlejí, hovoří a ptají se. Ve výsledku zobrazí pouze několik výstupů, které obsahují relevantní odpovědi na položený dotaz namísto stovek nepodstatných dokumentů," uvedli vývojáři.
Analýza významu dotazu a prohledávaného dokumentu by měla FactSpotteru výrazně usnadnit a zrychlit pátrání po konkrétních informacích. Například vyhledávání podkladů pro soudní líčení může díky FactSpotteru proběhnout velice rychle i při prohledávání miliónů stran dokumentace, tvrdí jeho výrobce.
"Náš vyhledávací engine překonal omezení typická pro vyhledávání podle klíčových slov a algoritmů současných nástrojů, které v praxi prohledávají pouze 40 % relevantních dokumentů, protože zadaná hesla jsou příliš omezující," uvedl Frédérique Segond, vedoucí výzkumu v oblasti sémantiky Evropského výzkumného centra Xeroxu.
Co říká Xerox o FactSpotteru |
Systém umí vyhledávat prostřednictvím přirozeného jazyka namísto nutnosti přizpůsobit dotaz počítačové logice. Tradiční systémy pracují pouze s jednotlivými slovy a vyhledají dokumenty, které obsahují pouze přesný obraz zadaných slov bez ohledu na jejich funkci. |
FactSpotter bere do úvahy kontext celého dokumentu namísto shluku několika slov v blízkosti klíčového slova a pracuje se vztahy mezi větami a odstavci. |
FactSpotter dokáže rozpoznat obecné termíny jako "lidé" nebo "budova" a vyhledá slova, která spadají do takto definované kategorie |