„Algoritmus pro detekci plagiátů používáme v repozitáři závěrečných prací Theses.cz a v systému na odhalování plagiátů v seminárních pracích Odevzdej.cz,“ řekl vedoucí projektů Michal Brandejs z Fakulty informatiky Masarykovy univerzity. Od roku 2006 je program na odhalování podobností také součástí Informačního systému Masarykovy univerzity. Využívá jej dalších 30 škol.

Loni ve stejné soutěži získal systém druhé místo. „Provedli jsme řadu změn a vylepšení, z nichž asi nejvýznamnější je detekce pasáží opsaných z cizojazyčných zdrojů,“ uvedl Jan Kasprzak z vývojového týmu. Informatici se také zaměřili na vyřazení podobných, ale nikoliv opsaných, částí textu, jako jsou tiráže, předmluvy a jiné.

Poslední velkou novinkou je přidání experimentální podpory pro rozpoznávání vnitřního plagiátorství, kde je cílem jen v rámci podezřelého dokumentu najít opsané pasáže například pomocí odhalení změn ve stylu psaní.

Další informace o soutěži včetně výsledků získáte zde.