Mathematical Search Engine
Matematický vyhledávač
dizertační práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/52914Identifikátory
SIS: 44711
Kolekce
- Kvalifikační práce [10691]
Autor
Vedoucí práce
Oponent práce
Dvorský, Jiří
Kohlhase, Michael
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Softwarové systémy
Katedra / ústav / klinika
Katedra distribuovaných a spolehlivých systémů
Datum obhajoby
23. 9. 2013
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Prospěl/a
Klíčová slova (česky)
Matematický vyhledávač, Vyhledávaní v matematice, Matematické vzorce, Textový vyhledávačKlíčová slova (anglicky)
Mathematical search engine, Searching in mathematics, Mathematical formulae, Full text search enginePo celá staletí se matematika využívá k popisu jevů a problémů v mnoha oblastech výzkumu. Vzorce jsou základními kameny v jazyce matematiky, ale i přesto je hledání matematických vzorců v digitální podobě stále těžkopádné. Tato dizertační práce navrhuje řešení a představuje matematický vyhledávač EgoMath, založený na fulltex- tovém vyhledávání. Praktická použitelnost je potvrzena testy na velké sbírce doku- mentů. Také představíme techniku, díky které může být náš přístup použit na mno- honásobně větší kolekci dat. Aby bylo možné poskytnout cenné hodnocení kvality, vybudovali jsme alternativní matematický vyhledávač založený na práci Ma et al. Příslušná rozšíření umožňují dosažení zajímavých výsledků. Jako první provedeme srovnání dvou matematických vyhledávačů, které jsou postaveny na různých algo- ritmech. Vyčerpávající přehled stávajících používaných technik doplní obraz stavu výzkumu v oblasti matematického vyhledávání.
Mathematics has been used to describe phenomena and problems in many re- search fields for centuries. The basic elements used in the description are formu- lae which express information symbolically. However, searching for mathematical knowledge in digital form using available tools is still cumbersome. We address this issue by presenting the mathematical search engine EgoMath, based on a full text searching, which can search for mathematical formulae and text. We perform an eval- uation over a large collection of documents showing that our solution is usable. Our approach can be used with huge document collections by applying one specialised technique. In order to provide a valuable evaluation of the quality, we built an al- ternative mathematical search engine using the feature extraction technique proposed by Ma et al. We propose important improvements to this solution achieving interest- ing results. We perform the first ever cross-evaluation of mathematical search engines based on different algorithms. A comprehensive survey of existing techniques avail- able, presented in this thesis, completes the picture of mathematical searching.