Math Information Retrieval for Digital Libraries /
Cílem mé disertační práce je vylepšení možností plnotextového vyhledávání v digitálních knihovnách odborných dokumentů. Dokumenty v oblasti STEM (science, technology, engineering and mathematics - věda, technologie, inženýrství a matematika) obvykle obsahují mnoho matematických formulí, které jsou p...
Uloženo v:
Hlavní autor: | |
---|---|
Další autoři: | |
Typ dokumentu: | VŠ práce nebo rukopis |
Jazyk: | Angličtina |
Vydáno: |
2018
|
Témata: | |
On-line přístup: | http://is.muni.cz/th/143424/fi_d/ |
Shrnutí: | Cílem mé disertační práce je vylepšení možností plnotextového vyhledávání v digitálních knihovnách odborných dokumentů. Dokumenty v oblasti STEM (science, technology, engineering and mathematics - věda, technologie, inženýrství a matematika) obvykle obsahují mnoho matematických formulí, které jsou podstatnou součástí hlavního sdělení těchto dokumentů. Současné plnotextové vyhledávače však nedisponují odpovídající funkcionalitou pro indexování matematických formulí ani vhodným uživatelským rozhraním pro jejich vyhledávání pro koncové uživatele. Náš matematiku zohledňující plnotextový vyhledávač MIaS (Math Indexer and Searcher) v základu využívá vyhledávacích schopností soudobých nejlepších „textových“ plnotextových vyhledávačů, ale obohacuje je o podporu indexování formulí. Při indexování jsou matematické formule zpracovávány v několika krocích: Formule jsou normalizovány, abychom odstranili syntaktické odlišnosti formulí se stejnou sémantikou; aby byly vyhledatelné, jsou odvozeny a j The aim of my thesis is to improve full-text search functionality in the digital libraries of scientific documents. Documents in STEM (science, technology, engineering and mathematics) fields usually contain a lot of mathematical formulae which are germane to the main message of the documents. However, current, common full-text search engines provide neither the proper functionality to index formulae nor the appropriate interfaces for end users to search them. In essence, our math-aware full-text search engine MIaS (Math Indexer and Searcher) exploits the search functionality of the state-of-the-art keyword-based full-text search engines, while adding a new and efficient way of indexing formulae. To index mathematical formulae, the formulae are processed in several steps: formulae are normalized to remove the syntactic differences between formulae which are semantically the same; subformulae and generalized forms of the formulae are derived to be represented (and searchable) as sta |
---|---|
Popis jednotky: | Vedoucí práce: Petr Sojka |
Fyzický popis: | iv, 139 stran |