Strojové zpracování starších biblických textů /
Předkládaná dizertační práce se věnuje strojovému zpracování starších biblických textů. V práci je popsána příprava dat (textová databáze) pro strojové zpracování, charakteristika jednotlivých textů i problémy spojené se zpracováním těchto textů. S texty je pracováno jednak na jazykové úrovni, jedna...
Uloženo v:
| Hlavní autor: | |
|---|---|
| Další autoři: | |
| Typ dokumentu: | VŠ práce nebo rukopis |
| Jazyk: | Čeština |
| Vydáno: |
2020
|
| Témata: | |
| On-line přístup: | https://is.muni.cz/th/in9zq/ |
| Shrnutí: | Předkládaná dizertační práce se věnuje strojovému zpracování starších biblických textů. V práci je popsána příprava dat (textová databáze) pro strojové zpracování, charakteristika jednotlivých textů i problémy spojené se zpracováním těchto textů. S texty je pracováno jednak na jazykové úrovni, jednak na úrovni jejich struktury popsané v jazyce XML. Kromě teoretické části obsahuje práce i podrobný popis tvorby paralelního korpusu MatoušCorpora, který podle tohoto popisu vznikl. Vzniklý nástroj je použit pro demonstrování problematiky automatického značkování starších textů a pro představení nového typu dotazu: hyperword This thesis is focused on the machine processing of older biblical texts. Data preparation (text database) for machine processing, description of individual texts, and problems associated with the processing of these texts are described in this thesis. The texts are processed on the language level, and their structure is described by XML transformation language. This thesis consists of a theoretical introduction and a detailed description of the procedure of parallel corpus MatoušCorpora which was developed during this research. The automatic tagging of the older texts problem is demonstrated on this corpus. The new type of query hyperword is presented using the newly developed tool |
|---|---|
| Popis jednotky: | Vedoucí práce: Pavel Kosek |
| Fyzický popis: | 160 listů |