Slovnědruhové přechody jako problém automatické morfologické analýzy /
Disertační práce se zabývá automatickým určením slovního druhu. Jejím cílem je prozkoumat slovnědruhové přechody pohledem automatické morfologické analýzy a navrhnout řešení na zlepšení automatického značení slovního druhu. Práce se zaměřila pouze na dva typy slovnědruhového přechodu: v prvním přípa...
Uloženo v:
| Hlavní autor: | |
|---|---|
| Další autoři: | |
| Typ dokumentu: | VŠ práce nebo rukopis |
| Jazyk: | Čeština |
| Vydáno: |
2019
|
| Témata: | |
| On-line přístup: | http://is.muni.cz/th/gomfh/ |
| Shrnutí: | Disertační práce se zabývá automatickým určením slovního druhu. Jejím cílem je prozkoumat slovnědruhové přechody pohledem automatické morfologické analýzy a navrhnout řešení na zlepšení automatického značení slovního druhu. Práce se zaměřila pouze na dva typy slovnědruhového přechodu: v prvním případě byl výchozí slovní druh ohebný a výsledný neohebný (analýza příslovečných spřežek). Ve druhém případě byl zvolen výchozí i výsledný slovní druh ohebný (analýza substantivizovaných adjektiv). V rámci zkoumání příslovečných spřežek byla provedena korpusová sonda na korpusu SYN v3 se záměrem získat k analýze seznam výrazů, které mohou být příslovečnou spřežkou, mají formu jako příslovečná spřežka a jsou značeny jako nerozpoznaný slovní druh. V případě substantivizovaných adjektiv byla provedena korpusová sonda na korpusu SYN v5 za účelem zjištění, jak jsou značena substantivizovaná adjektiva a které výrazy je možné zařadit mezi substantivizovaná adjektiva. Záměrem bylo najít obecný rys, kter The thesis focuses on tagging of parts of speech. The aim of the submitted thesis was to examine part of speech transitions from the perspective of automatic morphological analysis and to propose solutions for improving the automatic part of speech tagging. The thesis deals with two types of part of speech transition: for the first type, the initial part of speech was flexible whereas the final non-flexible (analysis of compound adverbs). For the second type, both the initial and the final part of speech were flexible (analysis of nominalized adjectives). To perform the analysis of compound adverbs, a SYN v3 Corpus Probe was designed to analyze a list of expressions that can represent a compound adverb, have the form of a compound adverb and are tagged as an unrecognized part of speech. To examine nominalized adjectives, a corpus probe on the SYN v5 corpus was made to determine the way in which the nominalized adjectives are tagged and what expressions can be classified as a nominalize |
|---|---|
| Popis jednotky: | Vedoucí práce: Klára Osolsobě |
| Fyzický popis: | 200 stran |