K počítačové morfologické analýze češtiny
Práce se zabývá problematikou strojové morfologické analýzy češtiny. Nejprve jsou představeny v současnosti používané způsoby organizace zdrojových dat morfologického analyzátoru a na příkladech doloženy nevýhody, které jsou s nimi nevyhnutelně spojeny. V následující části práce je navržen zcela nov...
Uloženo v:
Hlavní autor: | |
---|---|
Další autoři: | |
Typ dokumentu: | VŠ práce nebo rukopis |
Jazyk: | Čeština |
Vydáno: |
2010
|
Témata: | |
On-line přístup: | http://is.muni.cz/th/3880/fi_d/ |
LEADER | 05195ctm a22008417a 4500 | ||
---|---|---|---|
001 | MUB01000651833 | ||
003 | CZ BrMU | ||
005 | 20240510134039.0 | ||
008 | 100825s2010 xr ||||| |||||||||||cze d | ||
STA | |a POSLANO DO SKCR |b 2019-09-10 | ||
035 | |a (ISMU-VSKP)77191 | ||
040 | |a BOD114 |b cze |d BOD018 | ||
072 | 7 | |a 81 |x Lingvistika. Jazyky |2 Konspekt |9 11 | |
080 | |a 81'366 |2 MRF | ||
080 | |a 81'373.611 |2 MRF | ||
080 | |a 81 |2 MRF | ||
080 | |a 81'322 |2 MRF | ||
100 | 1 | |a Šmerk, Pavel, |d 1979- |7 mub2013778562 |% UČO 3880 |4 dis | |
242 | 1 | 0 | |a Towards Computational Morphological Analysis of Czech |y eng |
245 | 1 | 0 | |a K počítačové morfologické analýze češtiny |h [rukopis] / |c Pavel Šmerk |
260 | |c 2010 | ||
300 | |a xi, 110 s. + |e 1 CD | ||
500 | |a Vedoucí práce: Karel Pala | ||
502 | |a Dizertace (Ph.D.)--Masarykova univerzita, Fakulta informatiky, 2010 | ||
520 | 2 | |a Práce se zabývá problematikou strojové morfologické analýzy češtiny. Nejprve jsou představeny v současnosti používané způsoby organizace zdrojových dat morfologického analyzátoru a na příkladech doloženy nevýhody, které jsou s nimi nevyhnutelně spojeny. V následující části práce je navržen zcela nový formát dat, který umožní výrazně snížit stávající vysokou redundanci, nabídne lepší prostředky pro zachycení derivačních vztahů a sémantických informací, dovolí rozlišit jevy produktivní od okrajových a v neposlední řadě umožní i lingvisticky přijatelnější popis dat. Další část práce se stejným způsobem zabývá samotným morfologickým analyzátorem: nejprve jsou popsány nevýhody současného řešení a poté je představen analyzátor nový, pro češtinu poprvé využívající algoritmů pro práci s minimálními deterministickými acyklickými konečně stavovými automaty Jana Daciuka. Vytvořený analyzátor je oproti existujícím několikrát rychlejší a zároveň výrazně jednodušší, což je, jak ukazuje praxe, velmi |% cze | |
520 | 2 | 9 | |a The thesis is concerned with computational morphology of Czech. Current approaches to organization of the morphological dictionary as well as to implementation of the morphological analyser have some serious drawbacks, which are described in the thesis. Hence the main goal of this work is to design a new format of the morphological data and to implement a new analyser. The proposed data format allows to decrease high redundancy of the current data, offers better means for distinguishing regularity and idiosyncrasy, and, last but not least, offers better interpretable data from the linguistic point of view. The new analyser uses Jan Daciuk's algorithms for minimal deterministic acyclic finite state automata. It is several times faster than the current ones, although its code is much more simple. |9 eng |
650 | 0 | 7 | |a počítačová lingvistika |7 ph115862 |2 czenas |
650 | 0 | 7 | |a morfologie (lingvistika) |7 ph139266 |2 czenas |
650 | 0 | 7 | |a tvoření slov |7 ph135665 |2 czenas |
650 | 0 | 9 | |a computer linguistics |2 eczenas |
650 | 0 | 9 | |a morphology (linguistics) |2 eczenas |
650 | 0 | 9 | |a word formation |2 eczenas |
655 | 7 | |a disertace |7 fd132024 |2 czenas | |
655 | 9 | |a dissertations |2 eczenas | |
658 | |a Informatika (čtyřleté) |b Informatika |c FI D-IN4 IN (IN) |2 CZ-BrMU | ||
700 | 1 | |a Pala, Karel, |d 1939-2023 |7 jk01091535 |% UČO 455 |4 ths | |
710 | 2 | |a Masarykova univerzita. |b Katedra informačních technologií |4 dgg | |
856 | 4 | 1 | |u http://is.muni.cz/th/3880/fi_d/ |
CAT | |c 20100825 |l MUB01 |h 0453 | ||
CAT | |a KOZOVA |b 02 |c 20110330 |l MUB01 |h 1242 | ||
CAT | |a POSPEL |b 02 |c 20110504 |l MUB01 |h 0746 | ||
CAT | |c 20110627 |l MUB01 |h 1920 | ||
CAT | |c 20110627 |l MUB01 |h 2329 | ||
CAT | |a batch |b 00 |c 20120324 |l MUB01 |h 0141 | ||
CAT | |a POSPEL |b 02 |c 20120417 |l MUB01 |h 0803 | ||
CAT | |a POSPEL |b 02 |c 20120516 |l MUB01 |h 1657 | ||
CAT | |c 20120610 |l MUB01 |h 2012 | ||
CAT | |a BATCH |b 00 |c 20130304 |l MUB01 |h 1124 | ||
CAT | |a POSPEL |b 02 |c 20130828 |l MUB01 |h 1402 | ||
CAT | |a POSPEL |b 02 |c 20130829 |l MUB01 |h 1312 | ||
CAT | |a POSPEL |b 02 |c 20130829 |l MUB01 |h 1313 | ||
CAT | |a POSPEL |b 02 |c 20140109 |l MUB01 |h 1105 | ||
CAT | |a POSPEL |b 02 |c 20140220 |l MUB01 |h 1323 | ||
CAT | |a HANAV |b 02 |c 20141110 |l MUB01 |h 1248 | ||
CAT | |a HANAV |b 02 |c 20141205 |l MUB01 |h 1530 | ||
CAT | |c 20150901 |l MUB01 |h 1446 | ||
CAT | |c 20150921 |l MUB01 |h 1407 | ||
CAT | |a BATCH |b 00 |c 20151226 |l MUB01 |h 0123 | ||
CAT | |a HANAV |b 02 |c 20160926 |l MUB01 |h 1053 | ||
CAT | |a HANAV |b 02 |c 20161111 |l MUB01 |h 1657 | ||
CAT | |a POSPEL |b 02 |c 20161122 |l MUB01 |h 0726 | ||
CAT | |a POSPEL |b 02 |c 20170502 |l MUB01 |h 1324 | ||
CAT | |c 20190910 |l MUB01 |h 1234 | ||
CAT | |c 20210614 |l MUB01 |h 0948 | ||
CAT | |c 20210614 |l MUB01 |h 1938 | ||
CAT | |a BATCH |b 00 |c 20210724 |l MUB01 |h 1159 | ||
CAT | |a BATCH-UPD |b 00 |c 20230220 |l MUB01 |h 2353 | ||
CAT | |a VESELAX |b 02 |c 20240510 |l MUB01 |h 1339 | ||
CAT | |a VESELAX |b 02 |c 20240510 |l MUB01 |h 1340 | ||
LOW | |a POSLANO DO SKCR |b 2019-09-10 | ||
994 | - | 1 | |l MUB01 |l MUB01 |m VYSPR |1 FI |a Fakulta informatiky |3 Diz. práce 2010 |5 42005D2599 |8 20120509 |f 72 |f Týdenní |r 20120509 |
AVA | |a INF50 |b FI |d Diz. práce 2010 |e available |t K dispozici |f 1 |g 0 |h N |i 2 |