K počítačové morfologické analýze češtiny

Práce se zabývá problematikou strojové morfologické analýzy češtiny. Nejprve jsou představeny v současnosti používané způsoby organizace zdrojových dat morfologického analyzátoru a na příkladech doloženy nevýhody, které jsou s nimi nevyhnutelně spojeny. V následující části práce je navržen zcela nov...

Celý popis

Uloženo v:
Podrobná bibliografie
Hlavní autor: Šmerk, Pavel, 1979- (Autor práce)
Další autoři: Pala, Karel, 1939-2023 (Vedoucí práce)
Typ dokumentu: VŠ práce nebo rukopis
Jazyk:Čeština
Vydáno: 2010
Témata:
On-line přístup:http://is.muni.cz/th/3880/fi_d/
Obálka
LEADER 05195ctm a22008417a 4500
001 MUB01000651833
003 CZ BrMU
005 20240510134039.0
008 100825s2010 xr ||||| |||||||||||cze d
STA |a POSLANO DO SKCR  |b 2019-09-10 
035 |a (ISMU-VSKP)77191 
040 |a BOD114  |b cze  |d BOD018 
072 7 |a 81  |x Lingvistika. Jazyky  |2 Konspekt  |9 11 
080 |a 81'366  |2 MRF 
080 |a 81'373.611  |2 MRF 
080 |a 81  |2 MRF 
080 |a 81'322  |2 MRF 
100 1 |a Šmerk, Pavel,  |d 1979-  |7 mub2013778562  |% UČO 3880  |4 dis 
242 1 0 |a Towards Computational Morphological Analysis of Czech  |y eng 
245 1 0 |a K počítačové morfologické analýze češtiny  |h [rukopis] /  |c Pavel Šmerk 
260 |c 2010 
300 |a xi, 110 s. +  |e 1 CD 
500 |a Vedoucí práce: Karel Pala 
502 |a Dizertace (Ph.D.)--Masarykova univerzita, Fakulta informatiky, 2010 
520 2 |a Práce se zabývá problematikou strojové morfologické analýzy češtiny. Nejprve jsou představeny v současnosti používané způsoby organizace zdrojových dat morfologického analyzátoru a na příkladech doloženy nevýhody, které jsou s nimi nevyhnutelně spojeny. V následující části práce je navržen zcela nový formát dat, který umožní výrazně snížit stávající vysokou redundanci, nabídne lepší prostředky pro zachycení derivačních vztahů a sémantických informací, dovolí rozlišit jevy produktivní od okrajových a v neposlední řadě umožní i lingvisticky přijatelnější popis dat. Další část práce se stejným způsobem zabývá samotným morfologickým analyzátorem: nejprve jsou popsány nevýhody současného řešení a poté je představen analyzátor nový, pro češtinu poprvé využívající algoritmů pro práci s minimálními deterministickými acyklickými konečně stavovými automaty Jana Daciuka. Vytvořený analyzátor je oproti existujícím několikrát rychlejší a zároveň výrazně jednodušší, což je, jak ukazuje praxe, velmi  |% cze 
520 2 9 |a The thesis is concerned with computational morphology of Czech. Current approaches to organization of the morphological dictionary as well as to implementation of the morphological analyser have some serious drawbacks, which are described in the thesis. Hence the main goal of this work is to design a new format of the morphological data and to implement a new analyser. The proposed data format allows to decrease high redundancy of the current data, offers better means for distinguishing regularity and idiosyncrasy, and, last but not least, offers better interpretable data from the linguistic point of view. The new analyser uses Jan Daciuk's algorithms for minimal deterministic acyclic finite state automata. It is several times faster than the current ones, although its code is much more simple.  |9 eng 
650 0 7 |a počítačová lingvistika  |7 ph115862  |2 czenas 
650 0 7 |a morfologie (lingvistika)  |7 ph139266  |2 czenas 
650 0 7 |a tvoření slov  |7 ph135665  |2 czenas 
650 0 9 |a computer linguistics  |2 eczenas 
650 0 9 |a morphology (linguistics)  |2 eczenas 
650 0 9 |a word formation  |2 eczenas 
655 7 |a disertace  |7 fd132024  |2 czenas 
655 9 |a dissertations  |2 eczenas 
658 |a Informatika (čtyřleté)  |b Informatika  |c FI D-IN4 IN (IN)  |2 CZ-BrMU 
700 1 |a Pala, Karel,  |d 1939-2023  |7 jk01091535  |% UČO 455  |4 ths 
710 2 |a Masarykova univerzita.  |b Katedra informačních technologií  |4 dgg 
856 4 1 |u http://is.muni.cz/th/3880/fi_d/ 
CAT |c 20100825  |l MUB01  |h 0453 
CAT |a KOZOVA  |b 02  |c 20110330  |l MUB01  |h 1242 
CAT |a POSPEL  |b 02  |c 20110504  |l MUB01  |h 0746 
CAT |c 20110627  |l MUB01  |h 1920 
CAT |c 20110627  |l MUB01  |h 2329 
CAT |a batch  |b 00  |c 20120324  |l MUB01  |h 0141 
CAT |a POSPEL  |b 02  |c 20120417  |l MUB01  |h 0803 
CAT |a POSPEL  |b 02  |c 20120516  |l MUB01  |h 1657 
CAT |c 20120610  |l MUB01  |h 2012 
CAT |a BATCH  |b 00  |c 20130304  |l MUB01  |h 1124 
CAT |a POSPEL  |b 02  |c 20130828  |l MUB01  |h 1402 
CAT |a POSPEL  |b 02  |c 20130829  |l MUB01  |h 1312 
CAT |a POSPEL  |b 02  |c 20130829  |l MUB01  |h 1313 
CAT |a POSPEL  |b 02  |c 20140109  |l MUB01  |h 1105 
CAT |a POSPEL  |b 02  |c 20140220  |l MUB01  |h 1323 
CAT |a HANAV  |b 02  |c 20141110  |l MUB01  |h 1248 
CAT |a HANAV  |b 02  |c 20141205  |l MUB01  |h 1530 
CAT |c 20150901  |l MUB01  |h 1446 
CAT |c 20150921  |l MUB01  |h 1407 
CAT |a BATCH  |b 00  |c 20151226  |l MUB01  |h 0123 
CAT |a HANAV  |b 02  |c 20160926  |l MUB01  |h 1053 
CAT |a HANAV  |b 02  |c 20161111  |l MUB01  |h 1657 
CAT |a POSPEL  |b 02  |c 20161122  |l MUB01  |h 0726 
CAT |a POSPEL  |b 02  |c 20170502  |l MUB01  |h 1324 
CAT |c 20190910  |l MUB01  |h 1234 
CAT |c 20210614  |l MUB01  |h 0948 
CAT |c 20210614  |l MUB01  |h 1938 
CAT |a BATCH  |b 00  |c 20210724  |l MUB01  |h 1159 
CAT |a BATCH-UPD  |b 00  |c 20230220  |l MUB01  |h 2353 
CAT |a VESELAX  |b 02  |c 20240510  |l MUB01  |h 1339 
CAT |a VESELAX  |b 02  |c 20240510  |l MUB01  |h 1340 
LOW |a POSLANO DO SKCR  |b 2019-09-10 
994 - 1 |l MUB01  |l MUB01  |m VYSPR  |1 FI  |a Fakulta informatiky  |3 Diz. práce 2010  |5 42005D2599  |8 20120509  |f 72  |f Týdenní  |r 20120509 
AVA |a INF50  |b FI  |d Diz. práce 2010  |e available  |t K dispozici  |f 1  |g 0  |h N  |i 2