Rapid Development of Language Resources

Počítačové zpracování přirozeného jazyka (NLP) je obor, který se nachází na pomezí lingvistiky a informatiky. Při zpracování jazyka jsou důležité nejen algoritmy, ale i datové zdroje specifické pro konkrétní jazyk, kterými jsou např. gramatiky, slovníky či korpusy. V současnosti dokážeme vytvářet ob...

Celý popis

Uloženo v:
Podrobná bibliografie
Hlavní autor: Grác, Marek, 1981- (Autor práce)
Další autoři: Pala, Karel, 1939-2023 (Vedoucí práce)
Typ dokumentu: VŠ práce nebo rukopis
Jazyk:Angličtina
Vydáno: Brno : Masarykova univerzita, Fakulta informatiky, 2013
Témata:
On-line přístup:http://is.muni.cz/th/50728/fi_d/
Obálka
LEADER 05535ctm a22008657a 4500
001 MUB01000870192
003 CZ BrMU
005 20240514103134.0
008 130827s2013 xr ||||| |||||||||||eng d
STA |a POSLANO DO SKCR  |b 2020-10-19 
035 |a (ISMU-VSKP)126625 
040 |a BOD114  |b cze  |d BOD018 
072 7 |a 004.8  |x Umělá inteligence  |2 Konspekt  |9 23 
072 7 |a 81  |x Lingvistika. Jazyky  |2 Konspekt  |9 11 
080 |a 004  |2 MRF 
080 |a 004.82/.83:81'322.2  |2 MRF 
080 |a 81'322  |2 MRF 
080 |a 004.421  |2 MRF 
080 |a 81'322.2  |2 MRF 
100 1 |a Grác, Marek,  |d 1981-  |7 mub2013777077  |% UČO 50728  |4 dis 
242 1 0 |a Rapid Development of Language Resources  |y eng 
245 1 0 |a Rapid Development of Language Resources  |h [rukopis] /  |c Marek Grác 
260 |a Brno :  |b Masarykova univerzita, Fakulta informatiky,  |c 2013 
300 |a 109 stran 
500 |a Vedoucí práce: Karel Pala 
502 |a Dizertace (Ph.D.)--Masarykova univerzita, Fakulta informatiky, 2013 
520 2 |a Počítačové zpracování přirozeného jazyka (NLP) je obor, který se nachází na pomezí lingvistiky a informatiky. Při zpracování jazyka jsou důležité nejen algoritmy, ale i datové zdroje specifické pro konkrétní jazyk, kterými jsou např. gramatiky, slovníky či korpusy. V současnosti dokážeme vytvářet obrovské jazykové zdroje pomocí automatických metod, ale na jejich trénování a testování je potřeba využívat kvalitnější zdroje. Tvorba i ruční zpracování jsou však velmi náročné nejen na finance a čas, ale i na trénink a zaučení jazykových expertů. Tyto důvody objasňují, proč máme k dispozici dostatek automaticky tvořených jazykových zdrojů, ale pro menší jazyky pociťujeme nedostatek těch kvalitnějších, ručně anotovaných. Existující literatura podrobně popisuje teoretické základy použité při návrhu ručně anotovaných dat, ale samotný proces anotace je představen jen zběžně. Tato dizertační práce se zabývá právě tímto procesem, popisuje vše od návrhu vhodných struktur pro ukládání dat až po  |% cze 
520 2 9 |a Natural language processing (NLP) is a field at the intersection of linguistics and informatics. In language processing, not only algorithms but also language-specific data sources are important, such as grammars, dictionaries or corpora. At present, we can create vast language resources using automatic methods, but their training and testing requires higher quality resources. However, their creation, i.e. manual processing, is very demanding in terms of funding and time as well as searching for and training of sufficiently qualified persons. These reasons explain why there is a sufficient amount of automatically created language resources available even for small languages but there is a lack of quality, manually checked, ones. The existing literature describes in detail the theoretical basis used in the design of manually checked data, but the annotation process itself is only presented in brief. This dissertation addresses this process, from the design of appropriate structures for  |9 eng 
650 0 7 |a zpracování přirozeného jazyka  |7 ph427562  |2 czenas 
650 0 7 |a počítačová lingvistika  |7 ph115862  |2 czenas 
650 0 7 |a algoritmy (programování)  |7 ph131788  |2 czenas 
650 0 7 |a korpusová lingvistika  |7 ph381202  |2 czenas 
650 0 7 |a výpočetní technika  |7 ph137273  |2 czenas 
650 0 9 |a natural language processing  |2 eczenas 
650 0 9 |a computer linguistics  |2 eczenas 
650 0 9 |a computer algorithms  |2 eczenas 
650 0 9 |a corpus linguistics  |2 eczenas 
650 0 9 |a computer science  |2 eczenas 
655 7 |a disertace  |7 fd132024  |2 czenas 
655 9 |a dissertations  |2 eczenas 
658 |a Informatika (čtyřleté)  |b Informatika  |c FI D-IN4 IN (IN)  |2 CZ-BrMU 
700 1 |a Pala, Karel,  |d 1939-2023  |7 jk01091535  |% UČO 455  |4 ths 
710 2 |a Masarykova univerzita.  |b Katedra informačních technologií  |4 dgg 
856 4 1 |u http://is.muni.cz/th/50728/fi_d/ 
CAT |c 20130827  |l MUB01  |h 0422 
CAT |a POSPEL  |b 02  |c 20130827  |l MUB01  |h 1614 
CAT |a POSPEL  |b 02  |c 20140107  |l MUB01  |h 1329 
CAT |a POSPEL  |b 02  |c 20140109  |l MUB01  |h 1105 
CAT |a HANAV  |b 02  |c 20140113  |l MUB01  |h 1238 
CAT |a POSPEL  |b 02  |c 20140220  |l MUB01  |h 1323 
CAT |a POSPEL  |b 02  |c 20140327  |l MUB01  |h 0935 
CAT |a POSPEL  |b 02  |c 20140403  |l MUB01  |h 1233 
CAT |c 20140911  |l MUB01  |h 1613 
CAT |c 20140912  |l MUB01  |h 1107 
CAT |a HANAV  |b 02  |c 20141110  |l MUB01  |h 1248 
CAT |a HANAV  |b 02  |c 20141205  |l MUB01  |h 1530 
CAT |c 20150901  |l MUB01  |h 1451 
CAT |c 20150921  |l MUB01  |h 1412 
CAT |a BATCH  |b 00  |c 20151226  |l MUB01  |h 0415 
CAT |a HANAV  |b 02  |c 20160926  |l MUB01  |h 1053 
CAT |a HANAV  |b 02  |c 20161111  |l MUB01  |h 1657 
CAT |a POSPEL  |b 02  |c 20161122  |l MUB01  |h 0726 
CAT |a POSPEL  |b 02  |c 20170502  |l MUB01  |h 1324 
CAT |a VESELA  |b 02  |c 20181210  |l MUB01  |h 1105 
CAT |c 20201019  |l MUB01  |h 1726 
CAT |c 20210614  |l MUB01  |h 1005 
CAT |c 20210614  |l MUB01  |h 1953 
CAT |a BATCH  |b 00  |c 20210724  |l MUB01  |h 1223 
CAT |a BATCH-UPD  |b 00  |c 20230220  |l MUB01  |h 2353 
CAT |a VESELAX  |b 02  |c 20240514  |l MUB01  |h 1031 
CAT |a VESELAX  |b 02  |c 20240514  |l MUB01  |h 1031 
LOW |a POSLANO DO SKCR  |b 2020-10-19 
994 - 1 |l MUB01  |l MUB01  |m VYSPR  |1 FI  |a Fakulta informatiky  |3 Diz. práce 2013  |5 42005D2630  |8 20140313  |f 72  |f Týdenní  |r 20140313 
AVA |a INF50  |b FI  |d Diz. práce 2013  |e available  |t K dispozici  |f 1  |g 0  |h N  |i 0