Rapid Development of Language Resources
Počítačové zpracování přirozeného jazyka (NLP) je obor, který se nachází na pomezí lingvistiky a informatiky. Při zpracování jazyka jsou důležité nejen algoritmy, ale i datové zdroje specifické pro konkrétní jazyk, kterými jsou např. gramatiky, slovníky či korpusy. V současnosti dokážeme vytvářet ob...
Uloženo v:
Hlavní autor: | |
---|---|
Další autoři: | |
Typ dokumentu: | VŠ práce nebo rukopis |
Jazyk: | Angličtina |
Vydáno: |
Brno :
Masarykova univerzita, Fakulta informatiky,
2013
|
Témata: | |
On-line přístup: | http://is.muni.cz/th/50728/fi_d/ |
LEADER | 05535ctm a22008657a 4500 | ||
---|---|---|---|
001 | MUB01000870192 | ||
003 | CZ BrMU | ||
005 | 20240514103134.0 | ||
008 | 130827s2013 xr ||||| |||||||||||eng d | ||
STA | |a POSLANO DO SKCR |b 2020-10-19 | ||
035 | |a (ISMU-VSKP)126625 | ||
040 | |a BOD114 |b cze |d BOD018 | ||
072 | 7 | |a 004.8 |x Umělá inteligence |2 Konspekt |9 23 | |
072 | 7 | |a 81 |x Lingvistika. Jazyky |2 Konspekt |9 11 | |
080 | |a 004 |2 MRF | ||
080 | |a 004.82/.83:81'322.2 |2 MRF | ||
080 | |a 81'322 |2 MRF | ||
080 | |a 004.421 |2 MRF | ||
080 | |a 81'322.2 |2 MRF | ||
100 | 1 | |a Grác, Marek, |d 1981- |7 mub2013777077 |% UČO 50728 |4 dis | |
242 | 1 | 0 | |a Rapid Development of Language Resources |y eng |
245 | 1 | 0 | |a Rapid Development of Language Resources |h [rukopis] / |c Marek Grác |
260 | |a Brno : |b Masarykova univerzita, Fakulta informatiky, |c 2013 | ||
300 | |a 109 stran | ||
500 | |a Vedoucí práce: Karel Pala | ||
502 | |a Dizertace (Ph.D.)--Masarykova univerzita, Fakulta informatiky, 2013 | ||
520 | 2 | |a Počítačové zpracování přirozeného jazyka (NLP) je obor, který se nachází na pomezí lingvistiky a informatiky. Při zpracování jazyka jsou důležité nejen algoritmy, ale i datové zdroje specifické pro konkrétní jazyk, kterými jsou např. gramatiky, slovníky či korpusy. V současnosti dokážeme vytvářet obrovské jazykové zdroje pomocí automatických metod, ale na jejich trénování a testování je potřeba využívat kvalitnější zdroje. Tvorba i ruční zpracování jsou však velmi náročné nejen na finance a čas, ale i na trénink a zaučení jazykových expertů. Tyto důvody objasňují, proč máme k dispozici dostatek automaticky tvořených jazykových zdrojů, ale pro menší jazyky pociťujeme nedostatek těch kvalitnějších, ručně anotovaných. Existující literatura podrobně popisuje teoretické základy použité při návrhu ručně anotovaných dat, ale samotný proces anotace je představen jen zběžně. Tato dizertační práce se zabývá právě tímto procesem, popisuje vše od návrhu vhodných struktur pro ukládání dat až po |% cze | |
520 | 2 | 9 | |a Natural language processing (NLP) is a field at the intersection of linguistics and informatics. In language processing, not only algorithms but also language-specific data sources are important, such as grammars, dictionaries or corpora. At present, we can create vast language resources using automatic methods, but their training and testing requires higher quality resources. However, their creation, i.e. manual processing, is very demanding in terms of funding and time as well as searching for and training of sufficiently qualified persons. These reasons explain why there is a sufficient amount of automatically created language resources available even for small languages but there is a lack of quality, manually checked, ones. The existing literature describes in detail the theoretical basis used in the design of manually checked data, but the annotation process itself is only presented in brief. This dissertation addresses this process, from the design of appropriate structures for |9 eng |
650 | 0 | 7 | |a zpracování přirozeného jazyka |7 ph427562 |2 czenas |
650 | 0 | 7 | |a počítačová lingvistika |7 ph115862 |2 czenas |
650 | 0 | 7 | |a algoritmy (programování) |7 ph131788 |2 czenas |
650 | 0 | 7 | |a korpusová lingvistika |7 ph381202 |2 czenas |
650 | 0 | 7 | |a výpočetní technika |7 ph137273 |2 czenas |
650 | 0 | 9 | |a natural language processing |2 eczenas |
650 | 0 | 9 | |a computer linguistics |2 eczenas |
650 | 0 | 9 | |a computer algorithms |2 eczenas |
650 | 0 | 9 | |a corpus linguistics |2 eczenas |
650 | 0 | 9 | |a computer science |2 eczenas |
655 | 7 | |a disertace |7 fd132024 |2 czenas | |
655 | 9 | |a dissertations |2 eczenas | |
658 | |a Informatika (čtyřleté) |b Informatika |c FI D-IN4 IN (IN) |2 CZ-BrMU | ||
700 | 1 | |a Pala, Karel, |d 1939-2023 |7 jk01091535 |% UČO 455 |4 ths | |
710 | 2 | |a Masarykova univerzita. |b Katedra informačních technologií |4 dgg | |
856 | 4 | 1 | |u http://is.muni.cz/th/50728/fi_d/ |
CAT | |c 20130827 |l MUB01 |h 0422 | ||
CAT | |a POSPEL |b 02 |c 20130827 |l MUB01 |h 1614 | ||
CAT | |a POSPEL |b 02 |c 20140107 |l MUB01 |h 1329 | ||
CAT | |a POSPEL |b 02 |c 20140109 |l MUB01 |h 1105 | ||
CAT | |a HANAV |b 02 |c 20140113 |l MUB01 |h 1238 | ||
CAT | |a POSPEL |b 02 |c 20140220 |l MUB01 |h 1323 | ||
CAT | |a POSPEL |b 02 |c 20140327 |l MUB01 |h 0935 | ||
CAT | |a POSPEL |b 02 |c 20140403 |l MUB01 |h 1233 | ||
CAT | |c 20140911 |l MUB01 |h 1613 | ||
CAT | |c 20140912 |l MUB01 |h 1107 | ||
CAT | |a HANAV |b 02 |c 20141110 |l MUB01 |h 1248 | ||
CAT | |a HANAV |b 02 |c 20141205 |l MUB01 |h 1530 | ||
CAT | |c 20150901 |l MUB01 |h 1451 | ||
CAT | |c 20150921 |l MUB01 |h 1412 | ||
CAT | |a BATCH |b 00 |c 20151226 |l MUB01 |h 0415 | ||
CAT | |a HANAV |b 02 |c 20160926 |l MUB01 |h 1053 | ||
CAT | |a HANAV |b 02 |c 20161111 |l MUB01 |h 1657 | ||
CAT | |a POSPEL |b 02 |c 20161122 |l MUB01 |h 0726 | ||
CAT | |a POSPEL |b 02 |c 20170502 |l MUB01 |h 1324 | ||
CAT | |a VESELA |b 02 |c 20181210 |l MUB01 |h 1105 | ||
CAT | |c 20201019 |l MUB01 |h 1726 | ||
CAT | |c 20210614 |l MUB01 |h 1005 | ||
CAT | |c 20210614 |l MUB01 |h 1953 | ||
CAT | |a BATCH |b 00 |c 20210724 |l MUB01 |h 1223 | ||
CAT | |a BATCH-UPD |b 00 |c 20230220 |l MUB01 |h 2353 | ||
CAT | |a VESELAX |b 02 |c 20240514 |l MUB01 |h 1031 | ||
CAT | |a VESELAX |b 02 |c 20240514 |l MUB01 |h 1031 | ||
LOW | |a POSLANO DO SKCR |b 2020-10-19 | ||
994 | - | 1 | |l MUB01 |l MUB01 |m VYSPR |1 FI |a Fakulta informatiky |3 Diz. práce 2013 |5 42005D2630 |8 20140313 |f 72 |f Týdenní |r 20140313 |
AVA | |a INF50 |b FI |d Diz. práce 2013 |e available |t K dispozici |f 1 |g 0 |h N |i 0 |