Natural Language Inference in Czech and Related Tasks /
Inference v přirozeném jazyce (NLI) patří k nejdůležitějším oblastem porozumění přirozenému jazyku. Je formulována jako klasifikační úloha dvojic vět (premisa-hypothéza) vzhledem k relaci vyplývání: zda daná hypotéza může být (člověkem) odvozena z dané premisy. Tato práce je zaměřená na úlohy souvis...
Uloženo v:
Hlavní autor: | |
---|---|
Další autoři: | |
Typ dokumentu: | VŠ práce nebo rukopis |
Jazyk: | Angličtina |
Vydáno: |
2020
|
Témata: | |
On-line přístup: | https://is.muni.cz/th/v9s3b/ |
Shrnutí: | Inference v přirozeném jazyce (NLI) patří k nejdůležitějším oblastem porozumění přirozenému jazyku. Je formulována jako klasifikační úloha dvojic vět (premisa-hypothéza) vzhledem k relaci vyplývání: zda daná hypotéza může být (člověkem) odvozena z dané premisy. Tato práce je zaměřená na úlohy související s úlohou NLI a na úlohy z ní odvozené a na zkoumání aplikací metod hlubokého učení pro úlohu NLI pro získávání univerzálně využitelných embeddingů (vektorových reprezentací) vět českého jazyka. Práce začíná přehledem úloh souvisejících s úlohou NLI, včetně inference z více premis, relační inference, částečného vyplývání atp. Následně představíme nové přístupy (založené na otevřené extrakci informací (open IE) pro vývoj korpusů pro několik zmíněných úloh souvisejících s úlohou NLI a stanovíme příslušné základní výsledky (baselines). Následující část je věnována výzkumu NLI úlohy v češtině. Pro tyto účely jsme pracovali se strojovým překladem textů ze známého korpusu SNLI. Popsali jsme Natural language inference (NLI), formerly known as recognizing textual entailment (RTE), is one of the most important fields of natural language understanding. It can be stated as a classification task of premise-hypothesis sentence pairs with respect to the entailment relation: whether a given hypothesis can be inferred (by a human) from a given premise. The thesis is focused on tasks related to or derived from NLI task and on exploiting deep learning approaches to NLI task for obtaining universally applicable sentence embeddings for Czech language. The thesis starts with a survey of tasks related to NLI, including multiple premise entailment, relation inference, partial entailment etc. Subsequently, it introduces novel methods (based on open IE extraction) for creating corpora for several mentioned NLI-related problems and it sets up several corresponding baselines. The next part of the thesis is devoted to investigations of NLI task in Czech. For this purpose, we deal with MT te |
---|---|
Popis jednotky: | Vedoucí práce: Karel Pala |
Fyzický popis: | xiii, 129 stran : ilustrace |
Bibliografie: | Obsahuje bibliografii |