Paraphrase and Textual Entailment Generation in Czech

V přirozeném jazyce můžeme určitou informaci sdělit mnoha způsoby. Navíc, ona sdělená informace mívá řadu samozřejmých důsledků, které jsou tudíž málokdy zmíněné. Oba tyto jevy - parafráze a textové vyplývání - jsou v lidské komunikaci běžné, avšak jejich automatické generování je obtížné. Parafráze...

Celý popis

Uloženo v:
Podrobná bibliografie
Hlavní autor: Nevěřilová, Zuzana, 1977- (Autor práce)
Další autoři: Pala, Karel, 1939-2023 (Vedoucí práce)
Typ dokumentu: VŠ práce nebo rukopis
Jazyk:Angličtina
Vydáno: 2014
Témata:
On-line přístup:http://is.muni.cz/th/3839/fi_d/
Obálka
Popis
Shrnutí:V přirozeném jazyce můžeme určitou informaci sdělit mnoha způsoby. Navíc, ona sdělená informace mívá řadu samozřejmých důsledků, které jsou tudíž málokdy zmíněné. Oba tyto jevy - parafráze a textové vyplývání - jsou v lidské komunikaci běžné, avšak jejich automatické generování je obtížné. Parafráze a textové vyplývání jsou užitečné v úkolech, které simulují porozumění přirozenému jazyku (např. odpovídání na otázky, automatická sumarizace, detekce plagiátorství). Tato práce představuje pravidlový přístup ke generování parafrází a textových vyplývání ze zadaného textu. Abychom získali mnoho různých parafrází, transformujeme slovník i strukturu vstupních vět. Transformace čerpají z různých jazykových zdrojů a znalostních bází. Přestože vstup i výstup je pouze v češtině, uvedený princip slovních a strukturních transformací je jazykově nezávislý. Protože pracujeme s nejistou informací, je každá výstupní věta ohodnocena na základě statistického jazykového modelu vypočítaného z korpusu. Roz
In natural languages, one particular piece of information can be conveyed in many different ways. Moreover, a conveyed piece of information implies many others that are obvious for humans and thus rarely mentioned. These phenomena - paraphrasing and textual entailment - occur naturally in all human communication but they are difficult to produce automatically. Paraphrasing and textual entailment are useful in tasks that simulate natural language understanding (e.g. question answering or automatic summarization or plagiarism detection). This work presents a rule-based approach that generates paraphrases and textual entailments from a given text. To achieve a large variety of new sentences, we transform the vocabulary and the structure of the input sentences. The transformations benefit from diverse language resources and knowledge bases. Although both input and output are in Czech, the principle (vocabulary and structure transformations) is language independent. Since we work with unc
Popis jednotky:Vedoucí práce: Karel Pala
Fyzický popis:xv, 125 s., xxii