Neparametrická analýza funkcionálních dat /
Jádrové odhady pro reálná data patří mezi relativně dobře prozkoumané oblasti neparametrické analýzy dat. V této práci se věnujeme zobecnění jádrových metod na nekonečně dimenzionální (funkcionální) prostory. To nám umožňuje rozšířit možné vstupy do jádrových metod, například o náhodné křivky. V rám...
Uloženo v:
Hlavní autor: | |
---|---|
Další autoři: | |
Typ dokumentu: | VŠ práce nebo rukopis |
Jazyk: | Slovenština |
Vydáno: |
2016
|
Témata: | |
On-line přístup: | http://is.muni.cz/th/369088/prif_m/ |
Shrnutí: | Jádrové odhady pro reálná data patří mezi relativně dobře prozkoumané oblasti neparametrické analýzy dat. V této práci se věnujeme zobecnění jádrových metod na nekonečně dimenzionální (funkcionální) prostory. To nám umožňuje rozšířit možné vstupy do jádrových metod, například o náhodné křivky. V rámci názornosti přechodu mezi reálními a funkcionálními daty se v práci zabýváme jen jádrovou regresí. Soustředíme se na odhad vyhlazovacího parametru pomocí čtyř různých metod -- křížové ověřování, metoda penalizačních funkcí, metoda k nejbližších sousedů a metoda Chagny--Roche. V praktické části tyto metody porovnáváme na simulovaných datech a datech z praxe. Ukazuje se, že na simulovaných datech se všechny metody chovají podobně, ale pro data z praxe dostáváme výrazně přesnejší odhady pomocí metod k nejbližších sousedů a Chagny-Roche. Kernel methods for real data are relatively well-studied area of nonparametric data analysis. In this thesis we study generalization of kernel methods to infinitely dimensional (functional) spaces. This allows us to expand possible inputs into kernel methods, e.g. with random curves. To explain the move from real to functional data more clearly, only kernel regression is presented. Emphasis of this thesis is on bandwidth choice using four different methods - cross-validation, penalization functions, k-nearest neighbours method and Changny-Roche method. Subsequently, these methods were applied on simulated and real data. The results of the study suggest little difference among methods when compared on simulated data and two clearly best-performing methods on real data - k-nearest neighbours method and Changny-Roche method. |
---|---|
Popis jednotky: | Vedoucí práce: Jan Koláček |
Fyzický popis: | 41 listů |