Decision Rule Learning for Evolving Data Streams

V této práci je navržen ucelený systém pro učení rozhodovacích pravidel z proudů dat a jeho aplikace v oblastech klasifikace v proudech dat a on-line rozpoznávání anomálií v datech. Dolování z proudů dat je proces, při nemž jsou extrahovány znalosti z rychle a nepřetržitě přicházejících záznamů. Na...

Celý popis

Uloženo v:
Podrobná bibliografie
Hlavní autor: Kosina, Petr (Autor práce)
Další autoři: Popelínský, Lubomír (Vedoucí práce)
Typ dokumentu: VŠ práce nebo rukopis
Jazyk:Angličtina
Vydáno: 2013
Témata:
On-line přístup:http://is.muni.cz/th/143255/fi_d/
Obálka
Popis
Shrnutí:V této práci je navržen ucelený systém pro učení rozhodovacích pravidel z proudů dat a jeho aplikace v oblastech klasifikace v proudech dat a on-line rozpoznávání anomálií v datech. Dolování z proudů dat je proces, při nemž jsou extrahovány znalosti z rychle a nepřetržitě přicházejících záznamů. Na velké množství úloh dolování z dat v dnešní době lze pohlížet jako na dolování z proudů dat, proto se také toto odvětví těší vzrůstající popularitě a objevuje se mnoho nových algoritmů, které jsou schopné tato data zpracovávat. Rozhodovací pravidla jsou jedním z nejflexibilnějších modelů a také jedním z nejlépe interpretovatelných. Nicméně doposud bylo navrženo jen velmi omezené množství algoritmů pro učení pravidel z proudů dat, která se mohou v průběhu času měnit. Tato práce navrhuje systém Very Fast Decision Rules (VFDR), jeho další zajímavá rozšíření a aplikace. VFDR se učí jedním průchodem daty a nabízí možnost učení se uspořádaných či neuspořádaných množin pravidel. Jednou z důležitých
This dissertation proposes a complex approach for learning decision rules from data streams and their application in classification and anomaly detection. Data Stream Mining is the process of extracting knowledge structures from continuous and rapidly incoming data records. Many decision tasks can be formulated as stream mining problems and therefore many new algorithms for data streams have been proposed. Decision rules are one of the most interpretable and flexible models for predictive data mining. Nevertheless, only a few algorithms have been proposed in the literature to learn rule models for time-changing and high-speed flows of data. In this work we present the Very Fast Decision Rules (VFDR) algorithm and discuss the interesting extensions and applications of the model. The VFDR approach is a one-pass and any-time algorithm. It works on-line and learns ordered or unordered rule sets. Another important aspect of algorithms designed to work with data streams is that they should b
Popis jednotky:Vedoucí práce: Lubomír Popelínský
Fyzický popis:xi, 101 s.