Advancing Management of Complex Data in Metric Spaces /

Väčšina dát ktoré vznikajú pri používaní moderných aplikácií má komplexný charakter, čo predstavuje špecifické výzvy pre ich spracovanie. Pre správu, získavanie a analýzu komplexných dát je používaná podobnosť medzi dátovými objektmi, ktorá je modelovaná ako ich párová vzdialenosť. Tieto vzdialenost...

Celý popis

Uloženo v:
Podrobná bibliografie
Hlavní autor: Antol, Matej (Autor práce)
Další autoři: Dohnal, Vlastislav, 1977- (Vedoucí práce)
Typ dokumentu: VŠ práce nebo rukopis
Jazyk:Angličtina
Vydáno: 2022
Témata:
On-line přístup:https://is.muni.cz/th/cjvaw/
Obálka
Popis
Shrnutí:Väčšina dát ktoré vznikajú pri používaní moderných aplikácií má komplexný charakter, čo predstavuje špecifické výzvy pre ich spracovanie. Pre správu, získavanie a analýzu komplexných dát je používaná podobnosť medzi dátovými objektmi, ktorá je modelovaná ako ich párová vzdialenosť. Tieto vzdialenosti sa potom používajú na správu komplexných dát za použitia matematického konceptu metrických priestorov. Táto dizertačná práca sa zaoberá novými prístupmi k deleniu, indexácii a podobnostnému vyhľadávaniu komplexných dát pomocou modelu metrických priestorov. Za účelom popisu klastrov komplexných dát predstavuje táto práca nový algoritmus, ktorý vytvára kompaktné reprezentácie metrických údajov podobné konvexným obalom. V oblasti indexovania práca predstavuje úpravu jedného z aktuálne používaných indexov, ktorá mu umožňuje rovnomerne distribuovať dáta medzi oddielmi indexu. Predstavené sú tiež metódy pre zefektívnenie vyhľadávania, a to jednak použitím historickej popularity dát a ich klastr
Most of the data emerging in modern applications are complex in nature, which presents specific challenges in their processing. To manage, retrieve and analyze complex data, the similarity between data objects is modelled as their pairwise distance. These distances are then used for complex data management based on the mathematical concept of metric spaces. This dissertation thesis is composed of original approaches to partitioning, indexation and similarity searching of complex data using the metric space model. To describe data clusters, this work introduces a brand new algorithm that can create compact representations of metric data similar to convex hulls. In indexing, the thesis presents a modification of one of the currently-used indexes, which allows it to distribute data evenly between data partitions. Improvements to searching are introduced by considering information about the historical popularity of data and their clusters - exploiting this property, as well as any other d
Popis jednotky:Vedoucí práce: Vlastislav Dohnal
Fyzický popis:xiii, 145 stran, 7 listů : ilustrace