Binary Sketches for Similarity Search /

Efektivní zpracování velkého množství digitálních dat je jedním ze základních úkolů informační společnosti. Tato práce se zaměřuje na efektivní vyhledávání, které je často nezbytnou součástí zpracování dat. Vyhledáváním ve složitých doménách, například v multimédiích, se většinou rozumí vyhledávání...

Celý popis

Uloženo v:
Podrobná bibliografie
Hlavní autor: Míč, Vladimír (Autor práce)
Další autoři: Zezula, Pavel, 1948- (Vedoucí práce)
Typ dokumentu: VŠ práce nebo rukopis
Jazyk:Angličtina
Vydáno: 2020
Témata:
On-line přístup:http://is.muni.cz/th/fv7n9/
Obálka
Popis
Shrnutí:Efektivní zpracování velkého množství digitálních dat je jedním ze základních úkolů informační společnosti. Tato práce se zaměřuje na efektivní vyhledávání, které je často nezbytnou součástí zpracování dat. Vyhledáváním ve složitých doménách, například v multimédiích, se většinou rozumí vyhledávání na základě podvojné podobnosti objektů. Ta může být definována jako podobnost vizuální, tvarová, zvuková, či jiná. Vyhledávání na základě podobnosti objektů odpovídá požadavkům uživatelů lépe než vyhledávání identických objektů, ale je výpočetně mnohem náročnější. V této práci předpokládáme, že míra podobnosti objektů je modelována metrickým prostorem, který představuje jeden z nejběžnějších a nejobecnějších modelů podobnosti složitých objektů. Uvažujeme tedy doménu objektů a metrickou funkci, která měří míru nepodobnosti libovolné dvojice objektů. Podobnost složitých objektů, například multimédií, není dnes běžně počítána přímo na základě původních (raw) dat. Namísto toho jsou takzvanými d
The rapid increase of digital data production strengthens the need for efficient data processing. We focus on data searching, which is one of the essential real-life tasks. Searching for data objects cannot be limited to exact matches in many applications, instead, searching based on a pairwise similarity of data objects is often necessary. This similarity search is challenging due to its computational complexity. In this thesis, we consider the similarity of data objects modelled by metric space, i.e. we assume the domain of objects and the metric function that measures the dissimilarity of any two objects. Complex data objects such as multimedia are usually not compared directly, but their characteristic features are extracted and represented typically by high dimensional vectors. The problems of similarity searching investigated in this thesis are related to the phenomenon of big data. The volume of processed data is large, and the time efficiency of similarity query executions is e
Popis jednotky:Vedoucí práce: Pavel Zezula
Fyzický popis:x, 174 stran