Similarity Search in Stream Processing /
Velké objemy dat (např. videa z bezpečnostních kamer nebo obrázky nahrané na sociální sítě) dnes vznikají jako kontinuální datové proudy. Tyto proudy nemohou být zpracovávány tradičními databázovými technikami, tzn. uloženy a předzpracovány ve strukturované databázi, aby bylo možné efektivně spouště...
Uloženo v:
| Hlavní autor: | |
|---|---|
| Další autoři: | |
| Typ dokumentu: | VŠ práce nebo rukopis |
| Jazyk: | Angličtina |
| Vydáno: |
2019
|
| Témata: | |
| On-line přístup: | http://is.muni.cz/th/ma16o/ |
| Shrnutí: | Velké objemy dat (např. videa z bezpečnostních kamer nebo obrázky nahrané na sociální sítě) dnes vznikají jako kontinuální datové proudy. Tyto proudy nemohou být zpracovávány tradičními databázovými technikami, tzn. uloženy a předzpracovány ve strukturované databázi, aby bylo možné efektivně spouštět různé úlohy pro zpracování dat. Místo toho je nutné data zpracovávat kontinuálně, kupříkladu aby se mohly detekovat události ve videích z bezpečnostních kamer nebo aby se doporučil nový obsah uživatelům sociální sítě. Společnou charakteristikou takovýchto systémů je, že v daném okamžiku je možné přistoupit pouze část dat. Není možné určit, jaká data vzniknou v budoucnosti a již zpracovaná data jsou dříve či později zahozena. Jedním z přínosů disertační práce je model pro analýzu výkonnosti distribuovaných aplikací pro zpracování proudů dat. Model je možné použít k porovnání různých optimalizačních technik a nastavení distribuovaného prostředí před tím, než je aplikace opravdu v takovém pro Huge volumes of data, such as video generated by surveillance cameras or images uploaded to social networks, are nowadays produced in a form of continuous data streams. Such streams cannot be processed by traditional database techniques, i.e., stored and pre-processed in a structured database to allow efficient execution of various data processing transactions. Instead, continuous processing of the data is necessary, for example, to detect events from surveillance camera videos or to recommend new information content to specific users. A common characteristic is that only a part of that data is seen at a time - it is completely unknown what kind of data will come in the future and the already processed data is sooner or later discarded. One of the contributions of the dissertation is a model for performance analysis of distributed stream processing applications, which can be used to compare different optimization techniques and setups of a distributed environment before an application |
|---|---|
| Popis jednotky: | Vedoucí práce: Pavel Zezula |
| Fyzický popis: | xiii, 187 stran : ilustrace |