Normalization of Unstructured Log Data into Streams of Structured Event Objects /
Monitoring hraje klíčovou roli při provozu každé větší distribuované IT infrastruktury. Nezávisle na tom, zda je to víceúčelový cluster, univerzitní síť, podniková síť, grid, či cloudové datacentrum, monitorovací informace jsou kontinuálně užívány v širokém spektru situací, počínaje kritickými úkoly...
Uloženo v:
Hlavní autor: | |
---|---|
Další autoři: | |
Typ dokumentu: | VŠ práce nebo rukopis |
Jazyk: | Angličtina |
Vydáno: |
2018
|
Témata: | |
On-line přístup: | http://is.muni.cz/th/172673/fi_d/ |
Shrnutí: | Monitoring hraje klíčovou roli při provozu každé větší distribuované IT infrastruktury. Nezávisle na tom, zda je to víceúčelový cluster, univerzitní síť, podniková síť, grid, či cloudové datacentrum, monitorovací informace jsou kontinuálně užívány v širokém spektru situací, počínaje kritickými úkoly jako účtování, plánování, či řešení incidentů, konče podobně důležitými úkoly z oblasti vývoje, například ladění, detekce chyb, či analýza výkonu. Při snaze naplnit vizi nové generace monitorovacích systémů řízených událostmi jsme identifikovali, že jeden z nejbohatších zdrojů monitorovacích informací - počítačové logy - je také jeden z nejproblematičtějších z pohledu automatizovaného zpracování. Logovací data jsou generována bez zjevného řádu, za použití mnoha nekompatibilních formátů, a jedna z nejdůležitějších informací, tj. logovací zpráva (hláška), je ve formě nestrukturovaných textových řetězců, které kombinují přirozený jazyk s běhovými proměnnými. Tento fakt je v přímém rozporu s na Monitoring plays a crucial role in the operation of any sizeable distributed IT infrastructure. Whether it is a multi-purpose cluster, university network, enterprise network, grid, or cloud datacenter, monitoring information is continuously used in a wide spectrum of ways ranging from mission-critical jobs, e.g. accounting, scheduling, or incident handling, to equally important development-related tasks, e.g. debugging, fault-detection, or performance analysis. Whilst pursuing a novel vision of new-generation event-driven monitoring systems, we have identified that a particularly rich source of monitoring information - computer logs - is also one of the most problematic in terms of automated processing. Log data are predominantly generated in an ad-hoc manner using a variety of incompatible formats with the most important pieces of information, i.e. log messages, in the form of unstructured strings mixing natural language with run-time context variables. This directly clashes with our |
---|---|
Popis jednotky: | Vedoucí práce: Tomáš Pitner |
Fyzický popis: | xii, 200 stran |