Machine Learning in the Context of Time Series

Publikationen: Thesis / Studienabschlussarbeiten und HabilitationsschriftenMasterarbeit

Autoren

Abstract

Ein Hauptziel der modernen Technik besteht darin, Prozesse zu optimieren, sie kosten- und ressourceneffizienter zu gestalten, die Sicherheit eines Prozesses zu erhöhen und vieles mehr. Um dies zu erreichen, ist es notwendig, den zugrunde liegenden Prozess zu verstehen. Man kann jedoch nur dann ein Verständnis über komplexe Prozesse erlangen, wenn man Daten und Informationen sammelt und auswertet. Heutzutage sind viele technologische Systeme mit Sensoren ausgestattet, um ihren Zustand zu überwachen und mögliche Aussagen über einen zukünftigen Zustand treffen zu können. Daten, die sich aus der Überwachung solcher Systeme als Funktion der Zeit ergeben, werden als Zeitreihendaten bezeichnet. Die Analyse von Zeitreihendaten ist ein wachsendes Feld, und insbesondere mit Hilfe des in den letzten Jahren populär gewordenen Bereichs des maschinellen Lernens können möglicherweise einige neue Methoden zur Zeitreihenanalyse entwickelt werden. Wenn Daten analysiert und daraus Wissen gewonnen werden soll, sollten die Daten die Realität so gut wie möglich darstellen. Wenn sich einige Datenpunkte erheblich vom Kollektiv unterscheiden, deutet dies normalerweise auf einen abnormalen Prozess oder eine fehlerhafte Messung hin. Die Erkennung solcher Ausreißer hat zwei Hauptgründe. Einerseits weisen Ausreißer auf einen Fehler oder ein unerwartetes Ereignis hin, das häufig erkannt werden muss, und andererseits kann das Bereinigen eines Datensatzes, also das Löschen von Ausreißern, die Ergebnisse einer Datenanalyse verbessern. Ein Ausreißer ist eine Datenprobe, die abnormale Trends enthält. Diese können durch Prozessfehler, Messfehler oder auch durch einmalige Ereignisse entstehen, die den Prozess nicht negativ beeinflussen. Solche Anomalien können vom Menschen nach einer guten Visualisierung oft schnell erkannt werden. Normalerweise müssen sehr große Datenmengen ausgewertet werden, was bei manueller Ausführung viel Zeit kosten würde. Daher besteht der Wunsch nach einer automatischen Erkennung dieser Anomalien in den Daten. Es besteht die Möglichkeit, diese Ausreißer mithilfe von Algorithmen für maschinelles Lernen zu erkennen. In den letzten Jahren ist maschinelles Lernen sehr populär geworden und zu einer versprochenen Lösung für eine Vielzahl moderner Probleme geworden. Eine solche automatische Erkennung von Anomalien in zeitabhängigen Daten ist eine nicht triviale Aufgabe und erfordert die Verwendung geeigneter Algorithmen die in der Lage sein sollen, typische Zeitprofile der Daten zu erlernen und zu erkennen. Die Entwicklung solcher Modelle für maschinelles Lernen und die Bewertung der entwickelten Modelle für die Zeitreihenanalyse im Allgemeinen sind die Hauptbestandteile dieser Arbeit. Die ersten Kapitel dieser Arbeit sind eine Einführung in die Grundkonzepte des maschinellen Lernens und wichtig, um die folgenden Anwendungen des maschinellen Lernens auf Zeitreihendaten zu verstehen. Nach dieser Einführung werden die implementierten Anwendungen erläutert. Der Hauptteil dieser Arbeit ist die Einführung einer neuen Methode des maschinellen Lernens, die in der Zeitreihenanalyse verwendet werden kann. Ziel dieser Arbeit ist es, die Grenzen des maschinellen Lernens zu bewerten und zu lernen, wie maschinelles Lernen auf vernünftige Weise auf Zeitreihendaten angewendet werden kann. Das letzte Kapitel enthält einen Überblick über die Ergebnisse und erklärt, was wir aus dieser Arbeit für zukünftige Anwendungen des maschinellen Lernens lernen können. Die drei Hauptkapitel dieser Arbeit sind daher eine Einführung in maschinelles Lernen und neuronale Netze, die Entwicklung neuer Methoden des maschinellen Lernens für die Zeitreihenanalyse und schließlich eine Interpretation der Ergebnisse.

Details

Titel in ÜbersetzungEntwicklung von Machine Learning Modellen in Bezug auf Zeitreihendaten
OriginalspracheEnglisch
QualifikationDipl.-Ing.
Gradverleihende Hochschule
Betreuer/-in / Berater/-in
Datum der Bewilligung18 Dez. 2020
StatusVeröffentlicht - 2020