Conceptualization of a data integration and storage framework to enable predictive analytics and application of data analytical algorithms in the manufacturing industry

Publikationen: Thesis / Studienabschlussarbeiten und HabilitationsschriftenMasterarbeit

Abstract

In dieser Masterarbeit werden Methoden und Best Practices zur Datenintegration und -speicherung, sowie Möglichkeiten zur Bestimmung und Sicherstellung der Datenqualität behandelt. Weiters werden Algorithmen die eine deskriptive Analytik der Daten erlauben, beschrieben und angewendet. Während sich der erste Teil der Arbeit mit den theoretischen Hintergründen beschäftigt, wird im zweiten Teil die praktische Anwendung der genannten Methoden wiedergegeben. In Zusammenarbeit mit einem Unternehmen aus der Fertigungsindustrie wird eine kritische Würdigung der bereits implementierten Lösung durchgeführt, bevor eine IT Infrastruktur, welche die Anwendung von prädiktiven Analysen ermöglicht, vorgestellt wird. Zusätzlich werden ein Datenreifegradmodell sowie deskriptive Algorithmen angewendet und die Ergebnisse erläutert. Basierend auf der methodischen Vorgehensweise der „Data Mining Method for Engineers“ (DMME), welche wiederum auf dem CRISP-DM basiert, liegt der erste theoretische Schwerpunkt dieser Arbeit auf der Datenintegration. Mithilfe der „PERFoRM“ Richtline für Systemarchitektur wird eine Übersicht über die Anforderungen an die Systemarchitektur und die Middleware in modernen Fertigungsprozessen gegeben. Dieses Kapitel wird durch einen Vergleich bekannter Integrationslösungen abgeschlossen. Nachfolgend werden die Funktionsweisen von Datenspeichersystem erläutert. Dazu zählen nicht nur relationale (SQL) Datenbanken, sondern auch nicht relationale (NoSQL) Datenbanksysteme einschließlich bekannter Vertreter der jeweiligen Gruppen. Neben Datenintegration und -speicherung wird auch die Bewertung und Sicherstellung der Datenqualität in dieser Masterarbeit beleuchtet. Dazu werden die verschiedenen Datenqualitätsdimensionen einschließlich besonderer Aspekte der Sensordatenqualität beschrieben. Zusätzlich werden Methoden für eine automatisierte Qualitätskontrolle und -verbesserung erläutert. Durch die Einführung des Datenreifegradmodells wird es ermöglicht, die Fähigkeit eines Unternehmens, Problemstellungen mittels Datenanalytik zu untersuchen. Mit der Beschreibung der anwendbaren Methoden auf die verfügbaren Daten schließt der theoretische Teil der Masterarbeit. Die beschriebenen Techniken basieren auf der praktischen Anwendbarkeit, daher wurde das Hauptaugenmerk auf erforschende Datenanalyse (z.B. Hauptkomponentenanalyse) und beschreibende Algorithmen wie zum Beispiel Clustering gelegt. Der praktische Teil der Masterarbeit beinhaltet neben einer kritischen Würdigung der aktuell implementierten Lösung zur Datenintegration und -speicherung, ein skalierbares und leistungsstarkes Konzept zur Implementierung prädiktiver Analysen im großen Maßstab. Das Reifegradmodell wurde auf die verfügbaren Daten angewandt und erzielte in den meisten Kategorien einen hohen Reifegrad. Aufgrund geringer Datenquantität im Unternehmen, konzentrieren sich die angewandten Methoden und Techniken auf erforschende und beschreibende Algorithmen. Die vielversprechenden Resultate dieser ersten deskriptiven Algorithmen dienen als Proof of Concept für weitere prädiktive Analysen.

Details

Titel in ÜbersetzungKonzepterstellung für Datenintegration und -speicherung zur prädiktiven Analyse, sowie praktische Anwendung von Datenanalysealgorithmen in der Fertigungsindustrie
OriginalspracheEnglisch
QualifikationDipl.-Ing.
Gradverleihende Hochschule
Betreuer/-in / Berater/-in
StatusVeröffentlicht - 2021