Klassifizierung von InSAR-generierten Zeitreihen unter Nutzung von maschinellem Lernen

Research output: ThesisMaster's Thesis

Harvard

APA

Bibtex - Download

@mastersthesis{2ac2034f215b4bdead4474218cb77dd9,
title = "Klassifizierung von InSAR-generierten Zeitreihen unter Nutzung von maschinellem Lernen",
abstract = "In dieser Arbeit werden die M{\"o}glichkeiten der Datensegmentierung (Clustering) von Zeitreihen mittels Algorithmen des unbeobachteten Lernens (maschinelles Lernen) untersucht. In der Kavernenspeicheranlage Etzel verursachen die Kavernen, die zur Speicherung fossiler Brennstoffe dienen, Bewegungen an der Oberfl{\"a}che, die {\"u}ber einen bestimmten Zeitraum mithilfe von Radarinterferometrie (InSAR) von Satelliten gemessen werden. Das Ziel dieser Arbeit besteht darin, diese horizontalen und vertikalen Verschiebungen zu segmentieren. Hierbei werden spezifische Cluster-Algorithmen aus dem Bereich des maschinellen Lernens, sogenannte Cluster-Algorithmen in Pandas, verwendet, um die vorhandenen Datens{\"a}tze anhand bestimmter Merkmale und Eigenschaften der Zeitreihen zu clustern (segmentieren). In dieser Arbeit wurde zun{\"a}chst die K-Shape-Methode angewandt, eine angepasste Version des bekannten K-Means-Algorithmus. Dar{\"u}ber hinaus wurde die Gauss'sche Mischmodelle (GMM)-Methode eingesetzt. Die Anzahl der m{\"o}glichen Cluster wurde mithilfe geeigneter Methoden gesch{\"a}tzt, und die Datens{\"a}tze wurden mit unterschiedlichen Cluster-Anzahlen von n=2-6 segmentiert. Als dritte m{\"o}gliche Methode wurde das Clustering mittels statistischer Kennzahlen wie dem Mittelwert angewandt. Sowohl K-Shape als auch GMM liefern {\"a}hnliche Ergebnisse in Bezug auf Trends, Ausrei{\ss}er und Charakterisierung der Datens{\"a}tze. Es gibt jedoch Unterschiede in Bezug auf die Qualit{\"a}t und numerischen Ergebnisse. So liefern die beiden Methoden eine unterschiedliche ¿optimale¿ Anzahl von Clustern. W{\"a}hrend beide Methoden bei den horizontalen Daten zwei Cluster als optimal einstufen, tendieren die GMM bei den vertikalen Daten f{\"u}r drei bis vier Cluster, w{\"a}hrend K-Shape hier wiederum zwei als ausreichend bewertet. Dieser Unterschied basiert auf die schiefe Verteilung der vertikalen Datens{\"a}tze. GMM finden bei Normalverteilungen Anwendung, was zu einem Unterschied zu den K-Shape Ergebnisse resultiert. Die Verteilung der Zeitreihen-Cluster {\"a}hnelt sich auch in den visuellen Ergebnissen, und saisonale Komponenten sind in den Plots beider Methoden erkennbar und {\"a}hnlich. Durch zus{\"a}tzlichen Vergleich der Ergebnisse mit {\"a}lteren Daten und eines Prognosemodells, lassen sich zudem diese beiden Clustermethoden adaptieren und auch verifizieren. Das Clustering mittels statistischer Kennzahlen ist f{\"u}r weniger komplexe F{\"a}lle hilfreich, da es einen ersten Blick verschafft, bietet jedoch begrenzte M{\"o}glichkeiten hinsichtlich der Evaluierung und Aussagekraft der Daten selbst. Das Clustering von Zeitreihen im Bereich der Bodenbewegungen erweist sich als vielversprechende M{\"o}glichkeit, den Datens{\"a}tzen Charakteristiken zuzuschreiben. Jedoch sind diese Ergebnisse aufgrund der Black-Box-Problematik weiterhin mit Prognosemodellen und konventionellen Ergebnissen zu verifizieren.",
keywords = "Markscheide, InSAR, Maschinelles Lernen, Bergschadenkunde, Clustering, Radarinterferometrie, Zeitreihenanalyse, Senkungsprognosen, Vermessung, Mine surveying, InSar Measurments, Mining subsidience, Clustering, Time Series Analysis, geodesy, Machine Learning",
author = "Selmin Sakiri",
note = "nicht gesperrt",
year = "2023",
language = "Deutsch",
school = "Montanuniversit{\"a}t Leoben (000)",

}

RIS (suitable for import to EndNote) - Download

TY - THES

T1 - Klassifizierung von InSAR-generierten Zeitreihen unter Nutzung von maschinellem Lernen

AU - Sakiri, Selmin

N1 - nicht gesperrt

PY - 2023

Y1 - 2023

N2 - In dieser Arbeit werden die Möglichkeiten der Datensegmentierung (Clustering) von Zeitreihen mittels Algorithmen des unbeobachteten Lernens (maschinelles Lernen) untersucht. In der Kavernenspeicheranlage Etzel verursachen die Kavernen, die zur Speicherung fossiler Brennstoffe dienen, Bewegungen an der Oberfläche, die über einen bestimmten Zeitraum mithilfe von Radarinterferometrie (InSAR) von Satelliten gemessen werden. Das Ziel dieser Arbeit besteht darin, diese horizontalen und vertikalen Verschiebungen zu segmentieren. Hierbei werden spezifische Cluster-Algorithmen aus dem Bereich des maschinellen Lernens, sogenannte Cluster-Algorithmen in Pandas, verwendet, um die vorhandenen Datensätze anhand bestimmter Merkmale und Eigenschaften der Zeitreihen zu clustern (segmentieren). In dieser Arbeit wurde zunächst die K-Shape-Methode angewandt, eine angepasste Version des bekannten K-Means-Algorithmus. Darüber hinaus wurde die Gauss'sche Mischmodelle (GMM)-Methode eingesetzt. Die Anzahl der möglichen Cluster wurde mithilfe geeigneter Methoden geschätzt, und die Datensätze wurden mit unterschiedlichen Cluster-Anzahlen von n=2-6 segmentiert. Als dritte mögliche Methode wurde das Clustering mittels statistischer Kennzahlen wie dem Mittelwert angewandt. Sowohl K-Shape als auch GMM liefern ähnliche Ergebnisse in Bezug auf Trends, Ausreißer und Charakterisierung der Datensätze. Es gibt jedoch Unterschiede in Bezug auf die Qualität und numerischen Ergebnisse. So liefern die beiden Methoden eine unterschiedliche ¿optimale¿ Anzahl von Clustern. Während beide Methoden bei den horizontalen Daten zwei Cluster als optimal einstufen, tendieren die GMM bei den vertikalen Daten für drei bis vier Cluster, während K-Shape hier wiederum zwei als ausreichend bewertet. Dieser Unterschied basiert auf die schiefe Verteilung der vertikalen Datensätze. GMM finden bei Normalverteilungen Anwendung, was zu einem Unterschied zu den K-Shape Ergebnisse resultiert. Die Verteilung der Zeitreihen-Cluster ähnelt sich auch in den visuellen Ergebnissen, und saisonale Komponenten sind in den Plots beider Methoden erkennbar und ähnlich. Durch zusätzlichen Vergleich der Ergebnisse mit älteren Daten und eines Prognosemodells, lassen sich zudem diese beiden Clustermethoden adaptieren und auch verifizieren. Das Clustering mittels statistischer Kennzahlen ist für weniger komplexe Fälle hilfreich, da es einen ersten Blick verschafft, bietet jedoch begrenzte Möglichkeiten hinsichtlich der Evaluierung und Aussagekraft der Daten selbst. Das Clustering von Zeitreihen im Bereich der Bodenbewegungen erweist sich als vielversprechende Möglichkeit, den Datensätzen Charakteristiken zuzuschreiben. Jedoch sind diese Ergebnisse aufgrund der Black-Box-Problematik weiterhin mit Prognosemodellen und konventionellen Ergebnissen zu verifizieren.

AB - In dieser Arbeit werden die Möglichkeiten der Datensegmentierung (Clustering) von Zeitreihen mittels Algorithmen des unbeobachteten Lernens (maschinelles Lernen) untersucht. In der Kavernenspeicheranlage Etzel verursachen die Kavernen, die zur Speicherung fossiler Brennstoffe dienen, Bewegungen an der Oberfläche, die über einen bestimmten Zeitraum mithilfe von Radarinterferometrie (InSAR) von Satelliten gemessen werden. Das Ziel dieser Arbeit besteht darin, diese horizontalen und vertikalen Verschiebungen zu segmentieren. Hierbei werden spezifische Cluster-Algorithmen aus dem Bereich des maschinellen Lernens, sogenannte Cluster-Algorithmen in Pandas, verwendet, um die vorhandenen Datensätze anhand bestimmter Merkmale und Eigenschaften der Zeitreihen zu clustern (segmentieren). In dieser Arbeit wurde zunächst die K-Shape-Methode angewandt, eine angepasste Version des bekannten K-Means-Algorithmus. Darüber hinaus wurde die Gauss'sche Mischmodelle (GMM)-Methode eingesetzt. Die Anzahl der möglichen Cluster wurde mithilfe geeigneter Methoden geschätzt, und die Datensätze wurden mit unterschiedlichen Cluster-Anzahlen von n=2-6 segmentiert. Als dritte mögliche Methode wurde das Clustering mittels statistischer Kennzahlen wie dem Mittelwert angewandt. Sowohl K-Shape als auch GMM liefern ähnliche Ergebnisse in Bezug auf Trends, Ausreißer und Charakterisierung der Datensätze. Es gibt jedoch Unterschiede in Bezug auf die Qualität und numerischen Ergebnisse. So liefern die beiden Methoden eine unterschiedliche ¿optimale¿ Anzahl von Clustern. Während beide Methoden bei den horizontalen Daten zwei Cluster als optimal einstufen, tendieren die GMM bei den vertikalen Daten für drei bis vier Cluster, während K-Shape hier wiederum zwei als ausreichend bewertet. Dieser Unterschied basiert auf die schiefe Verteilung der vertikalen Datensätze. GMM finden bei Normalverteilungen Anwendung, was zu einem Unterschied zu den K-Shape Ergebnisse resultiert. Die Verteilung der Zeitreihen-Cluster ähnelt sich auch in den visuellen Ergebnissen, und saisonale Komponenten sind in den Plots beider Methoden erkennbar und ähnlich. Durch zusätzlichen Vergleich der Ergebnisse mit älteren Daten und eines Prognosemodells, lassen sich zudem diese beiden Clustermethoden adaptieren und auch verifizieren. Das Clustering mittels statistischer Kennzahlen ist für weniger komplexe Fälle hilfreich, da es einen ersten Blick verschafft, bietet jedoch begrenzte Möglichkeiten hinsichtlich der Evaluierung und Aussagekraft der Daten selbst. Das Clustering von Zeitreihen im Bereich der Bodenbewegungen erweist sich als vielversprechende Möglichkeit, den Datensätzen Charakteristiken zuzuschreiben. Jedoch sind diese Ergebnisse aufgrund der Black-Box-Problematik weiterhin mit Prognosemodellen und konventionellen Ergebnissen zu verifizieren.

KW - Markscheide

KW - InSAR

KW - Maschinelles Lernen

KW - Bergschadenkunde

KW - Clustering

KW - Radarinterferometrie

KW - Zeitreihenanalyse

KW - Senkungsprognosen

KW - Vermessung

KW - Mine surveying

KW - InSar Measurments

KW - Mining subsidience

KW - Clustering

KW - Time Series Analysis

KW - geodesy

KW - Machine Learning

M3 - Masterarbeit

ER -