Clusteranalyse für die Bildung von Produktgruppen zur Unterstützung der Lagerdimensionierung
Research output: Thesis › Master's Thesis
Standard
2020.
Research output: Thesis › Master's Thesis
Harvard
APA
Vancouver
Author
Bibtex - Download
}
RIS (suitable for import to EndNote) - Download
TY - THES
T1 - Clusteranalyse für die Bildung von Produktgruppen zur Unterstützung der Lagerdimensionierung
AU - Kohlhofer, Julia Barbara
N1 - gesperrt bis 17-03-2021
PY - 2020
Y1 - 2020
N2 - Ziel dieser Arbeit ist es, die Lagerauslegung und -dimensionierung durch eine automatisierte Analyse der Auftrags- und Wareneingangsdaten zu unterstützen. Um eine spezifischere Dimensionierung eines Lagers zu begünstigen, soll die Produktpalette möglichst automatisch in solche Gruppen geteilt werden, für die spezielle Lagervorgänge eingeplant werden müssen. Bei dieser Analyse wird der Ansatz verfolgt, die Produktpalette in sich unterscheidende Cluster zu unterteilen. In der Arbeit werden auch einige Aspekte des multidisziplinären Felds der Datenwissenschaft besprochen, um eine theoretische Grundlage für die angewandten Verfahren zu schaffen. Eine Clusteranalyse basiert auf einem zu definierenden Clusteralgorithmus, welcher aus entwickelten Kennzahlen, einer zweckmäßigen Distanzfunktion und einem passenden Clusterverfahren besteht. Die geeignete Kombination dieser drei Einflussfaktoren bewirkt, dass der automatisierte Clusteralgorithmus ähnliche Produkte anhand von ihren Merkmalen in ein Cluster zusammenführt. Erprobt wurde das Identifizieren einer Produktgruppe am Beispiel von Produkten, deren Daten im Jahresverlauf nur für eine kurze Zeitspanne eine hohe Absatzmenge besitzen. Eine Evaluierung soll messen, wie gut ein passendes Cluster vom Clusteringalgorithmus gefunden werden konnte. Erst die darauffolgende Clusterauswahl ergibt ein Klassifizierungsproblem, das mit einer Wahrheitsmatrix bewertet werden kann. Mit Hilfe dieser Matrix konnte die Anzahl an richtigen und falschen Klassifikationen quantifiziert und die Sensitivität sowie die Spezifität des Algorithmus bestimmt werden. Zusätzlich ergab ein statistischer Test Aufschluss, mit welcher Wahrscheinlichkeit die Fähigkeit des Algorithmus Cluster zu erkennen, auf die Grundgesamtheit der Daten zutrifft. Die Ergebnisse zeigen, dass sich die Produkte mit dem Merkmal von einer hohen Absatzmenge innerhalb einer kurzen Zeitspanne in einem Cluster wiederfinden. Dieses Resultat stellt einen wesentlichen Informationsgewinn für die Lagerdimensionierung dar. Der evaluierte Clusteralgorithmus erzielte im Stichprobenvergleich mit den manuell klassifizierten Daten ein zufriedenstellendes Ergebnis und kann zum Clustern von Auftrags- und Wareneingangsdaten eingesetzt werden.
AB - Ziel dieser Arbeit ist es, die Lagerauslegung und -dimensionierung durch eine automatisierte Analyse der Auftrags- und Wareneingangsdaten zu unterstützen. Um eine spezifischere Dimensionierung eines Lagers zu begünstigen, soll die Produktpalette möglichst automatisch in solche Gruppen geteilt werden, für die spezielle Lagervorgänge eingeplant werden müssen. Bei dieser Analyse wird der Ansatz verfolgt, die Produktpalette in sich unterscheidende Cluster zu unterteilen. In der Arbeit werden auch einige Aspekte des multidisziplinären Felds der Datenwissenschaft besprochen, um eine theoretische Grundlage für die angewandten Verfahren zu schaffen. Eine Clusteranalyse basiert auf einem zu definierenden Clusteralgorithmus, welcher aus entwickelten Kennzahlen, einer zweckmäßigen Distanzfunktion und einem passenden Clusterverfahren besteht. Die geeignete Kombination dieser drei Einflussfaktoren bewirkt, dass der automatisierte Clusteralgorithmus ähnliche Produkte anhand von ihren Merkmalen in ein Cluster zusammenführt. Erprobt wurde das Identifizieren einer Produktgruppe am Beispiel von Produkten, deren Daten im Jahresverlauf nur für eine kurze Zeitspanne eine hohe Absatzmenge besitzen. Eine Evaluierung soll messen, wie gut ein passendes Cluster vom Clusteringalgorithmus gefunden werden konnte. Erst die darauffolgende Clusterauswahl ergibt ein Klassifizierungsproblem, das mit einer Wahrheitsmatrix bewertet werden kann. Mit Hilfe dieser Matrix konnte die Anzahl an richtigen und falschen Klassifikationen quantifiziert und die Sensitivität sowie die Spezifität des Algorithmus bestimmt werden. Zusätzlich ergab ein statistischer Test Aufschluss, mit welcher Wahrscheinlichkeit die Fähigkeit des Algorithmus Cluster zu erkennen, auf die Grundgesamtheit der Daten zutrifft. Die Ergebnisse zeigen, dass sich die Produkte mit dem Merkmal von einer hohen Absatzmenge innerhalb einer kurzen Zeitspanne in einem Cluster wiederfinden. Dieses Resultat stellt einen wesentlichen Informationsgewinn für die Lagerdimensionierung dar. Der evaluierte Clusteralgorithmus erzielte im Stichprobenvergleich mit den manuell klassifizierten Daten ein zufriedenstellendes Ergebnis und kann zum Clustern von Auftrags- und Wareneingangsdaten eingesetzt werden.
KW - cluster analysis
KW - data mining
KW - data science
KW - hierarchical clustering
KW - Clusteranalyse
KW - Data Mining
KW - Datenwissenschaft
KW - hierarchisches Clustering
M3 - Masterarbeit
ER -