Sie sind hier
E-Book

Wie die Logistik 4.0 Daten effizient nutzt. Implementierung eines Data Mining Algorithmus zur Nivellierung von Kommissionierspitzen

AutorTristan Lizardo
VerlagStudylab
Erscheinungsjahr2019
Seitenanzahl92 Seiten
ISBN9783960956006
FormatPDF/ePUB
Kopierschutzkein Kopierschutz/DRM
GerätePC/MAC/eReader/Tablet
Preis34,99 EUR
Die Digitalisierung ist einer der größten Wirtschaftstreiber der heutigen Zeit. Sie bedeutet für Unternehmen in vielerlei Hinsicht eine große Chance. Doch gleichzeitig sehen einige Branchen sie auch als Bedrohung. Denn große IT-Unternehmen dringen in immer weitere Bereiche entlang ihrer Wertschöpfungskette vor. Gerade Onlinehändler dürfen sich deshalb nicht abhängen lassen. Tristan Lizardo zeigt in seiner Publikation, wie Onlinehändler und Logistikunternehmen die Digitalisierung ihres Geschäfts vorantreiben. Dazu gehört der Einsatz von Big Data Technologie wie Data Mining und die Transformation der Logistik hin zur Logistik 4.0. Mithilfe von Data Mining Algorithmen können Unternehmen Kommissionierspitzen nivellieren. Auf der Basis der Transaktionsdaten eines Onlinehändlers hat Lizardo eine Assoziationsanalyse durchgeführt. Seine Publikation erklärt, wie Unternehmen mittels Big Data die Kommissionierung optimieren. Aus dem Inhalt: - FP-Growth-Algorithmus; - Nutzwertanalyse - Frequent Item Sets; - Effektivität; - Effizienzsteigerung

Kaufen Sie hier:

Horizontale Tabs

Leseprobe

3 Grundlagen des Data Mining


 

Das folgende Kapitel vermittelt die grundlegenden Zusammenhänge des Data Mining. Hierzu werden zunächst eine Begriffsdefinition und eine allgemeine Beschreibung des Data Mining Prozesses geliefert (Kap. 0). Anschließend erfolgt eine genauere Betrachtung der Assoziationsanalyse, welche zur Nivellierung von Kommissionierspitzen eingesetzt wird (Kap. 0).

 

3.1 Definition und Beschreibung


 

Data Mining ist kein feststehender, definierter Begriff, sondern wird in unterschiedlicher Art und Weise genutzt.[24] Darüber hinaus gibt es den Begriff des Knowledge Discovery in Databases (KDD), welcher zum Teil synonym [25] und teils davon abgegrenzt genutzt wird.[26] Beide beschreiben jedoch, zumindest in Teilen, die autonome Entdeckung von Mustern (Patterns) zum Erkenntnisgewinn.[27] In der vorliegenden Anwendung ist die genaue Abgrenzung jedoch nachrangig, da der Fokus auf eben jenem Erkenntnisgewinn liegt. Zudem sind die im Kapitel 4 vorgestellten Algorithmen nach beiden Definitionen Bestandteil des Data Mining.

 

Knowledge Discovery wird von Frawley et al als „nichttriviale Extraktion von impliziten, vorher unbekannten, und potentiell nützlichen Informationen“ definiert.[28] Fayyad et al wiederum beschreiben den Vorgang als „nichttrivialen Prozess der Identifizierung von validen, neuen, potentiell nützlichen und verständlichen Mustern in den Daten“.[29] Es wird demnach deutlich, dass es sich nicht um triviale Analysetechniken wie beispielsweise die Berechnung von Mittelwerten handelt, sondern um statistisch gesicherte, komplexe Verfahren, aus denen neue Informationen gewonnen werden können.[30] Im hier vorliegenden Fall sollen diese Informationen der zeitlichen Entzerrung von Kommissionierleistungen dienen.

 

Fayyad et al sehen Data Mining als Bestandteil des KDD. Aufgrund der anschaulichen Darstellung veranschaulicht Abbildung 3‑1 hier den Ablauf eines Data Mining bzw. KDD Prozesses.

 

 

Abbildung 3‑1: Überblick über die Phasen des KDD-Prozesses

 

Quelle: (Fayyad/Piatetsky-Shapiro/Smyth 1996), S.41.

 

An erster Stelle des KDD Prozesses steht das Verstehen des Anwendungsfalls und der Erwerb des Wissens, welches nötig ist, um den speziellen KDD Prozess ausführen zu können. Ebenfalls muss das Ziel des KDD Prozesses definiert werden. Darauf folgt die Auswahl geeigneter Daten, die als Basis dienen, um in ihnen nach Mustern zu suchen. Anschließend werden diese bereinigt und auf den eigentlichen Mining-Prozess vorbereitet. Die Daten werden im Anschluss auf das benötigte Inputformat transformiert. Zugleich wird eine Mining Methode selektiert. Im vorliegenden Fall ist das ein Algorithmus zum Item Set Mining (siehe Kapitel 4). Zudem müssen die Parameter und die speziellen Ziele des Algorithmus gewählt werden (siehe dazu Kapitel 0). Anschließend findet der eigentliche Mining Vorgang statt. Der Nutzer kann diesen Vorgang erheblich fördern, indem die vorangegangenen Schritte analytisch und gründlich ausgeführt werden. Sind die gewünschten Muster berechnet, so erfolgt eine Evaluation der Ergebnisse. Gegebenenfalls müssen die ersten Schritte wiederholt werden, um ein positives Ergebnis zu erhalten. Das Prozessmodell kann also durchaus als Kreislauf aufgefasst werden. Ist ein positives Ergebnis der Evaluation gegeben, so kann eine Implementierung erfolgen. Es wurde „Wissen entdeckt“ (Knowledge Discovery). Auf Basis diesen neuen „Wissens“ wird gehandelt.[31]

 

Es gibt noch weitere Modelle des KDD-Prozesses. Jedoch liegt der Fokus im vorliegenden Fall auf der Umsetzung einer Data Mining Methode für den speziellen Fall des Kommissionierens. Eine theoretische Auseinandersetzung mit verschiedenen Modellen erfolgt daher nur in verkürzter Form. Daher wird an dieser Stelle lediglich auf den Cross-industry standard process for data mining (CRISP-DM) eingegangen (siehe hierzu Abbildung 3‑2). Bei genauerem Hinsehen offenbart sich, dass sich die Prozesse ähneln. CRISP-DM beschreibt den Data Mining Prozess direkt als Kreislauf. Zudem wird im Modell davon ausgegangen, dass einige Teilprozesse wiederholt werden müssen, sodass diese direkt als Schleifen angelegt wurden. Die meisten Schritte sind jedoch ähnlich zu denen im oben gezeigten Modell von Fayyad et al.[32]

 

 

Abbildung 3‑2: Phasen des CRISP-DM Referenzmodells

 

Quelle: (Chapman/Clinton/Kerber/Khabaza/Reinartz/Shearer/Wirth 2000), S.10.

 

Im weiteren Verlauf der Arbeit wird der Begriff Data Mining synonym zu KDD verwendet. Nichtsdestotrotz wird der komplette Prozess des KDD durchlaufen.

 

3.2 Beschreibung und grundlegende Begriffe der Assoziationsanalyse


 

Zu den größten Anwendungsbereichen des Data Mining gehört die Suche nach Mustern und Regeln. Diese werden per Assoziationsanalyse gefunden.[33] Mit dieser werden häufig gemeinsam auftretende Objekte einer Datenbasis berechnet.[34] Es werden also Beziehungen zwischen zwei oder mehr Objekten eines Datensatzes gesucht.[35] Treten diese Objekte häufig zusammen auf, so lässt sich dafür eine Regel ableiten (siehe Kapitel 0). Die Anwendungsbereiche der Assoziationsanalyse erstrecken sich über weite Wissenschaftsfelder. Unter anderem wird die Technologie in der Astronomie, der Medizin, aber auch der Wirtschaft angewendet.[36]

 

Der letztgenannte Punkt umfasst die sogenannte Warenkorbanalyse.[37] Sie dient dazu, Artikel zu identifizieren, welche häufig gemeinsam gekauft werden. Weitere Anwendungsgebiete sind die Identifikation von Regeln, welche die Implikation zum Kauf eines Objektes beinhalten unter der Bedingung des vorherigen Kaufs eines anderen Objektes. Diese Informationen werden anschließend genutzt werden, um potentiellen Kunden weitere Produkte auf Basis ihrer bisherigen Käufe anzubieten. Dies wird Crossmarketing genannt.[38] Es werden allerdings nicht nur die Käufe analysiert, sondern ebenfalls die Kunden. So kann eine Datenbank aller Kunden angelegt werden, in der persönliche Daten wie Herkunft, Bildungsstand, Beruf, Familienstand und weiteres gespeichert werden. Mithilfe dieser Daten werden dann potentielle neue Kunden (bspw. vermögende Individuen) kontaktiert.[39]

 

In den folgenden Kapiteln werden statt Objekt die Begriffe Item oder Artikel genutzt, um einzelne Objekte einer Datenbank zu beschreiben. Dies ist der Tatsache geschuldet, dass die Assoziationsanalyse auf Transaktionsdaten eines Onlinehandels angewandt wird. Daher handelt es sich bei den Einträgen um Artikelnummern und Transaktionsnummern. In den Kapiteln 4 und 5 wird eine Warenkorbanalyse durchgeführt. Zielsetzung ist, wie bereits beschrieben, die Nivellierung der Kommissionierleistung. Hierbei wird der gesamte KDD Prozess durchlaufen.

 

Da die Warenkorbanalyse hauptsächlich dem Zweck dient, das Kaufverhalten von Kunden genauer zu analysieren, bedarf es einiger grundlegender Voraussetzungen, um eine Assoziationsanalyse durchführen zu können. Daher werden an dieser Stelle die wichtigsten, grundlegenden Begriffe eingeführt.

 

3.2.1 Sortiment und Transaktionsdatenbank


 

Grundlegend für die Assoziationsanalyse ist das Sortiment . Dieses beinhaltet Artikel I (oder Items), welche in den Transaktionen des Onlineshops vorkommen. Diese Transaktionen sind in der Transaktionsdatenbank  gespeichert. Jede Transaktion T hat eine Transaktions-Identifikation (TID).[40]

 

Weitere wichtige Werte im Zusammenhang mit der Assoziationsanalyse sind der Support und die Konfidenz. Beide werden im Folgenden erläutert.

 

3.2.2 Support


 

Der Support als wichtige Kennzahl der Datenanalyse wird unterteilt in die absolute Häufigkeit eines Artikel I in T (Support Count) und in die relative Häufigkeit (den eigentlichen Support).[41] Der Support Count von I ist ergo |I|. Der eigentliche Support gibt an, welche Auftrittshäufigkeit ein Artikel oder eine Artikelmenge I im Verhältnis zur Gesamtzahl der Transaktionen aus T hat. Daher:

 

 

Formel 3‑1: Berechnung des Supports

 

Quelle: Eigene Darstellung in Anlehnung an (Han/Kamber/Pei 2012), S.246.

 

Eine besondere Form des Supports ist der Minimum Support (min_sup). Dieser ist der vom Benutzer definierte minimale Support, den ein Artikel oder eine Artikelmenge erreichen muss, damit er als „häufig“ (frequent) gilt.[42]

 

3.2.3 Konfidenz


 

Die Konfidenz einer Assoziationsregel IàJ (siehe hierzu Kapitel 0) sagt aus, in welchem Maße die Konklusion (in diesem Fall J) eintritt,...

Blick ins Buch

Weitere E-Books zum Thema: Produktion - Industrie

Operations Research

E-Book Operations Research
Linearoptimierung Format: PDF

Linearoptimierung wird als mathematische Methode innerhalb des Operations Research bei der Mengenplanung für Absatz und Produktion sowie für Transport-, Netzfluss- oder Maschinenbelegungs-Probleme…

Operations Research

E-Book Operations Research
Linearoptimierung Format: PDF

Linearoptimierung wird als mathematische Methode innerhalb des Operations Research bei der Mengenplanung für Absatz und Produktion sowie für Transport-, Netzfluss- oder Maschinenbelegungs-Probleme…

Operations Research

E-Book Operations Research
Linearoptimierung Format: PDF

Linearoptimierung wird als mathematische Methode innerhalb des Operations Research bei der Mengenplanung für Absatz und Produktion sowie für Transport-, Netzfluss- oder Maschinenbelegungs-Probleme…

Warehouse Management

E-Book Warehouse Management
Organisation und Steuerung von Lager- und Kommissioniersystemen Format: PDF

Professor Dr. Michael ten Hompel ist Inhaber des Lehrstuhls für Förder- und Lagerwesen an der Universität Dortmund und Institutsleiter am Fraunhofer-Institut für Materialfluss und Logistik IML. Er…

Logistik

E-Book Logistik
Grundlagen - Strategien - Anwendungen Format: PDF

Zentrale Aufgabe der operativen Logistik ist das effiziente Bereitstellen der benötigten Mengen materieller Objekte zur rechten Zeit am richtigen Ort. Zu diesem Zweck muß die analytisch-planende…

Logistik

E-Book Logistik
Grundlagen - Strategien - Anwendungen Format: PDF

Zentrale Aufgabe der operativen Logistik ist das effiziente Bereitstellen der benötigten Mengen materieller Objekte zur rechten Zeit am richtigen Ort. Zu diesem Zweck muß die analytisch-planende…

Logistik

E-Book Logistik
Grundlagen - Strategien - Anwendungen Format: PDF

Zentrale Aufgabe der operativen Logistik ist das effiziente Bereitstellen der benötigten Mengen materieller Objekte zur rechten Zeit am richtigen Ort. Zu diesem Zweck muß die analytisch-planende…

Anwendung von RFID-Systemen

E-Book Anwendung von RFID-Systemen
Format: PDF

Die Radio-Frequenz-Identifikation (RFID) dient seit etwa 15 Jahren zur Identifikation von Personen, Objekten und Tieren. Mit der inzwischen gut entwickelten Technologie können heute…

Weitere Zeitschriften

FESTIVAL Christmas

FESTIVAL Christmas

Fachzeitschriften für Weihnachtsartikel, Geschenke, Floristik, Papeterie und vieles mehr! FESTIVAL Christmas: Die erste und einzige internationale Weihnachts-Fachzeitschrift seit 1994 auf dem ...

ARCH+.

ARCH+.

ARCH+ ist eine unabhängige, konzeptuelle Zeitschrift für Architektur und Urbanismus. Der Name ist zugleich Programm: mehr als Architektur. Jedes vierteljährlich erscheinende Heft beleuchtet ...

Arzneimittel Zeitung

Arzneimittel Zeitung

Die Arneimittel Zeitung ist die Zeitung für Entscheider und Mitarbeiter in der Pharmabranche. Sie informiert branchenspezifisch über Gesundheits- und Arzneimittelpolitik, über Unternehmen und ...

Gastronomie Report

Gastronomie Report

News & Infos für die Gastronomie: Tipps, Trends und Ideen, Produkte aus aller Welt, Innovative Konzepte, Küchentechnik der Zukunft, Service mit Zusatznutzen und vieles mehr. Frech, offensiv, ...

DULV info

DULV info

UL-Technik, UL-Flugbetrieb, Luftrecht, Reiseberichte, Verbandsinte. Der Deutsche Ultraleichtflugverband e. V. - oder kurz DULV - wurde 1982 von ein paar Enthusiasten gegründet. Wegen der hohen ...

Euro am Sonntag

Euro am Sonntag

Deutschlands aktuelleste Finanz-Wochenzeitung Jede Woche neu bietet €uro am Sonntag Antworten auf die wichtigsten Fragen zu den Themen Geldanlage und Vermögensaufbau. Auch komplexe Sachverhalte ...