Sie sind hier
E-Book

Data Mining

AutorJürgen Cleve, Uwe Lämmel
VerlagDe Gruyter Oldenbourg
Erscheinungsjahr2014
ReiheDe Gruyter Studium 
Seitenanzahl318 Seiten
ISBN9783486720341
FormatePUB/PDF
KopierschutzWasserzeichen
GerätePC/MAC/eReader/Tablet
Preis39,80 EUR
In den riesigen Datenbergen moderner Datenbanken steckt unentdecktes Wissen, das ohne geeignete Hilfsmittel kaum zu Tage gefördert werden kann. Hier setzt das Data Mining an und liefert Methoden und Algorithmen, um bisher unbekannte Zusammenhänge zu entdecken. Nach der Vermittlung der Grundlagen und Anwendungsklassen des Data Mining in den ersten beiden Kapiteln wird in Kapitel 3 auf geeignete Darstellungsmöglichkeiten für Data-Mining-Modelle eingegangen; Kapitel 4 behandelt die Algorithmen und Verfahrensklassen, Kapitel 5 geht auf konkrete Anwendungsarchitekturen ein. Das Buch deckt den Stoff einer einsemestrigen Vorlesung zu Data Mining an Universitäten oder Fachhochschulen ab und ist als klassisches Lehrbuch konzipiert. Es bietet Zusammenfassungen, zahlreiche Beispiele und Übungsaufgaben.

Prof. Dr. Jürgen Cleve, Hochschule Wismar

Prof. Dr. Uwe Lämmel, Hochschule Wismar

Kaufen Sie hier:

Horizontale Tabs

Blick ins Buch
Inhaltsverzeichnis
1 Einführung13
1.1 Auswertung von Massendaten13
1.2 Data Mining und Business Intelligence15
1.3 Ablauf einer Datenanalyse16
1.4 Interdisziplinarität23
1.5 Erfolgreiche Beispiele26
1.6 Werkzeuge28
1.6.1 KNIME29
1.6.2 WEKA38
1.6.3 JavaNNS43
2 Grundlagen des Data Mining49
2.1 Grundbegriffe49
2.2 Datentypen51
2.3 Abstands- und Ähnlichkeitsmaße55
2.4 Grundlagen Künstlicher Neuronaler Netze59
2.5 Logik64
2.6 Überwachtes und unüberwachtes Lernen67
3 Anwendungsklassen69
3.1 Cluster-Analyse69
3.2 Klassifikation71
3.3 Numerische Vorhersage73
3.4 Assoziationsanalyse75
3.5 Text Mining77
3.6 Web Mining78
4 Wissensrepräsentation81
4.1 Entscheidungstabelle81
4.2 Entscheidungsbäume83
4.3 Regeln84
4.4 Assoziationsregeln85
4.5 Instanzenbasierte Darstellung91
4.6 Repräsentation von Clustern91
4.7 Neuronale Netze als Wissensspeicher92
5 Klassifikation95
5.1 K-Nearest Neighbour95
5.1.1 K-Nearest-Neighbour-Algorithmus97
5.1.2 Ein verfeinerter Algorithmus101
5.2 Entscheidungsbaumlernen104
5.2.1 Erzeugen eines Entscheidungsbaums104
5.2.2 Auswahl eines Attributs106
5.2.3 Der ID3-Algorithmus zur Erzeugung eines Entscheidungsbaums108
5.2.4 Entropie116
5.2.5 Der Gini-Index118
5.2.6 Der C4.5-Algorithmus118
5.2.7 Probleme beim Entscheidungsbaumlernen120
5.2.8 Entscheidungsbaum und Regeln121
5.3 Naive Bayes123
5.3.1 Bayessche Formel123
5.3.2 Der Naive-Bayes-Algorithmus124
5.4 Vorwärtsgerichtete Neuronale Netze129
5.4.1 Architektur129
5.4.2 Das Backpropagation-of-Error-Lernverfahren131
5.4.3 Modifikationen des Backpropagation-Algorithmus135
5.4.4 Ein Beispiel137
5.5 Support Vector Machines140
5.5.1 Grundprinzip140
5.5.2 Formale Darstellung von Support Vector Machines142
5.5.3 Ein Beispiel144
6 Cluster-Analyse147
6.1 Arten der Cluster-Analyse147
6.2 Der k-Means-Algorithmus151
6.3 Der k-Medoid-Algorithmus160
6.4 Erwartungsmaximierung165
6.5 Agglomeratives Clustern167
6.6 Dichtebasiertes Clustern172
6.7 Clusterbildung mittels selbstorganisierender Karten175
6.7.1 Aufbau175
6.7.2 Lernen176
6.7.3 Visualisierung einer SOM179
6.7.4 Ein Beispiel180
6.8 Clusterbildung mittels neuronaler Gase182
6.9 Clusterbildung mittels ART184
7 Assoziationsanalyse187
7.1 Der A-Priori-Algorithmus187
7.1.1 Generierung der Kandidaten189
7.1.2 Erzeugen der Regeln191
7.2 Frequent Pattern Growth197
7.3 Assoziationsregeln für spezielle Aufgaben201
7.3.1 Hierarchische Assoziationsregeln201
7.3.2 Quantitative Assoziationsregeln202
7.3.3 Erzeugung von temporalen Assoziationsregeln204
8 Datenvorbereitung207
8.1 Motivation207
8.2 Arten der Datenvorbereitung209
8.2.1 Datenselektion und -integration210
8.2.2 Datensäuberung211
8.2.3 Datenreduktion218
8.2.4 Datentransformation221
8.3 Ein Beispiel227
9 Bewertung233
9.1 Prinzip der minimalen Beschreibungslängen234
9.2 Interessantheitsmaße für Assoziationsregeln234
9.2.1 Support235
9.2.2 Konfidenz235
9.2.3 Gain-Funktion237
9.2.4 p-s-Funktion238
9.2.5 Lift239
9.3 Gütemaße und Fehlerkosten239
9.3.1 Fehlerraten239
9.3.2 Weitere Gütemaße für Klassifikatoren240
9.3.3 Fehlerkosten242
9.4 Testmengen243
9.5 Qualität von Clustern245
9.6 Visualisierung247
10 Eine Data-Mining-Aufgabe257
10.1 Die Aufgabe257
10.2 Das Problem258
10.3 Die Daten260
10.4 Datenvorbereitung265
10.5 Experimente268
10.5.1 K-Nearest Neighbour270
10.5.2 Naive Bayes272
10.5.3 Entscheidungsbaumverfahren274
10.5.4 Neuronale Netze277
10.6 Auswertung der Ergebnisse284
A Anhang287
A.1 Iris-Daten287
A.2 Sojabohnen289
A.3 Wetter-Daten291
A.4 Kontaktlinsen-Daten293
Abbildungsverzeichnis295
Tabellenverzeichnis303
Verzeichnis der Symbole305
Verzeichnis der Abkürzungen307
Literaturverzeichnis309
Index315

Weitere E-Books zum Thema: Informatik - Algorithmen - Softwaresysteme

Softwaretechnik

E-Book Softwaretechnik
Format: PDF

Software-Projekte geraten oft in Schwierigkeiten: Zeit und Budget werden überschritten; das Projekt tritt auf der Stelle; im schlimmsten Fall wird es ohne Ergebnis abgebrochen. Manche…

Softwaretechnik

E-Book Softwaretechnik
Format: PDF

Software-Projekte geraten oft in Schwierigkeiten: Zeit und Budget werden überschritten; das Projekt tritt auf der Stelle; im schlimmsten Fall wird es ohne Ergebnis abgebrochen. Manche…

Softwaretechnik

E-Book Softwaretechnik
Format: PDF

Software-Projekte geraten oft in Schwierigkeiten: Zeit und Budget werden überschritten; das Projekt tritt auf der Stelle; im schlimmsten Fall wird es ohne Ergebnis abgebrochen. Manche…

Software Engineering

E-Book Software Engineering
Architektur-Design und Prozessorientierung Format: PDF

Das Lehrbuch behandelt alle Aspekte der Software-Entwicklung, besonders aber Methoden und Richtlinien zur Herstellung großer und qualitativ hochwertiger Softwareprodukte. Es vermittelt das zur…

Software Engineering

E-Book Software Engineering
Architektur-Design und Prozessorientierung Format: PDF

Das Lehrbuch behandelt alle Aspekte der Software-Entwicklung, besonders aber Methoden und Richtlinien zur Herstellung großer und qualitativ hochwertiger Softwareprodukte. Es vermittelt das zur…

Weitere Zeitschriften

Das Grundeigentum

Das Grundeigentum

Das Grundeigentum - Zeitschrift für die gesamte Grundstücks-, Haus- und Wohnungswirtschaft. Für jeden, der sich gründlich und aktuell informieren will. Zu allen Fragen rund um die Immobilie. Mit ...

dima

dima

Bau und Einsatz von Werkzeugmaschinen für spangebende und spanlose sowie abtragende und umformende Fertigungsverfahren. dima - die maschine - bietet als Fachzeitschrift die Kommunikationsplattform ...

DSD Der Sicherheitsdienst

DSD Der Sicherheitsdienst

Der "DSD – Der Sicherheitsdienst" ist das Magazin der Sicherheitswirtschaft. Es erscheint viermal jährlich und mit einer Auflage von 11.000 Exemplaren. Der DSD informiert über aktuelle Themen ...

VideoMarkt

VideoMarkt

VideoMarkt – besser unterhalten. VideoMarkt deckt die gesamte Videobranche ab: Videoverkauf, Videoverleih und digitale Distribution. Das komplette Serviceangebot von VideoMarkt unterstützt die ...

Euro am Sonntag

Euro am Sonntag

Deutschlands aktuelleste Finanz-Wochenzeitung Jede Woche neu bietet €uro am Sonntag Antworten auf die wichtigsten Fragen zu den Themen Geldanlage und Vermögensaufbau. Auch komplexe Sachverhalte ...

filmdienst#de

filmdienst#de

filmdienst.de führt die Tradition der 1947 gegründeten Zeitschrift FILMDIENST im digitalen Zeitalter fort. Wir begleiten seit 1947 Filme in allen ihren Ausprägungen und Erscheinungsformen.  ...