Sie sind hier
E-Book

Kompendium semantische Netze

Konzepte, Technologie, Modellierung

AutorKlaus Reichenberger
VerlagSpringer-Verlag
Erscheinungsjahr2010
Seitenanzahl208 Seiten
ISBN9783642043154
FormatPDF
KopierschutzDRM
GerätePC/MAC/eReader/Tablet
Preis35,96 EUR

Semantische Technologien werden als die zukünftige Form menschlichen Wissens gehandelt. Gleichzeitig haftet ihnen etwas von einer Geheimwissenschaft an. Dieses Kompendium bietet eine - auch für Einsteiger verständliche - Einführung in das Thema. Es präsentiert verschiedene semantische Techniken, von automatischen Text-Mining-Verfahren bis hin zu komplexen Ontologien. Leser werden anhand von Beispielen in die Lage versetzt, selbst zu beurteilen, was semantische Technologien leisten. Im praktischen Teil lernen sie, semantische Netze zu modellieren.



Klaus Reichenberger ist Mitgründer und Geschäftsführer der intelligent views gmbh, wo er neben Vertrieb und Marketing den Bereich Knowledge Engineering verantwortet. In den letzten Jahren hat er bei intelligent views ein Team von Knowledge-Engineers aufgebaut, das einmalige Erfahrung in der praktischen Umsetzung semantischer Technologie versammelt: von der Modellierung semantischer Netze und Konfiguration intelligenter Applikationen bis zur Verknüpfung von Ontologien mit Suchmaschinen, Text-Mining-Techniken und user generated semantics.

Klaus Reichenberger hat über 12 Jahre Erfahrung in den Gebieten Semantik und Wissensmanagement und ist einer der führenden Experten in semantischer Modellierung. Sein persönlicher Schwerpunkt liegt im Thema 'business semantics' - wie bringe ich semantische Technologie ins Unternehmen und seine Prozesse hinein, welchen Nutzen kann ich damit stiften?

Vor der Gründung von intelligent views forschte Klaus Reichenberger bei der Fraunhofer Gesellschaft in den Bereichen Visualisierung und Wissensrepräsentation. Er ist Autor zahlreicher Publikationen und Vorträge zum Thema Wissensmanagement und Semantik.

Kaufen Sie hier:

Horizontale Tabs

Leseprobe
"Kapitel 3 Tagging und assoziative Netze (S. 21-22)

3.1 Tagging

Lassen Sie uns in die Übersicht über die verschiedenen Grade der semantischen Informationserschließung mit einer Vorstufe semantischer Netze einsteigen, dem Tagging von Informationen. Tags sind Schlagworte, mit denen beliebige Objekte charakterisiert werden können. Tags sind nichts grundsätzlich Neues, wir kennen sie als Teil einer klassischen Kombination aus jeder Bibliothek.

Hier sind die Bücher nach einer Aufstellungssystematik in Regale (= in Ordner) eingeordnet, daneben aber auch in einem Schlagwortkatalog verzeichnet (= mit Tags versehen). Diese Schlagworte werden entweder vom Verlag vorgeschlagen oder von einem Mitarbeiter der Bibliothek vergeben, der das Buch gelesen oder mindesten überflogen hat; als Dienstleistung für die Nutzer der Bibliothek. Die Praxis der Verschlagwortung bzw. des Tagging erleichtert das Finden relevanter Informationen ungemein; besonders zwingend natürlich dort, wo die Gegenstände, die gefunden werden sollen, sich anderen Techniken wie etwa der Volltextsuche verweigern.

Das ist z.B. der Fall bei einer der ersten und immer noch populärsten Anwendungen des Tagging, der Web-Bilddatenbank flickr,2 hier wird eine sehr große Sammlung von Bildern erst dadurch handhabbar gemacht, dass diese getagged sind. Das Neue am Tagging gegenüber dem Schlagwortkatalog der Bibliothek ist der dezentrale Charakter – nicht ein Redaktionsteam vergibt die Tags, sondern alle Nutzer einer Community.

Entsprechend setzt das Tagging in der Frage der Qualität auf der Prinzip der wisdom of crowds (auch crowdsourcing): worauf sich eine Mehrheit von Nutzern bei der Vergabe von Tags einigen kann, ist bestimmt auch für eine Mehrheit von Nutzern bei der Suche gut. Dieser Ansatz hat allerdings seine Grenzen. Welche das sind, zeigt uns am besten ein Beispiel: Wie bei den Verzeichnisstrukturen im letzten Abschnitt gelingt es auch dem Tagging i.d.R. nicht Objektidentität herzustellen, wenn auch aus anderen Gründen: Hier nämlich finden Synonyme wie Coffee Makers und Coffee Machines, hier finden Einzahl, Mehrzahl und Schreibfehler nicht zueinander.

Die Folgen sind ähnlich: Ein Nutzer steigt vielleicht mit dem Begriff Coffee Machine ein und weiß nicht, dass ihm wertvolle Dokumente entgehen, die aber mit Coffee Maker getagged sind. Dokumente mit Tags wie Coffee Makers (Plural) oder Coffe (Schreibfehler) sind wie falsch eingeordnete Bücher in einer Bibliothek – sie werden höchstens durch Zufall wiedergefunden. Dieses Problem ist untrennbar mit dem Ansatz verbunden, sich das Instrumentarium der Erschließung durch die Nutzer aufbauen zu lassen. Dann wären für unseren Nutzer noch Beziehungen (z.B. zwischen Coffee und Coffee Machine) hilfreich, denen er aufWunsch nachgehen könnte. Und schließlich würde eine Gruppierung der Tags, etwa in Getränke, Komponenten und Maschinentypen die Übersichtlichkeit und Eindeutigkeit erhöhen. Beides sind Instrumente, die uns das Tagging nicht ohne weiteres bieten kann."
Inhaltsverzeichnis
Inhaltsverzeichnis6
1 Warum dieses Buch?10
1.1 Was erwartet Sie in diesem Buch?10
2 Grundlagen semantischer Netze12
2.1 Objekte12
2.2 Eigenschaften13
2.3 Kernideen und Grundstze semantischer Modellierung15
2.3.1 Der Grundsatz der Objektidentitat16
2.3.2 Die Trennung von Objekt und Benennung18
2.3.3 Redundanzfreiheit durch Ableitungen19
2.4 Basisleistungen Verstehen der Nutzerfrage19
2.5 Basisleistungen Themenraum21
2.6 Andere Ordnungssysteme Thesauri und Taxonomien22
2.7 Semantische Netze in der Unternehmens-IT-Landschaft23
2.8 Semantic Web vs. semantische Netze im Unternehmen25
2.9 Leichtgewichtige und schwergewichtige Netze26
2.10 Zusammenfassung Grundlagen semantischer Netze27
Literatur28
3 Tagging und assoziative Netze29
3.1 Tagging29
3.2 Automatisch generierte assoziative Netze30
3.2.1 Grundprinzip Cluster-Analyse31
3.2.2 Statistisches Text-Mining -- Kookkurrenzen35
3.3 Nutzungsmglichkeiten und Bewertung35
3.4 Zusammenfassung -- Tagging und assoziative Netze36
Literatur37
4 Ausbaustufe Themennetz38
4.1 Kernideen von Themennetzen38
4.2 Nutzungsmglichkeiten39
4.3 Aufbau und Quellen42
4.3.1 Text-Mining: Cluster-Analyse43
4.3.2 Halbstrukturierte Quellen44
4.3.3 Auswertung der Endnutzer-Interaktionen und -Suchen45
4.3.4 Enduser-Tagging und -Editing46
4.3.5 Knowledge-Engineering47
4.3.6 Kombinationen47
4.4 Der Aufwand fr den Aufbau eines Themennetzes48
4.5 Zusammenfassung -- Themennetze49
Literatur49
5 Ausbaustufe Faktennetz51
5.1 Kernideen von Faktennetzen51
5.1.1 Vereinheitlichung53
5.1.2 Die Ober-/Unterbegriffsrelation54
5.1.3 Vererbung56
5.2 Nutzungsmglichkeiten57
5.2.1 Strukturierte Abfragen57
5.2.2 Anwendung von strukturierten Abfragen59
5.2.3 Spezifische Sichten60
5.2.4 Navigationsbaume und Reports60
5.2.5 Ähnlichkeitsermittlung62
5.2.6 Exkurs -- Semantische Netze und Datenbanken65
5.3 Aufbau und Quellen66
5.3.1 Text-Mining: gezieltes Parsing67
5.3.2 Strukturierte Quellen im Unternehmen68
5.3.3 Knowledge-Engineering70
5.4 Zusammenfassung -- Faktennetze70
Literatur70
6 Expertensysteme und Ontologien72
6.1 Komplexittsfaktoren72
6.2 Detailgrad des Modells72
6.2.1 Funktionale Detaillierung74
6.2.2 Zeitabhängige Aussagen75
6.2.3 Differenzierte Aussagen76
6.2.4 Komplexe Aussagen77
6.3 Allgemeingltigkeit des Modells78
6.3.1 Dynamik modellieren81
6.3.2 Komplexere Instrumente82
6.3.3 Description logic83
6.3.4 Komplexere Instrumente -- upper ontologies85
6.4 Aufbau und Quellen87
6.5 Zusammenfassung -- Expertensysteme und Ontologien87
Literatur87
7 Bewertung und Kombination der Ausbaustufen89
7.1 Kosten und Nutzen im Vergleich89
7.2 Kombinationen92
7.2.1 Zusammenwirken von Themen und Fakten92
7.2.2 Beimischungen von Expertensystem-Anteilen94
Literatur94
8 Projekt- und Anwendungsbeispiele95
8.1 Typische Einsatzszenarien fr semantische Netze95
8.2 Welche Ausbaustufe brauche ich?99
8.3 Projektbeispiel Pressearchiv100
8.4 Projektbeispiel Technologie-Atlas102
8.5 Projektbeispiel SAP Research Net104
8.6 Projektbeispiel Reklamationen und Qualittssicherung107
8.7 Projektbeispiel Vorentwicklung109
8.8 Nutzung semantischer Technologie in der Industrie111
Literatur114
9 Knowledge-Engineering116
9.1 Die Wahl des Ausgangspunkts116
9.2 Iteratives Vorgehen117
9.3 Die Interaktion mit Fachexperten119
9.4 Dokumentation der Modellierungsentscheidungen121
9.5 Konsistenzprfungen des Modells121
9.6 Grundlagen der Aufwandsabschtzung122
9.7 Die Werkzeuge123
9.8 Exkurs: Textbasiertes versus unabhngiges Editing124
9.9 Zusammenfassung Knowledge-Engineering125
Literatur126
10 Erschlieung von Dokumenten127
10.1 Suchmaschinen und ihre semantische Lcke127
10.2 Ebenen der Interpretation129
10.2.1 Die Interpretation der Nutzerfrage130
10.3 Makrotechniken132
10.3.1 Semantisch angereicherte Volltextsuche132
10.3.2 Automatische Klassifikation mit Cluster-Analyse135
10.4 Mikrotechniken137
10.5 Kombinationen und Varianten139
10.5.1 Der Zeitpunkt der Anwendung139
10.5.2 Prakoordination versus Postkoordination140
10.6 Vertiefung Texterschlieung142
10.7 Zusammenfassung -- Erschlieung von Dokumenten142
Literatur143
11 Modellierungsdetails144
11.1 Begriffe und Individuen144
11.2 Die Ober-/Unterbegriffsrelation147
11.3 Rollen150
11.4 Charakteristika von Relationen151
11.5 Die Rolle der Benennungen153
11.5.1 Kunstbegriffe zur Gruppierung154
11.5.2 Ausfaktorisieren von Eigenschaften durch Kunstbegriffe156
11.6 Mehrstellige Relationen156
11.7 Metamodelle und Mehrsprachigkeit160
11.8 Zusammenfassung -- Modellierungsdetails162
Literatur163
12 Unsicheres Wissen164
12.1 Unsicherheit, systematisch betrachtet164
12.2 Umgang mit fehlerbehafteter Information165
12.3 Der Anspruch auf Vollstndigkeit166
12.4 Formale Definitionen und unvollstndiges Wissen168
12.5 Ungenauigkeit und Robustheit169
12.6 Modelle unterschiedlicher Granularitt170
12.7 Przision im Schema174
12.8 Unsicherheit bei Ableitungen175
12.8.1 Kontextfreiheit und Ableitungen177
12.8.2 Ableitungen auf Begriffshierarchien180
12.9 Ausnahmen und Negativaussagen183
12.10 Zusammenfassung -- unsicheres Wissen184
Literatur185
13 bungen186
13.1 Übung 1: ein einfaches Automobilnetz186
13.2 Übung 2: ein kleines Geo-Modell186
13.3 Übung 3: Ableitungen187
13.4 Übung 4: Kombinationen188
13.5 Übung 5: Übersetzung einer MindMap188
13.6 Übung 6: Vertriebsmandate189
13.7 Auflsung Übung 1190
13.8 Auflsung Übung 2191
13.9 Auflsung Übung 3193
13.10 Mgliche Lsungen Übung 4195
13.11 Mgliche Lsung Übung 5196
13.12 Mgliche Lsung Übung 6198
Glossar201
Danksagung206
Register207

Weitere E-Books zum Thema: Wirtschaftsinformatik - Informationstechnik - IT

Informationsmanagement

E-Book Informationsmanagement
Format: PDF

Das Internet hat in den letzten Jahren ohne Zweifel erhebliche Veränderungen in der gesamten Ökonomie bewirkt. E-Business gehört heute zur Unternehmensrealität und konfrontiert das…

Informationsmanagement

E-Book Informationsmanagement
Format: PDF

Das Internet hat in den letzten Jahren ohne Zweifel erhebliche Veränderungen in der gesamten Ökonomie bewirkt. E-Business gehört heute zur Unternehmensrealität und konfrontiert das…

Informationsmanagement

E-Book Informationsmanagement
Format: PDF

Das Internet hat in den letzten Jahren ohne Zweifel erhebliche Veränderungen in der gesamten Ökonomie bewirkt. E-Business gehört heute zur Unternehmensrealität und konfrontiert das…

E-Learning

E-Book E-Learning
Einsatzkonzepte und Geschäftsmodelle Format: PDF

Der vorliegende Band ist dem Lernen und Lehren auf der Basis moderner Informations- und Kommunikationstechnologien gewidmet. Das Buch fasst die wichtigsten Ansätze zur Einführung, Umsetzung und…

E-Learning

E-Book E-Learning
Einsatzkonzepte und Geschäftsmodelle Format: PDF

Der vorliegende Band ist dem Lernen und Lehren auf der Basis moderner Informations- und Kommunikationstechnologien gewidmet. Das Buch fasst die wichtigsten Ansätze zur Einführung, Umsetzung und…

E-Learning

E-Book E-Learning
Einsatzkonzepte und Geschäftsmodelle Format: PDF

Der vorliegende Band ist dem Lernen und Lehren auf der Basis moderner Informations- und Kommunikationstechnologien gewidmet. Das Buch fasst die wichtigsten Ansätze zur Einführung, Umsetzung und…

E-Learning

E-Book E-Learning
Einsatzkonzepte und Geschäftsmodelle Format: PDF

Der vorliegende Band ist dem Lernen und Lehren auf der Basis moderner Informations- und Kommunikationstechnologien gewidmet. Das Buch fasst die wichtigsten Ansätze zur Einführung, Umsetzung und…

E-Learning

E-Book E-Learning
Einsatzkonzepte und Geschäftsmodelle Format: PDF

Der vorliegende Band ist dem Lernen und Lehren auf der Basis moderner Informations- und Kommunikationstechnologien gewidmet. Das Buch fasst die wichtigsten Ansätze zur Einführung, Umsetzung und…

E-Learning

E-Book E-Learning
Einsatzkonzepte und Geschäftsmodelle Format: PDF

Der vorliegende Band ist dem Lernen und Lehren auf der Basis moderner Informations- und Kommunikationstechnologien gewidmet. Das Buch fasst die wichtigsten Ansätze zur Einführung, Umsetzung und…

Weitere Zeitschriften

Baumarkt

Baumarkt

Baumarkt enthält eine ausführliche jährliche Konjunkturanalyse des deutschen Baumarktes und stellt die wichtigsten Ergebnisse des abgelaufenen Baujahres in vielen Zahlen und Fakten zusammen. Auf ...

bank und markt

bank und markt

Zeitschrift für Banking - die führende Fachzeitschrift für den Markt und Wettbewerb der Finanzdienstleister, erscheint seit 1972 monatlich. Leitthemen Absatz und Akquise im Multichannel ...

care konkret

care konkret

care konkret ist die Wochenzeitung für Entscheider in der Pflege. Ambulant wie stationär. Sie fasst topaktuelle Informationen und Hintergründe aus der Pflegebranche kompakt und kompetent für Sie ...

DGIP-intern

DGIP-intern

Mitteilungen der Deutschen Gesellschaft für Individualpsychologie e.V. (DGIP) für ihre Mitglieder Die Mitglieder der DGIP erhalten viermal jährlich das Mitteilungsblatt „DGIP-intern“ ...