Sie sind hier
E-Book

Deep Learning mit TensorFlow, Keras und TensorFlow.js

AutorAlassane Ndiaye, Matthieu Deru
VerlagRheinwerk Computing
Erscheinungsjahr2019
Seitenanzahl423 Seiten
ISBN9783836265119
FormatePUB
KopierschutzWasserzeichen
GerätePC/MAC/eReader/Tablet
Preis35,90 EUR
Deep Learning entdecken und erfolgreich implementieren Von der Aufbereitung der Daten bis zur Visualisierung Basisprojekte mit Beispielen aus vielen Anwendungsfeldern Mit Python, HTML5 und JavaScript Deep Learning entdecken Deep Learning ist die Schlüsseltechnologie des derzeitigen Booms Künstlicher Intelligenz. Neuronale Netze können Höchstleistung erbringen, wenn sie als Deep-Learning-Netze aufgestellt sind und mit großen Datenmengen trainiert werden - und wenn Sie wissen, wie man dieses maschinelle Lernen geschickt implementiert. Lernen Sie hier, wie Sie die mächtigen Frameworks in realen Projekten erfolgreich einsetzen. Unsere Autoren zeigen Ihnen sowohl die Arbeit mit Python und Keras als auch für den Browser mit JavaScript, HTML5 und TensorFlow.js.

Dr. Matthieu Deru ist Senior Software-Engineer (R&D) und UX-Designer für interaktive Systeme am Deutschen Forschungszentrum für Künstliche Intelligenz GmbH (DFKI). Seine Projekterfahrung umfasst Themengebiete, die so vielseitig sind wie die Anwendungsfelder der KI, von intelligenten Benutzerschnittstellen bis zu komplexen Vorhersagenmodellen für die Elektromobilität.

Kaufen Sie hier:

Horizontale Tabs

Leseprobe

1.3    Deep Learning im Alltag und in der Zukunft


In diesem Abschnitt werden zur Einführung in die Thematik einige Anwendungsbeispiele von Deep Learning präsentiert. Sie haben bestimmt irgendwann in Ihrem Alltag eines dieser Systeme benutzt – vielleicht auch ohne es zu wissen!

1.3.1    Sprachverarbeitung


Die Spracherkennung und die natürlichsprachlichen Dialogsysteme haben in den letzten Jahren enorm von den Fortschritten des Deep Learnings profitiert. Durch die Analyse massiver Datenmengen und annotierter Sprachaufnahmen ist es möglich, die Sprache des Benutzers besser zu verstehen (auch mit Dialekten) und semantisch zu verarbeiten, d. h. den Sinn des gesprochenen Satzes automatisch zu ermitteln. Denken Sie dabei an persönliche digitale Assistenten wie Apple Siri, Amazon Alexa (siehe Abbildung 1.3), Google Now, Cortana aber auch an Hotline- und Chat-Systeme, die bei den Callcentern der Deutschen Telekom, der Lufthansa oder sogar von Zalando benutzt werden.

Abbildung 1.3    Digitaler Assistent: Amazon Echo Dot mit der Spracherkennungskomponente Alexa

Diese Systeme analysieren binnen einiger Millisekunden die Spracheingabe des Benutzers bzw. Anrufers und geben eine passende Antwort zurück. Abstrahiert man vom einfachen Frage-Antwort-Szenario à la »Wie wird morgen das Wetter?« oder »Gib mir Informationen zu meinem Termin!«, geht die aktuelle Entwicklung in Richtung Dialogsysteme, d. h. Systeme, die in der Lage sind, unter Berücksichtigung von Dialogkontext und -historie einen kompletten Dialog mit dem Benutzer zu führen. Diese Systeme können sogar Rückfragen stellen, wenn das Gesprochene nicht eindeutig genug war oder mehr Informationen vom Benutzer benötigt werden, um eine Anfrage vollständig zu beantworten.

Google Duplex[ 3 ], ein neuer digitaler Assistent, wurde so weit trainiert, dass er selbstständig ein Telefonat mit einem Gesprächspartner führen kann, um z. B. Termine beim Friseur zu vereinbaren. Die Dialoge sind zwar noch auf die üblichen Aufgaben beschränkt, die Benutzer in ihrem Terminkalender eintragen (z. B. »Tisch beim Restaurant Locanda für 19 Uhr reservieren«), aber am anderen Ende der Telefonleitung merkt der Angerufene oftmals nicht, dass er einen Dialog mit einem KI-gestützten Dialogsystem geführt hat!

1.3.2    Automatische Sprachübersetzungen


Sprachübersetzung ist eine komplexe Aufgabe: Regeln müssen aufgesetzt werden, Begriffe, Synonyme, Flexionen und Syntax besonders gut analysiert werden. Traditionelle Sprachübersetzungssoftware benutzt Statistiken, Wörterbücher und Grammatiken und versucht, eine Abbildung von einer Sprache in die andere zu erzeugen. Bei Deep-Learning-basierten Sprachübersetzungen oder besser gesagt Neural Machine Translation werden neuronale Netze benutzt, um Texte oder Äußerungen in andere Sprachen zu übersetzen.

Ein gutes Beispiel für die Benutzung von tiefen neuronalen Netzen für die Übersetzungsaufgaben zeigt uns die Kölner Firma DeepL (siehe Abbildung 1.4).

Abbildung 1.4    DeepL benutzt neuronale Netzte, um Übersetzungen genauer durchzuführen. (Quelle: https://www.deepl.com/press.html)

Dank eines Supercomputers werden eine Million Wörter in weniger als einer Sekunde übersetzt, und zwar für 42 Sprachkombinationen. Angefangen hatte DeepL mit dem webbasierten Dienst Linguee[ 4 ], und zwar mit offenen Textquellen, die schon von Menschen in verschiedenste Sprachen übersetzt wurden, z. B. die offiziellen Webseiten bzw. Texte des Europäischen Parlaments.[ 5 ] Diese bildeten die Datengrundlage für das Lernen eines Übersetzungsmodells.

1.3.3    Visual Computing


Im Bereich Visual Computing (computergestütztes Sehen) sind mithilfe von Deep Learning enorme Fortschritte erzielt worden. Diese reichen von der Handschriftenerkennung bis hin zu Echtzeit-Videoanalysen, die bei selbstfahrenden Autos zum Einsatz kommen und etwa bei der Fahndung nach polizeilich gesuchten Personen.[ 6 ] Online-Dienste, wie z. B. Amazon Recognition oder Microsoft Cognitive Services (siehe Abbildung 1.5) bieten sogar mehrere »Out-of-the-Box«-Modelle, die es ermöglichen, Objekte, Personen, Texte, Szenen und Aktivitäten in Bildern zu erkennen und anhand bestimmter Parameter auszuwerten.

Abbildung 1.5    Bildanalyse mit »Microsoft Cognitive Services«

Der Grafikkartenhersteller NVIDIA bietet ebenfalls für Entwickler in Form eines SDK (Software Development Kit) zahlreiche Bausteine, z. B. DeepStream, um Lösungen für Videoanalyse-Applikationen mit Deep Learning zu erstellen.

Aber wieso interessiert sich ausgerechnet ein Grafikkartenhersteller für Deep Learning? Da die Vorverarbeitung und das Trainieren von Modellen auf Basis von Daten aus Pixelinformationen von Bildern und Videos sehr zeitintensiv sind, werden diese Operation nicht mehr direkt auf der CPU (Central Processing Unit) durchgeführt, sondern auf der GPU (Graphical Processing Unit).

Letztere ist im Gegensatz zur CPU dafür konzipiert, schnell, effizient und parallel Matrix- und Vektoroperationen durchzuführen: Denken Sie an Videospiele und an die zahlreichen Operationen, die synchron ausgeführt werden müssen, damit eine 3D-Szene flüssig auf Ihrem Bildschirm angezeigt wird.

Diese Fähigkeit der Grafikkarten, sehr schnell komplexe Daten und Operationen zu berechnen, wurde quasi für Deep-Learning-Anwendungen »missbraucht« (siehe Abbildung 1.6). Somit sind heute die Konzepte von GPU-basierten Systemen und Deep Learning nicht mehr voneinander zu trennen. Sie werden später in diesem Buch erfahren, wie Sie auch Ihre eigene Deep-Learning-Applikation mit GPU-Unterstützung implementieren können.

Abbildung 1.6    Modularer Aufbau der DeepStream-SDK-Lösung zur Videoanalyse (https://developer.nvidia.com/deepstream-sdk)

[»]  Diskriminierungen

Machine Learning und Deep Learning können natürlich diskriminierend sein. Fürs Trainieren der Lernalgorithmen werden Daten eingesetzt, die von Menschen über einen Zeitraum von mehreren Jahren gesammelt oder erstellt wurden. Diese Daten sind eventuell verzerrt (engl. biased). Die Algorithmen können so Vorurteile reproduzieren, die den Daten inhärent sind. Diese Frage wird nicht in diesem Buch thematisiert. Mehr zur dieser Thematik finden Sie z. B. in:

1.3.4    Autonomes Fahren


Einer der heiß diskutierten und medienwirksamsten Anwendungsbereiche für KI und Deep Learning ist wahrscheinlich das autonome Fahren. Systeme wie Autopilot vom Autohersteller Tesla, das selbstfahrende Auto Waymo von Google oder sogar das bescheidene Open-Source-Projekt comma.ai[ 7 ] zeigen, wie durch eine automatische Sensorfusion (z. B. vom LIDAR oder der ODB-2-Schnittstelle) und Deep Learning ein Fahrzeug eigenständig und intelligent angesteuert werden kann (siehe Abbildung 1.7).

Abbildung 1.7    Tesla Autopilot: Die einzelnen Bereiche und Gegenstände, die während der Fahrt von den Kameras des Fahrzeugs aufgenommen werden (Ampel, Verkehrsschild), werden klassifiziert und in Echtzeit gekennzeichnet (Bildquelle: Tesla Werbevideo – https://www.tesla.com/de_DE/autopilot)

Dieser Bereich profitiert sehr stark von den Entwicklungen von Deep Learning: einerseits, weil massenweise Daten über Straßen und Navigation gesammelt wurden, und andererseits, weil die Entwicklung im Bereich Visual Computing wie automatische Fahrspurenerkennung (engl. lane detection) oder Straßenschildererkennung und intelligente Segmentierung dazu beigetragen haben, Gefahrensituationen besser zu identifizieren. Zusätzlich wird in diesem Bereich auch verstärkt mit der Generierung von realitätsnahen Daten, sogenannten synthetischen Daten, gearbeitet. Hiermit können simulierte Bilddaten von realen Situationen als 3D-Szene vorgeneriert werden, um auf Basis dieser 3D-Szene komplexe Modelle zu trainieren.

...
Blick ins Buch

Weitere E-Books zum Thema: Programmiersprachen - Softwareentwicklung

Leben 3.0

E-Book Leben 3.0
Mensch sein im Zeitalter Künstlicher Intelligenz Format: ePUB

Die Nobelpreis-Schmiede Massachusetts Institute of Technology ist der bedeutendste technologische Think Tank der USA. Dort arbeitet Professor Max Tegmark mit den weltweit führenden Entwicklern k…

Apps effektiv managen und vermarkten

E-Book Apps effektiv managen und vermarkten
Die eigene App erfolgreich veröffentlichen: Von der Konzeption bis zur Vermarktung Format: PDF

Lernen Sie Ihre App effektiv, strukturiert und begeisternd weltweit zu vermarkten. In diesem praxisorientierten Buch erhalten Sie einen prägnanten Überblick von der Idee und Konzeption einer App,…

Python 3 - Intensivkurs

E-Book Python 3 - Intensivkurs
Projekte erfolgreich realisieren Format: PDF

Python ist eine vollwertige Programmiersprache, mit der sich auch größere Anwendungen entwickeln lassen. In den letzten Jahren hat sie an Beliebtheit gewonnen, und mit Python 3 steht eine stark…

Informatik

E-Book Informatik
Anwendungsorientierte Einführung in die allgemeine Wirtschaftsinformatik Format: PDF

Das einführende Informatik-Lehrbuch wendet sich nicht nur an Informatik-Studenten, sondern sogar in erster Linie an Studierende und Praktiker solcher Disziplinen, in denen Informatik zur…

Wege aus der Softwarekrise

E-Book Wege aus der Softwarekrise
Verbesserungen bei der Softwareentwicklung Format: PDF

Seit Jahrzehnten steckt die Softwareentwicklung in der Krise. Laut aktuellen Statistiken gehen immer noch mehr als die Hälfte aller in der IT-Produktion eingesetzten Mittel verloren. Angekündigte…

MDA®

E-Book MDA®
Effektives Software-Engineering mit UML2® und Eclipse? Format: PDF

Dieses Buch liefert sowohl die theoretischen Grundlagen als auch das praktische Handwerkszeug zur Anwendung der Model-Driven-Architecture der OMG. Nach einer Definition und der Einordnung des…

Dynaxity

E-Book Dynaxity
Management von Dynamik und Komplexität im Softwarebau Format: PDF

Das Buch wendet sich an IT-Entwickler, Projektmanager und CIO's. Hauptthema ist die gezielte Entwicklung von Fähigkeiten (Skills) jenseits der klassischen 'IT-Denke'. Fakt ist, dass laut…

Weitere Zeitschriften

MENSCHEN. das magazin

MENSCHEN. das magazin

MENSCHEN. das magazin informiert über Themen, die das Zusammenleben von Menschen in der Gesellschaft bestimmen -und dies konsequent aus Perspektive der Betroffenen. Die Menschen, um die es geht, ...

FREIE WERKSTATT

FREIE WERKSTATT

Hauptzielgruppe der FREIEN WERKSTATT, der unabhängigen Fachzeitschrift für den Pkw-Reparaturmarkt, sind Inhaberinnen und Inhaber, Kfz-Meisterinnen und Kfz-Meister bzw. das komplette Kfz-Team Freier ...

küche + raum

küche + raum

Internationale Fachzeitschrift für Küchenforschung und Küchenplanung. Mit Fachinformationen für Küchenfachhändler, -spezialisten und -planer in Küchenstudios, Möbelfachgeschäften und den ...

Demeter-Gartenrundbrief

Demeter-Gartenrundbrief

Einzige Gartenzeitung mit Erfahrungsberichten zum biologisch-dynamischen Anbau im Hausgarten (Demeter-Anbau). Mit regelmäßigem Arbeitskalender, Aussaat-/Pflanzzeiten, Neuigkeiten rund um den ...

Deutsche Tennis Zeitung

Deutsche Tennis Zeitung

Die DTZ – Deutsche Tennis Zeitung bietet Informationen aus allen Bereichen der deutschen Tennisszene –sie präsentiert sportliche Highlights, analysiert Entwicklungen und erläutert ...

ea evangelische aspekte

ea evangelische aspekte

evangelische Beiträge zum Leben in Kirche und Gesellschaft Die Evangelische Akademikerschaft in Deutschland ist Herausgeberin der Zeitschrift evangelische aspekte Sie erscheint viermal im Jahr. In ...