Sie sind hier
E-Book

Data Science für Dummies

AutorLillian Pierson
VerlagWiley-VCH
Erscheinungsjahr2016
Seitenanzahl382 Seiten
ISBN9783527806751
FormatePUB
KopierschutzDRM
GerätePC/MAC/eReader/Tablet
Preis23,99 EUR


Lillian Pierson arbeitet als Datenanalystin und Umweltingenieurin. Sie gründete die Firma Data Mania, die sich mit Web Analytics, Datenjournalismus und Training in der Datenanalyse beschäftigt.

Kaufen Sie hier:

Horizontale Tabs

Leseprobe

Kapitel 1

Bei Data Science durchblicken

In diesem Kapitel

Data Science definieren

Data Science mithilfe seiner Schlüsselkomponenten definieren

Machbare Lösungen für Ihre eigenen Datenanforderungen bestimmen

Seit geraumer Zeit werden wir alle mit Daten total überschwemmt. Sie stammen von jedem Computer, jedem mobilen Gerät, jeder Kamera und jedem Sensor – und mittlerweile auch von Uhren und anderen tragbaren technischen Geräten. Sie werden bei jeder Aktion in den sozialen Netzwerken, bei jeder von uns gespeicherten Datei, bei jedem geschossenen Foto, jeder eingereichten Suchanfrage erzeugt. Auch wenn wir so etwas Einfaches machen, wie bei Google nach der nächsten Eisdiele zu suchen, entstehen viele Daten.

Obwohl das Eintauchen in Daten nichts Neues ist, haben Sie sicher bemerkt, dass sich das Phänomen beschleunigt. Seen, Pfützen und Flüsse von Daten haben sich in Fluten und wahre Tsunamis aus strukturierten, halbstrukturierten und nichtstrukturierten Daten verwandelt, die von fast jeder Aktivität ausströmen, die in der digitalen oder realen Welt stattfinden. Willkommen in der Welt von Big Data!

Sie haben sich vielleicht schon gewundert, »Was ist der Sinn dieser Daten? Warum wertvolle Quellen verwenden, um sie zu erzeugen und zu sammeln?« Obwohl schon vor einem Jahrzehnt niemand in der Lage war, groß Gebrauch von den erzeugten Daten zu machen, haben sich die Zeiten heute definitiv geändert. Als Daten-Ingenieure bezeichnete Spezialisten finden fortwährend innovative und leistungsstarke neue Wege, um unvorstellbar gewaltige Datenmengen zu fangen, zuzuordnen und zu verdichten. Andere Spezialisten, Datenforscher genannt, arbeiten daran, wertvolle und verfolgbare Einblicke aus diesen Daten zu gewinnen.

In ihrer reinsten Form steht Data Science für eine Optimierung von Prozessen und Quellen. Anhand von Data Science gewinnen Sie Einblicke in Daten – Einblicke, die Sie verwenden können, um Ihr Unternehmen, Ihre Investitionen, Ihre Gesundheit und auch Ihre Lebensführung und Ihr soziales Leben zu verstehen und zu verbessern. Für jedes vorstellbare Ziel oder Bestreben können Sie mit der Data Science Methoden finden, die Ihnen helfen, den direktesten Weg von dort, wo Sie sind, zu dem Punkt, wo Sie sein wollen, zu kennen und vorherzusagen und jedes Schlagloch auf dem Weg dazwischen vorauszusehen.

Schauen, wer von Data Science Gebrauch machen kann

Die Ausdrücke »Data Science« und »Data Engineering« werden oftmals falsch und inkonsistent verwendet, also lassen Sie mich hier beginnen, indem ich erkläre, dass diese beiden Bereiche in der Tat getrennte und unterschiedliche Fachgebiete sind. Data Science ist die Verwendung von Berechnungsverfahren, um nützliche und verfolgbare Erkenntnisse aus Ausgangsdaten abzuleiten. Data Engineering ist dagegen ein Ingenieurbereich, der den Zweck hat, Engpässe bei der Datenverarbeitung und Probleme bei der Behandlung von Daten für Anwendungen zu überwinden, die große Mengen, Arten und Geschwindigkeiten von Daten nutzen. Sowohl bei der Data Science als auch beim Data Engineering ist es üblich, mit den folgenden drei Arten von Daten zu arbeiten:

Strukturierte Daten: Daten, die in einem herkömmlichen relationalen Datenbanksystem gespeichert und verarbeitet wurden.

Unstrukturierte Daten: Daten, die gewöhnlich durch menschliche Aktivitäten erzeugt wurden und nicht in eine strukturierte Datenbank passen.

Halbstrukturierte Daten: Daten, die nicht in eine strukturierte Datenbank passen, die aber trotzdem durch Markierungen strukturiert sind, die nützlich sind, um eine Form von Ordnung und Hierarchie bei ihnen zu erzeugen.

Viele Leute glauben, dass nur große Organisationen, die über ausreichende finanzielle Mittel verfügen, Methoden der Data Science anwenden, um ihr Unternehmen zu optimieren und zu vervollkommnen, aber das ist nicht der Fall. Die Vermehrung der Daten hat eine Nachfrage nach Einblicken erzeugt, und diese Nachfrage ist in viele Aspekte unserer modernen Kultur eingebettet. Daten und die Notwendigkeit von Einblicken in diese Daten sind allgegenwärtig. Da Organisationen jeder Größe zu erkennen beginnen, dass sie in einer datengesteuerten, auf Wettbewerb ausgerichteten Umgebung mit einer Friss-oder-Stirb-Mentalität eingetaucht sind, entwickelt sich Daten-Fachwissen zum Herzstück und Rüstzeug in nahezu allen Geschäftsbereichen.

Was aber bedeutet das für einen normalen Menschen? Es heißt zunächst, dass sich unsere Kultur verändert hat und Sie sich auf dem Laufenden halten müssen. Das bedeutet nicht, dass Sie zurück in die Schule gehen und einen Abschluss in Statistik, Computerwissenschaften oder Data Science machen müssen. In dieser Hinsicht unterscheidet sich die Datenrevolution nicht so sehr von jeder anderen Veränderung, die die Industrie in der Vergangenheit getroffen hat. Tatsache ist: Um weiter aktuell zu bleiben, müssen Sie nur die Zeit und die Anstrengung aufbringen, um die Fähigkeiten zu erwerben, die Sie auf dem Laufenden halten. Wenn es darauf hinausläuft, zu lernen, wie Data Science anzuwenden ist, können Sie einige Kurse belegen, sich selbst mit im Netz zur Verfügung stehenden Quellen etwas beibringen, Bücher wie dieses lesen und Veranstaltungen besuchen, bei denen Sie lernen, was Sie wissen müssen, um in Bestform zu bleiben.

Wer kann Data Science verwenden? Sie können es. Ihr Betrieb kann es. Ihr Arbeitgeber kann es. Jeder, der ein wenig Verständnis und Übung hat, kann beginnen, Daten-zentrierte Sichtweisen zu verwenden, um sein Leben, seine Karriere und das Wohlergehen seines Unternehmens zu verbessern. Data Science stellt eine Änderung der Art und Weise dar, wie Sie an die Welt herangehen. Menschen sind es gewohnt, zu arbeiten und auf Ergebnisse zu hoffen, aber Dateneinblicke bieten die Vision, die die Menschen benötigen, um Veränderungen starten und Dinge gut ablaufen zu lassen. Sie können eine Daten-zentrierte Sichtweise verwenden, um die folgenden Änderungen zu bewirken:

Optimierung von betrieblichen Systemen und Kapitalrenditen (englisch Return on Investment, ROI) für jede messbare Aktivität.

Verbesserung der Effektivität von Verkäufen und Marketing-Initiativen, ob sie nun Teil einer betrieblichen Marketing-Kampagne oder lediglich ein persönlicher Aufwand sind, um bessere Beschäftigungsmöglichkeiten für sich selbst zu sichern.

Der Konkurrenz bei den allerneuesten Entwicklungen in jedem Bereich eine Nasenlänge voraus zu sein.

Gemeinschaften sicherer zu erhalten.

Die Welt für die zu einem besseren Platz zu machen, die weniger wohlhabend sind.

Die Teile des Data-Science-Puzzles betrachten

Um Data Science im eigentlichen Sinne des Wortes anzuwenden, benötigt man die analytischen Kenntnisse der Mathematik und Statistik, Programmierfertigkeiten und Fachkompetenz. Ohne Fachkompetenz könnten Sie sich auch Mathematiker oder Statistiker nennen. Genauso wie Software-Programmierer ohne Fachkompetenz und analytisches Fachwissen besser als Software-Ingenieur oder -Entwickler denn als Datenwissenschaftler betrachtet werden.

Da die Nachfrage nach einer Daten-zentrierten Sichtweise exponentiell wächst, ist jeder Bereich gezwungen, Data Science anzuwenden. Von daher haben sich verschiedene Richtungen von Data Science herauskristallisiert. Hier folgen nur ein paar Namen, unter denen Experten jeder Disziplin Data Science verwenden: Ad-Tech-Datenwissenschaftler, Banking Digital Analyst, Klinischer Datenwissenschaftler, Datenwissenschaftler der Geo-Ingenieurwissenschaften, Datenwissenschaftler der Geografie, Datenwissenschaftler im Personalbereich des Einzelhandels, Klinischer Informationsanalytiker im Bereich Pharmakometrie. Da es oftmals so scheint, dass man nicht die Übersicht darüber behalten kann, wer ein Datenwissenschaftler ohne Scorecard (= Ergebniskarte) ist, nehme ich mir in den folgenden Abschnitten die Zeit, um die Schlüsselkomponenten hier darzulegen, die ein Teil jeder Anwendung der Data Science sind.

Daten sammeln, abfragen und bearbeiten

Dateningenieure haben die Aufgabe, große Mengen von strukturierten, unstrukturierten und halbstrukturierten Big Data zu erfassen und zu sortieren; Daten, die die Verarbeitungskapazität herkömmlicher Datenbanken übersteigen, da sie zu umfangreich sind, sich zu schnell bewegen oder nicht die strukturellen Anforderungen herkömmlicher Datenbanken erfüllen. Um es noch einmal zu betonen, die Aufgaben von Dateningenieuren unterscheiden sich von der in der Data Science durchgeführten Arbeit, die ihren Schwerpunkt eher in der Analyse, Vorhersage und Sichtbarmachung hat. Trotz dieser Unterscheidung verrichtet ein Datenwissenschaftler, wenn er die zur Analyse notwendigen Daten sammelt, befragt und gebraucht, eine Arbeit, die große Ähnlichkeit mit der eines Dateningenieurs hat.

Obwohl...

Blick ins Buch

Weitere E-Books zum Thema: Statistik - Algorhitmen

Deutscher SCOR-Preis für Aktuarwissenschaften 2009

E-Book Deutscher SCOR-Preis für Aktuarwissenschaften 2009
Zusammenfassungen eingereichter Arbeiten - Schriftenreihe der SCOR DEUTSCHLAND 9 Format: PDF

Der SCOR-Preis für Aktuarwissenschaften wurde 2009 zum 12. Mal verliehen. Die in Kooperation mit der Universität Ulm gestiftete Auszeichnung hat sich im deutschsprachigen Raum zum bedeutendsten Preis…

Deutscher SCOR-Preis für Aktuarwissenschaften 2011

E-Book Deutscher SCOR-Preis für Aktuarwissenschaften 2011
Zusammenfassungen eingereichter Arbeiten - Schriftenreihe der SCOR DEUTSCHLAND 12 Format: PDF

Den SCOR-Preis für Aktuarwissenschaften verleiht die SCOR Rückversicherungs-Gruppe in Zusammenarbeit mit der Universität Ulm seit 1998 jährlich an junge Wissenschaftler, die sich im Rahmen ihrer…

Kreditrisikomessung

E-Book Kreditrisikomessung
Statistische Grundlagen, Methoden und Modellierung Format: PDF

Jeder Kredit birgt für den Kreditgeber ein Risiko, da unsicher ist, ob Kreditnehmer ihren Zahlungsverpflichtungen nachkommen. Kreditrisiken werden mit Hilfe statistischer Methoden und mathematischer…

Statistik für Ökonomen

E-Book Statistik für Ökonomen
Datenanalyse mit R und SPSS Format: PDF

Die Autoren erläutern in einer anschaulichen, anwendungsorientierten und kompakten Darstellung alle elementaren statistischen Verfahren, die in der Ökonomie angewendet werden - ergänzt durch…

Weitere Zeitschriften

Menschen. Inklusiv leben

Menschen. Inklusiv leben

MENSCHEN. das magazin informiert über Themen, die das Zusammenleben von Menschen in der Gesellschaft bestimmen -und dies konsequent aus Perspektive der Betroffenen. Die Menschen, um die es geht, ...

BONSAI ART

BONSAI ART

Auflagenstärkste deutschsprachige Bonsai-Zeitschrift, basierend auf den renommiertesten Bonsai-Zeitschriften Japans mit vielen Beiträgen europäischer Gestalter. Wertvolle Informationen für ...

Courier

Courier

The Bayer CropScience Magazine for Modern AgriculturePflanzenschutzmagazin für den Landwirt, landwirtschaftlichen Berater, Händler und generell am Thema Interessierten, mit umfassender ...

Das Hauseigentum

Das Hauseigentum

Das Hauseigentum. Organ des Landesverbandes Haus & Grund Brandenburg. Speziell für die neuen Bundesländer, mit regionalem Schwerpunkt Brandenburg. Systematische Grundlagenvermittlung, viele ...

SPORT in BW (Württemberg)

SPORT in BW (Württemberg)

SPORT in BW (Württemberg) ist das offizielle Verbandsorgan des Württembergischen Landessportbund e.V. (WLSB) und Informationsmagazin für alle im Sport organisierten Mitglieder in Württemberg. ...

Die Versicherungspraxis

Die Versicherungspraxis

Behandlung versicherungsrelevanter Themen. Erfahren Sie mehr über den DVS. Der DVS Deutscher Versicherungs-Schutzverband e.V, Bonn, ist der Interessenvertreter der versicherungsnehmenden Wirtschaft. ...

IT-BUSINESS

IT-BUSINESS

IT-BUSINESS ist seit mehr als 25 Jahren die Fachzeitschrift für den IT-Markt Sie liefert 2-wöchentlich fundiert recherchierte Themen, praxisbezogene Fallstudien, aktuelle Hintergrundberichte aus ...

F- 40

F- 40

Die Flugzeuge der Bundeswehr, Die F-40 Reihe behandelt das eingesetzte Fluggerät der Bundeswehr seit dem Aufbau von Luftwaffe, Heer und Marine. Jede Ausgabe befasst sich mit der genaue Entwicklungs- ...