•  
  •  
  •  
  •  
  •  
Data Science auf dem Prüfstand

8 Vorurteile zu Data Science

Der Data Scientist gehört zu den begehrtesten Berufen des 21. Jahrhunderts – gleichzeitig ranken sich um das Thema Data Science aber auch viele Gerüchte und Halbwahrheiten. bbv räumt mit acht Vorurteilen auf.

02.06.2021Text: bbv0 Kommentare
Data Science
  •  
  •  
  •  
  •  

1. Data Science braucht man nur, wenn man bahnbrechende Ideen sucht

Data Scientists arbeiten mit den Daten Ihrer Firma. Man sollte nicht erwarten, dass aus dieser Arbeit auf wundersame Weise eine komplett neue Geschäftsidee entsteht. Meistens kann ein Mehrwert aus den Daten generiert werden, indem beispielsweise Kosten eingespart werden oder mehr Umsatz generiert wird. Eine Herangehensweise in einem Data-Science-Projekt ist, einen bekannten Pain näher anzuschauen.

Fazit: Ist in Ausnahmen möglich

 2. Für Data Science braucht es grosse Mengen an Daten

Data Science ist zuerst mal das Verstehen des Problems sowie die Analyse von Daten und erst in zweiter Linie eine Modellentwicklung. Das kann sich auch für ein KMU durchaus lohnen. Bei sehr kleinen Datensätzen besteht die Gefahr, dass bereits ein Ausreisser eine extreme Auswirkung auf das Modell haben kann; es gibt also durchaus eine kritische Grenze für die Datenmenge. Das zeigt sich aber bei der Analyse der Daten sehr schnell. Gewisse Technologien wie neuronale Netze funktionieren dagegen nur mit hochdimensionierten Datensätzen.

Fazit: Falsch

 

3. Data Science ist teuer

Die wichtigste Regel für einen Data Scientist zu Beginn eines Projekts lautet: Fail fast. Bei der Analyse der Daten arbeitet er sehr eng mit den Fachleuten des Auftraggebers zusammen. Zu Beginn gibt es einen täglichen Austausch mit dem Ziel, möglichst rasch herauszufinden, ob die Daten überhaupt genug hergeben für ein tragfähiges Modell. Meistens zeigt sich schnell, ob aus einer Idee tatsächlich ein Projekt werden kann, das einen Mehrwert abwirft.

Fazit: Das muss nicht sein

 

4. Wer seine Kunden kennt, braucht kein Data Science

Ein guter Verkäufer erkennt im direkten Kontakt die Wünsche des Kunden. Er hat dies in vielen Verkaufsgesprächen gelernt und perfektioniert. Mit Hilfe von Data Science aber können versteckte, nicht offensichtliche Zusammenhänge hervorgebracht werden. Ausserdem können diese Erkenntnisse auf einer grossen Anzahl Datensätze angewandt werden. Zum Beispiel kann das Modell bei einer Marketingaktion diejenigen Kontakte zusammenstellen, die wahrscheinlich am Angebot interessiert sein werden – oder um jenes Interesse zu überprüfen.

Fazit: Nicht unbedingt

 

5. Alter Wein in neuen Schläuchen

Früher hiess es Business Intelligence und Data Analytics, davor (und zum Teil auch heute noch) wurden monströse Excel-Tabellen geführt, aus denen man mit der nötigen Anstrengung ebenfalls wichtige Informationen ziehen konnte. Doch Data Science will mehr: Letztlich geht es darum, ein Modell zu entwickeln (bestehend aus Algorithmus, Parametern und Features) und so eine möglichst genaue Voraussage zu einem bestimmten Verhalten oder einer Entwicklung treffen zu können. Soll ein Vorgang mithilfe eines solchen Modells gar automatisiert werden (beispielsweise Empfehlungen für Besucher eines Online-Shops), geht das mit Excel nicht.

Fazit: Data Science erweitert die Möglichkeiten herkömmlicher Technologien

 

6. Ein Data Scientist arbeitet vor allem mit Daten

Das ist ein weit verbreitetes Missverständnis: Gib der Data Scientistin ihren Data Lake, und sie schöpft in stiller Arbeit den Mehrwert. Datenanalyse und Modellentwicklung sind aber iterative Prozesse, die in enger Zusammenarbeit mit den Fachleuten des Auftraggebers vollzogen werden. In einem ersten Schritt versucht das Projektteam, die Fragestellung einzugrenzen: Wo liegt ein Problem, das mithilfe der Daten gelöst werden könnte? In einem zweiten Schritt analysiert die Data Scientistin die Daten, die für die Beantwortung dieser Frage benötigt werden. Dafür sind die Fachleute vor Ort unentbehrlich: Wo liegen welche Datensätze, gibt es auch individuell geführte Excel-Dateien oder sogar IoT-Geräte, die nützliche Daten liefern? In ersten einfachen Modellen werden signifikante Zusammenhänge gesucht, die immer wieder mit dem Fach gegengecheckt werden. Die Zusammenarbeit mit den Fachleuten vor Ort ist eine zentrale Komponente für ein erfolgreiches Data-Science-Projekt.

Fazit: Falsch

 

7. Die Datenqualität spielt keine Rolle

Das Bild des Data Lakes, in den alle Daten unstrukturiert gekippt werden und daraus einfach Mehrwert generiert werden kann, ist verlockend, aber gefährlich. Auch bei einem Data Lake ist zu überlegen, welche Daten wie gesammelt werden, denn eine grosse Datenmenge alleine ist kein Erfolgsgarant. Aus der Datenanalyse und der Entwicklung von geeigneten Modellen resultiert vielmehr die Erkenntnis, welche Daten erhoben und wie sie erfasst werden sollten, damit sie nach einer gewissen Zeit nutzbringend eingesetzt werden können. Das unstrukturierte, ziellose Sammeln von Daten ist auf Dauer teuer.

Fazit: Falsch

 

8. Die Umsetzung der Erkenntnisse ist teuer

Punkt sieben zeigt es schon im Ansatz: Der Erkenntnisgewinn durch ein Data-Science-Projekt kann auch ohne Inbetriebnahme eines Modells gross sein. Oft reicht es schon, wenn dank der Erkenntnisse ein nützliches Feature für das Marketing oder den Webshop programmiert oder schlicht ein Prozess angepasst wird. Dieser pragmatische Ansatz macht Data Science zahlbar und generiert schnell einen klaren Mehrwert.

Fazit: Falsch

 

Haben Sie sich mit einem dieser acht Punkte auch schon mal auseinandergesetzt? Als Einstieg für die Zusammenarbeit bietet sich ein Data Science Innovation Workshop an. In dessen Rahmen können wir gemeinsam mit Ihnen Ideen evaluieren, eine spezifische Lösung skizzieren und anhand eines schnellen Prototyps auch gleich überprüfen.

Der Experte

Georg Lampart

Georg Lampart ist Senior Database Consultant bei bbv und hat einen MAS in Data Science (ZHAW). Sein Spezialgebiet ist der Microsoft SQL Server. Er unterstützt Kunden bei der Umsetzung von Datenbankprojekten sowie bei der Analyse und Optimierung von Performance-Problemen.

Der Experte

Fabian Trottmann

Fabian Trottmann ist Projektleiter bei der bbv Software Services AG und schliesst im Sommer 2021 den Master of Science in Data Science ab (HSLU). Neben den Themen rund um Data Science berät er Kunden in seinem Spezialgebiet Application Lifecycle Management und DevOps.

Unser Wissen im Abo

Technica Radar 2021 Vol. 2

Die wichtigsten IT-Trends für die Schweiz

Agile Software Development
Ecosystems

Doping für Innovation

Digitale Transformation
Microsoft Power BI im Überblick

Power BI: Business Intelligence leicht gemacht

Data Analytics

Artikel kommentieren

Die E-Mail-Adresse wird nicht publiziert. Notwendige Felder sind mit einem * versehen.

Beachtung!

Entschuldigung, bisher haben wir nur Inhalte in English für diesen Abschnitt.

Achtung!

Entschuldigung, bisher haben wir für diesen Abschnitt nur deutschsprachige Inhalte.

Beachtung!

Entschuldigung, bisher haben wir nur Inhalte in English für diesen Abschnitt.

Achtung!

Entschuldigung, bisher haben wir für diesen Abschnitt nur deutschsprachige Inhalte.