Welche Kompetenzen benötigt ein Data Scientist?
Aktuelles Arbeitspapier liefert Orientierung für Weiterentwicklung der Lehre an Hochschulen und Unis sowie in der Aus- und Weiterbildung

 

Daten sind ein zentraler Rohstoff der Wirtschaft wie auch der Forschung. Aus ihrer zweckorientierten Analyse entstehen – unter anderem mit Methoden der Künstlichen Intelligenz – neue Erkenntnisse, Entscheidungshilfen und Wettbewerbsvorteile. Zu den Zielen der von der Bundesregierung Ende 2019 beschlossenen Eckpunkte einer Datenstrategie zählt daher, mehr Menschen, Unternehmen, wissenschaftliche Einrichtungen und zivilgesellschaftliche Organisationen zu befähigen, Daten effektiv und verantwortungsvoll zu nutzen.

Für die dazu benötigte Expertise gilt es, Data Science und den Umgang mit Daten insbesondere an den Hochschulen und Universitäten, aber auch in der Aus- und Weiterbildung auszubauen. Welche Kompetenzen im Einzelnen zu stärken sind, hat die Gesellschaft für Informatik e.V. (GI) in einer interdisziplinären Arbeitsgruppe unter Mitwirkung der Plattform Lernende Systeme erarbeitet. „Mit unserem Arbeitspapier wollen wir die Ausgestaltung von Studiengängen sowie von Aus- und Weiterbildungsangeboten erleichtern und dabei helfen, die richtigen Themen im Bereich Data Science zu adressieren“, betont Daniel Krupka, Geschäftsführer der GI.

Als Lern- und Ausbildungsinhalte für künftige Data Scientists definierten die Autor*innen insgesamt 14 Kompetenzfelder:

  1. Grundlagen der Mathematik und Statistik
  2. Fortgeschrittene Mathematik und Statistik
  3. Grundlagen der Informatik
  4. Fortgeschrittene Informatik
  5. Kryptographie und Sicherheit
  6. Datenethik und Data Privacy
  7. Data Governance
  8. Datenintegration
  9. Datenvisualisierung
  10. Data Mining
  11. Maschinelles Lernen/Deep Learning
  12. Business Intelligence
  13. Domänenspezifische Anwendungen
  14. Kommunikation mit Fachexperten und Implementierung von Data Science in der Organisation


In welcher Tiefe die Inhalte der einzelnen Kompetenzfelder vermittelt werden müssen, hängt von den jeweiligen Zielgruppen ab. Dazu erklärt Ulf Brefeld, Professor für Maschinelles Lernen an der Leuphana Universität Lüneburg und Mitglied der Plattform Lernende Systeme: „So bringen etwa Studierende der Kulturwissenschaften und des Ingenieurswesens unterschiedliche Voraussetzungen in ein aufbauendes Data Science-Studium mit – und werden im Anschluss auch an sehr unterschiedlichen Fragestellungen arbeiten. Diese Differenzierungen sollten berücksichtigt werden, damit wir genau die Spezialisten ausbilden, die wir benötigen.“

Drei Idealtypische Personengruppen

Die Autor*innen des Arbeitspapiers definieren drei idealtypischen Personengruppen, die stellvertretend für die unterschiedlichen Vorrausetzungen und Aspekte in der akademischen Ausbildung stehen. Ihnen werden jeweils konkrete Lerninhalte zugeschrieben:

  • Persona A besitzt einen Bachelor in Informatik, Mathematik/Statistik oder ggf. in Data Science und verfügt damit über nachweisbare Kenntnisse in Statistik, Information Engineering oder Künstliche Intelligenz (KI). Sie strebt einen Master in Data Science an, um später als Data Scientist in der Industrie oder Forschung zu arbeiten.
  • Persona B verfügt über einen Bachelor in einer Domänenwissenschaft – sei es in einem technischen, naturwissenschaftlichen oder auch geisteswissenschaftlichen Fach – und möchte Data-Science-Kompetenzen für diese Domäne erwerben.
  • Persona C steht mitten im Beruf und kann einschlägige informatische und mathematische Kenntnisse nachweisen. Ihr Ziel ist es, Data-Science-Kompetenzen für die praktische Anwendung im Job zu erwerben.


Das gemeinsam von der Gesellschaft für Informatik e.V. (GI) unter Mitwirkung der Plattform Lernende Systeme erstellte Arbeitspapier „Data Science: Lern- und Ausbildungsinhalte“ steht hier zum kostenfreien Download bereit: www.plattform-lernende-systeme.de/

 

Über die Plattform Lernende Systeme
Die Plattform Lernende Systeme wurde 2017 vom Bundesministerium für Bildung und Forschung (BMBF) auf Anregung des Fachforums Autonome Systeme des Hightech-Forums und acatech gegründet. Sie vereint Expert*innen aus Wissenschaft, Wirtschaft, Politik und Zivilgesellschaft aus dem Bereich Künstliche Intelligenz. In Arbeitsgruppen entwickeln sie Handlungsoptionen und Empfehlungen für den verantwortlichen Einsatz von Lernenden Systemen. Ziel der Plattform ist es, als unabhängiger Makler den gesellschaftlichen Dialog zu fördern, Kooperationen in Forschung und Entwicklung anzuregen und Deutschland als führenden Technologieanbieter für Lernende Systeme zu positionieren. Die Leitung der Plattform liegt bei Bundesministerin Anja Karliczek (BMBF) und Karl-Heinz Streibich (Präsident acatech).

Über die Gesellschaft für Informatik e.V.
Die Gesellschaft für Informatik e.V. (GI) ist mit rund 20.000 persönlichen und 250 korporativen Mitgliedern die größte und wichtigste Fachgesellschaft für Informatik im deutschsprachigen Raum und vertritt seit 1969 die Interessen der Informatiker*innen in Wissenschaft, Wirtschaft, öffentlicher Verwaltung, Gesellschaft und Politik. Mit 14 Fachbereichen, mehr als 30 aktiven Regionalgruppen und unzähligen Fachgruppen ist die GI Plattform und Sprachrohr für alle Disziplinen in der Informatik. Die Mitglieder binden sich an die Ethischen Leitlinien für Informatiker*innen der GI. Weitere Informationen unter www.gi.de.