Neues Whitepaper der Plattform Lernende Systeme

Wie mit Data Science erfolgreiche KI entsteht

Künstliche Intelligenz verspricht großen Nutzen für Wirtschaft und Gesellschaft. Grundlage für die erfolgreichen Anwendungen sind Daten. Um die Potenziale von künstlicher Intelligenz auszuschöpfen, braucht es daher ein umfassendes Datenmanagement. Ein aktuelles Whitepaper der Plattform Lernende Systeme zeigt die Bedeutung des interdisziplinären Forschungszweigs Data Science als Schlüsseldisziplin für Wissenschaft sowie Wirtschaft und benennt Handlungsoptionen.

(Bild: ©pdusit/stock.adobe.com)

Ob medizinische Assistenzsysteme, autonome Fahrzeuge oder die vorausschauende Wartung von Industrieanlagen – sie alle werten in kurzer Zeit Daten aus, die heute in großen Mengen zur Verfügung stehen. Data-Science-Methoden machen all diese KI-Anwendungen erst möglich. Sie gelten außerdem als Wegbereiter für die wissenschaftlichen Erkenntnisse in vielen datenintensiven Forschungsfeldern wie der Klimaforschung, der Astronomie oder der Chemie. “Wenn Daten der Rohstoff des digitalen Zeitalters sind, dann ist Data Science das Werkzeug, mit dem sich dieser Schatz heben lässt “, sagt Daniel Keim, Professor für Datenanalyse und Visualisierung der Universität Konstanz und Mitglied der Arbeitsgruppe Technologische Wegbereiter und Data Science der Plattform Lernende Systeme. “Große Datenmengen allein reichen nicht aus, um KI-Anwendungen zu entwickeln. Zuvor müssen die Daten für das Training von lernenden Algorithmen erst vorbereitet, ihre Validität geprüft und die Daten zugänglich gemacht werden.

Dafür brauchen wir ein umfassendes Datenmanagement inklusive fortgeschrittener Möglichkeiten zur Visualisierung der Daten. Das wird in der Diskussion um künstliche Intelligenz leider oft zu wenig beachtet.” Insbesondere das Erschließen der Daten und die Sicherstellung der Datenqualität sei häufig ein aufwändiger Prozess, heißt es im Whitepaper der Plattform Lernende Systeme. So werde für KI-Projekte der Aufwand für die Datenerfassung und -aufbereitung auf bis zu 80 Prozent geschätzt. Die Ergebnisse und Empfehlungen von KI-Systemen können nur so gut sein wie die ihnen zugrunde liegenden Daten, so die Autoren. Fehlerhafte Werte müssten z.B. erkannt und entfernt, Daten annotiert und – um sie nachvollziehbar zu machen – durch Metadaten beschrieben werden. Neben Aspekten wie Vollständigkeit oder Widerspruchsfreiheit sollte auch bereits bei der Datenauswahl auf mögliche Verzerrungen geachtet werden, um etwa Diskriminierung zu vermeiden. Eine Software zur Bewertung von Job-Kandidaten dürfe beispielsweise nicht nur mit den Daten erfolgreicher Bewerber der Vergangenheit trainiert werden, so die Studie.

Mehr als nur Technik

Data Scientists benötigen daher nicht nur Fähigkeiten im Datenmanagement, des maschinellen Lernens, der Statistik und der Visualisierung, sondern auch Kenntnisse zu Ethik und Recht, um mit den Daten verantwortungsvoll umzugehen. “Anwendungsexpertinnen und -experten benötigen zunehmend sogenannte Data-Literacy-Expertise und Data-Science-Fachleute müssen auch die Anwendungsdomänen verstehen. Hier wird sich sicher ein großer Bedarf an Weiterbildungsangeboten entwickeln”, sagt Co-Autor Kai-Uwe Sattler, Professor für Datenbanken und Informationssysteme an der TU Ilmenau und Mitglied der Arbeitsgruppe Technologische Wegbereiter und Data Science der Plattform Lernende Systeme. Der Beruf des Data Scientists gelte als einer der wichtigsten Berufe, heißt es in dem Whitepaper. Zudem würden Data-Science-Kompetenzen heute schon in vielen anderen Berufsbildern gefordert. So empfehlen die Autoren, der Data Science in Informatikstudiengängen mehr Raum zu geben.

Um das Verständnis von Data-Science-Prozessen und -Technologien zu fördern, sollten aber auch andere Studiengänge und Schulen Data-Literacy-Kompetenzen vermitteln. Über die Forschung hinaus sei dies die Grundlage, um Talente auszubilden, die schließlich KI-Wissen in die Unternehmen tragen und dort den Transfer in die Anwendung unterstützen könnten, so die Autoren. An welchen Hochschulen Interessierte Studiengänge rund um KI und Data Science finden, zeigt die KI-Landkarte der Plattform Lernende Systeme, die online aufrufbar ist.

Infrastruktur schaffen

Neben der Aus- und Weiterbildung ist nach Ansicht der Autoren eine unabhängige Infrastruktur mit ausreichend Speicher- bzw. Rechenkapazität notwendig, um das Potenzial der Daten für Wirtschaft und Gesellschaft abschöpfen zu können. Man dürfe sich nicht zu einer unreflektierten Übernahme von scheinbar erfolgreichen Modellen der Internetkonzerne verführen lassen. Um die Prozesse des Datenmanagements eigenständig gestalten zu können, sei ein Ausbau von europäischen Datenräumen und -infrastrukturen notwendig, raten die Autoren.

Das könnte Sie auch interessieren

57 Prozent der Unternehmen aus der verarbeitenden Industrie gehen davon aus, gestärkt aus der Corona-Krise hervorzugehen. Das geht aus einer Studie von Sopra Steria und dem F.A.Z.-Institut hervor. Um diese Position auch künftig behaupten zu können, wollen die Betriebe laut Studie die eigene Widerstandsfähigkeit als strategisches Thema verankern.
‣ weiterlesen

Anzeige

Insgesamt 8,2Mrd.€ hat der Maschinen- und Anlagenbau im Jahr 2019 für Forschung und Entwicklung ausgegeben. Auch in der Pandemie behalten F&E-Ausgaben einen hohen Stellenwert.‣ weiterlesen

Anzeige

Die reale (preisbereinigte) Produktion im Produzierenden Gewerbe war nach vorläufigen Angaben des Statistischen Bundesamtes (Destatis) im März 2021 saison- und kalenderbereinigt 2,5 Prozent höher als im Februar 2021. Im Vorjahresvergleich war die Produktion im März 2021 kalenderbereinigt 5,1 Prozent höher als im März 2020. Im Vergleich zum Februar 2020, dem Monat vor dem Beginn der Einschränkungen durch die Corona-Pandemie in Deutschland, lag die Produktion im März 2021 saison- und kalenderbereinigt 4,3 Prozent niedriger. Die Industrieproduktion (Produzierendes Gewerbe ohne Energie und Baugewerbe) ist im März 2021 gegenüber Februar 2021 um 0,7 Prozent gestiegen. Innerhalb der Industrie stieg die Produktion von Vorleistungsgütern um 1,2 Prozent und die Produktion von Konsumgütern um 2,9 Prozent. Bei den Investitionsgütern nahm die Produktion um 0,4 Prozent ab. Außerhalb der Industrie lag die Energieerzeugung 2,4 Prozent höher als im Vormonat. Die Bauproduktion ist um 10,8 Prozent gestiegen. Für den Februar 2021 ergab sich nach Revision der vorläufigen Ergebnisse ein Rückgang der Produktion von 1,9 Prozent gegenüber Januar 2021 (vorläufiger Wert: -1,6 Prozent). ‣ weiterlesen

Corona stellt Unternehmen und deren Mitarbeiter nach wie vor auf eine harte Probe. Laut der Studie ‘Kollaboration – Erfolgsfaktor Zusammenarbeit’ schaffen es aktuell nur 22 Prozent der Unternehmen, eine Zusammenarbeit auf Vorkrisenniveau zu gewährleisten. Diese Situation hat direkten Einfluss auf die Kennzahlen der Betriebe. So verringert etwa eine schlechte Zusammenarbeit in 72 Prozent der Unternehmen spürbar die Effizienz. Für die Untersuchung hat die Unternehmensberatung Staufen zusammen mit den Shopfloor-Management-Experten von Staufen.ValueStreamer mehr als 300 Unternehmen in Deutschland befragt.
‣ weiterlesen

Exklusiv für Abonnenten

Gamern sind Augmented und Virtual Reality bereits ein altbekannter Begriff. Die Technologie bietet aber auch für die Industrie großes Potenzial und die Einstiegshürden müssen dabei gar nicht so groß sein, wie man denken mag. Was es bei der Auswahl des Use Cases und der Lösung zu beachten gilt, zeigt Robin Schwabe, Solution Sales Manager bei Dynabook Europe.‣ weiterlesen

Für einen gesamtheitlichen Erfolg müssen Datenverantwortliche Einfluss auf das gesamte Unternehmen ausüben. ‣ weiterlesen