Fachinfos - Zukunftsthemen 30.11.2022

Synthetische Daten

Potentiale und Risiken bei der Nutzung synthetischer Daten. (30. November 2022)

Zusammenfassung

Im Zuge der Entwicklungen rund um Big Data und vor allem der weit verbreiteten Nutzung Künstlicher Intelligenz / PDF, 110 KB (KI) gewinnen Daten immer mehr an Bedeutung und damit an Wert. Zum Training von KI-Algorithmen sind eine Fülle von Daten notwendig. Soweit es sich dabei um personenbezogene Daten handelt, steht dem Gebrauch dieser oft die gesetzliche Beschränkung der Nutzung auf den ursprünglichen Zweck (Zweckbestimmung der DSGVO) entgegen (siehe auch Digitalisierung und Anonymität / PDF, 175 KB).

Gerade in den Bereichen Gesundheit und Finanzdienstleistungen sind die Originaldaten sehr sensibel, aber auch in anderen Bereichen wird verstärkt auf die Weiterverarbeitung von einmal generierten Daten wert gelegt. Um dem Problem der Beschränkung nach der DSGVO zu entgehen, wird mittlerweile versucht, mit so genannten „synthetischen Daten“ (Replica Ana­lytics 2020, siehe zitierte Literatur im PDF) zu operieren. Diese werden künstlich und mit Hilfe von KI erzeugt, um sie dann wiederum als Trainingsdaten für KI-Systeme zu nutzen. Sie bilden ein Daten-Set, das dieselben statistischen Merkmale aufweisen soll, wie die zugrundeliegenden Originaldaten und so als Proxy für das Training des Algorithmus genutzt werden können. 

Synthetische Daten / PDF, 128 KB

Monitoringbericht gesamt (November 2022) / PDF, 11472 KB