Der Datenhunger der Künstlichen Intelligenz
Künstliche Intelligenz (KI) muss zuerst trainiert werden, um den Anwendern Vorteile bringen zu können. Basis eines KI-Trainings sind geeignete Daten, aus denen die KI-Modelle lernen können.
KI |
Viele KI-Projekte machen aber den Fehler, auf möglichst viele Daten zuzugreifen.
Darum ist KI ein
wichtiges Thema für den Datenschutz
KI wird zu den wichtigsten technologischen Entwicklungen der
nächsten Jahre oder sogar Jahrzehnte gezählt. Sowohl im beruflichen wie im
privaten Bereich hat KI bereits Einzug gehalten, wie zum Beispiel die hohe
Verbreitung der KI-Anwendung ChatGPT zeigt. Es gehört zu den Aufgaben des
Datenschutzes, sich auch mit solch neuen Technologien zu befassen, um mögliche
Auswirkungen auf personenbezogene Daten frühzeitig erkennen zu können.
Die Landesdatenschutzbeauftragte von Nordrhein-Westfalen
(NRW) beispielsweise erklärte, der Knackpunkt sei vor allem der Datenhunger von
KI. Datenschutz setze auf das Prinzip der Datensparsamkeit oder
Datenminimierung, während KI Datenhunger habe. Grundsätzlich dürften
personenbezogene Daten aber nur dann für KI genutzt werden, wenn es gesetzlich
erlaubt – also legitim – ist oder die betroffene Person ihre Einwilligung
erteilt hat.
Beispiel: Der
Meta-Konzern will seine KI trainieren
Der Meta-Konzern, der unter anderem Facebook anbietet,
informierte im Mai 2024 Anwenderinnen und Anwender über die geplante Nutzung
personenbezogener Daten aus Facebook, Instagram und Threads für die Entwicklung
und Verbesserung seiner KI-Dienste. Meta hatte dabei auch auf die Möglichkeit
hingewiesen, hiergegen Widerspruch einzulegen. Andernfalls sollten dann
Beiträge, Fotos und Bildunterschriften auf Facebook und Instagram zum Training
der KI-Dienste von Meta verwendet werden.
Meta hatte sich auf das sogenannte „berechtigte Interesse“
daran berufen, seine KI-Dienste weiterzuentwickeln. Da die
EU-Datenschutzbehörden bezweifeln, dass dieses Vorgehen datenschutzkonform ist,
ist Meta einer Aufforderung durch die federführende irische Datenschutzaufsicht
in der EU nachgekommen und hat bis auf Weiteres das Training seiner KI-Modelle
mit Daten aus der EU gestoppt, wie die Landesdatenschutzbeauftragte von NRW
berichtete.
Das KI-Training braucht
Grenzen
Es zeigt sich: Das Training einer KI-Anwendung kann
personenbezogene Daten betreffen und benötigt dafür dann eine entsprechende
Rechtsgrundlage. Der Datenschutz verlangt, dass personenbezogene Daten sparsam
und zweckgebunden eingesetzt werden. Es muss zudem transparent sein, was mit
den Daten geschehen soll und welche Auswirkungen die Verarbeitung der
personenbezogenen Daten haben kann.
Bevor man also in einem KI-Projekt damit beginnt, die KI zu
Trainingszwecken mit Daten zu füttern, müssen die Folgen für den Datenschutz
geklärt sein. Insbesondere muss geprüft sein, ob man nicht auf anonyme,
pseudonyme oder synthetische Daten ausweichen kann, ob also ein Personenbezug
der Daten wirklich für den Zweck der KI notwendig ist. Das wird in aller Regel
nicht der Fall sein.
Wenn aber doch personenbezogene Daten für das KI-Training
benötigt werden sollten, muss geklärt werden, ob es eine Rechtsgrundlage für
die Verwendung personenbezogener Trainingsdaten gibt. Bei besonderen
personenbezogenen Daten wie Gesundheitsdaten ist in aller Regel eine
Einwilligung der betroffenen Personen notwendig.
Das Training einer KI ist also ein Ernstfall für den
Datenschutz!
Fördermittel-Check
Benötigen Sie dennoch Hilfe? Kein Problem!
Das könnte Sie auch interessieren:
- 17.07.2023: Wenn die KI zum Datenleck wird