Nichts wurde in den letzten Wochen in den Medien so ausführlich diskutiert wie das KI-basierte System ChatGPT von OpenAI.
So war zu lesen, dass Studenten bereits das Ende der selbstgeschriebenen Hausarbeiten feiern. Microsoft mit launischen Chatbots kämpft. Unternehmen wie Amazon sich um ihre gut gehüteten Geschäftsgeheimnisse sorgen und Juristen viele Fragen zu Thema Datenschutz und Urheberrecht aufwerfen.
Wie funktioniert ChatGPT?
ChatGPT ist ein KI-basiertes Chatbot-System, das im Gegensatz zu bestehenden Chatbots nicht auf ein bestimmtes Thema oder Anwendungsgebiet beschränkt ist. ChatGPT verwendet Sprachmodelle, die mit großen Datenmengen programmiert wurden, sogenannte Large Language Models (LLM). Die KI lernt in den ersten Schritten nach dem Prinzip des Reinforcement Learning from Human Feedback (RLHF). Dabei entwickelt die KI selbstständig eine Strategie, die durch Belohnung für positives Feedback und Bestrafung für negatives Feedback gesteuert wird, und optimiert sich so auf der höchsten Stufe durch die sogenannte Proximal Policy Optimization (PPO) selbst.
So kann ChatGPT auf fast jede Frage eine verblüffend plausible und menschlich klingende Antwort geben. Der Chatbot kann aber nicht nur Fragen aus allen möglichen Bereichen beantworten, sondern auch Texte schreiben, Lieder komponieren oder Software-Code programmieren.
Da die Trainingsdaten des Programms aus dem Jahr 2021 und früher stammen, ist der Wissensstand nicht ganz aktuell. OpenAI arbeitet aber bereits an Anwendungen, die auf aktuelle Informationen aus dem Internet zugreifen können. Als weitere Informationsquelle nutzt die KI die Informationen, die der Nutzer bei der Nutzung des Programms eingibt und die Inhalte, die die KI darauf auswirft. Die Nutzungsbedingungen von OpenAI sehen vor, dass diese Informationen, der sogenannte Content, für die Weiterentwicklung und Verbesserung des Programms genutzt werden dürfen.
Wo liegen die (rechtlichen) Probleme?
Eines der größten allgemein diskutierten Probleme ist, dass das Programm nicht selten falsche Antworten gibt, die für den Benutzer plausibel erscheinen und daher nicht als solche erkannt werden.
OpenAI gibt nach der Anmeldung folgende Warnmeldung aus:
Diese Warnung führt natürlich nicht dazu, dass die Benutzer eine falsche Antwort eher als falsch erkennen. Sie schafft, wenn überhaupt, nur ein gewisses Bewusstsein dafür, dass es auch falsche Antworten geben kann.
Damit der Nutzer erkennen kann, mit welcher Wahrscheinlichkeit die Antwort richtig oder falsch ist, wäre in jedem Fall die Angabe der Quelle, aus der die Information stammt, hilfreich. Denn je vertrauenswürdiger die Quelle ist, desto höher ist die Wahrscheinlichkeit, dass die Antwort richtig ist. Leider gibt es bei ChatGPT bisher keine Quellenangabe.
Vertrauliche Daten und Datenschutz
Die größte Unbekannte im Zusammenhang mit ChatGPT, der Verwendung von vertraulichen Daten und Datenschutzfragen ist der Benutzer selbst.
Oft ist es der Benutzer, der freiwillig persönliche oder vertrauliche Daten in ChatGPT eingibt. Zum Beispiel, weil die Daten benötigt werden, damit die KI ein brauchbares Ergebnis liefert. Man denke in diesem Zusammenhang beispielsweise an den theoretischen Fall eines Mitarbeiters, der ChatGPT als HR-Tool zur Erstellung von Arbeitszeugnissen oder als Programmierhilfe nutzt und dabei personenbezogene oder vertrauliche interne Daten in das Programm eingibt.
Die Nutzungsbedingungen sehen zwar vor, dass das Programm nicht so verwendet werden darf, dass Rechte Dritter verletzt werden, dies verhindert aber nicht, dass der Nutzer dennoch unbedacht vertrauliche oder personenbezogene Informationen in das Programm eingibt.
Informationen, die auf diese Weise in die Trainingsdaten gelangen, können sich dann in den Antworten wiederfinden, die ein anderer Nutzer erhält.
Auch hier gibt ChatGPT eine entsprechende Warnung aus:
Diese Warnung verhindert nicht, dass im Zweifelsfall dennoch sensible Daten eingegeben werden, sondern kann allenfalls dazu beitragen, das Problembewusstsein des Nutzers überhaupt erst zu wecken.
Urheberrecht – Trainingsdaten
Die Urheberrechtsnovelle, die Mitte 2021 in Kraft trat, enthält mit § 44b UrhG eine Regelung, die die Auswertung frei zugänglicher Werke für Text- und Data-Mining ausdrücklich erlaubt. Für KI-Trainingsdaten bedeutet dies, dass urheberrechtliche geschützte Werke genutzt werden dürfen, wenn und soweit sie frei zugänglich und rechtmäßig im Internet verfügbar sind. Dies gilt jedoch nicht schrankenlos. Rechteinhaber können die Nutzung ihrer öffentlich zugänglichen Werke untersagen. Dazu muss lediglich ein ausdrücklicher Nutzungsvorbehalt maschinenlesbar auf der Website hinterlegt werden. Es stellt sich jedoch die Frage, was passiert, wenn ein Rechteinhaber sich für ein Nutzungsverbot entscheidet, nachdem eine KI mit seinem Werk trainiert wurde. Um den Rechten des Rechteinhabers Rechnung zu tragen, müssten solche Daten nachträglich aus den Trainingsdaten der KI gelöscht werden. Die KI müsste sie sozusagen vergessen.
Urheberrecht – KI-generierte Inhalte
Stellt man ChatGPT die Frage, wem nach deutschem Recht das Urheberrecht an Inhalten zusteht, die von einer KI erstellt wurden, erhält man folgende Antwort:
Nach deutschem Recht steht das Urheberrecht grundsätzlich demjenigen zu, der das Werk geschaffen hat. Da eine KI als Maschine keine natürliche Person ist, kann sie kein Urheber im Sinne des Urheberrechtsgesetzes sein.
In Deutschland wird diskutiert, ob eine KI als „Schöpfer“ eines Werks anerkannt werden soll, wenn sie das Werk ohne menschliches Zutun oder nur aufgrund von menschlichen Vorgaben erstellt hat. Bislang gibt es jedoch keine eindeutige gesetzliche Regelung dazu.
In der Praxis wird das Urheberrecht an von KI erstellten Werken in der Regel demjenigen zugesprochen, der die KI programmiert oder eingesetzt hat. Auch hier gibt es jedoch in bestimmten Fällen juristische Unklarheiten und Herausforderungen.
Dies ist eine verblüffend gute Antwort. Sie bedarf jedoch einer kleinen Korrektur. Der Code einer Software ist urheberrechtlich geschützt. Das heißt, dem Entwickler der Software steht das Urheberrecht an der Software als solcher zu. Das gilt aber nicht für die Produkte, die aus der Software entstehen.
Auch derjenige der die Software eingesetzt, ist nicht der Urheber des von der Software erzeugten Produkts, da es gerade nicht seine eigne persönliche geistige Schöpfung ist.
Da die von einer KI erstellten Inhalte nach dem UrhG grundsätzlich keinen urheberrechtlichen Schutz genießen, können sie von jedermann frei genutzt werden.
Insofern ist die Regelung in den OpenAI-Nutzungsbedingungen, wonach OpenAI dem Nutzer alle OpenAI zustehenden Rechte am Output einräumt, nach deutschem Rechtsverständnis unsinnig. Denn OpenAI stehen keine Rechte zu, die übertragen werden könnten.
Zudem erweckt diese Regelung den Eindruck, dass der Nutzer die von der KI generierten Inhalte uneingeschränkt nutzen kann. Dies ist aber nicht immer der Fall. Vorsicht ist immer dann geboten, wenn der von der KI generierte Inhalt urheberrechtlich geschütztes Material enthält. Denn dann würde die Nutzung der Inhalte eine Urheberrechtsverletzung darstellen.
Fazit
ChatGPT ist ein eindrucksvolles Beispiel für die Fortschritte im Bereich der KI-Technologie. Es steht außer Frage, dass die KI-Technologie mittlerweile ein so hohes Niveau erreicht hat, dass sie das Potenzial hat, die Arbeit in vielen Branchen nachhaltig zu verändern. Wie genau dieser Veränderungsprozess ablaufen wird und welche Rolle dabei die derzeit noch bestehenden rechtlichen Unsicherheiten spielen werden, bleibt abzuwarten. Nach derzeitigem Stand ist jeder Nutzer selbst dafür verantwortlich, dass bei der Nutzung von ChatGPT keine Rechte Dritter verletzt werden. Unter Compliance-Gesichtspunkten ist daher für den Einsatz des Programms im unternehmerischen Umfeld dringend zu empfehlen, den eigenen Mitarbeitern ein Regelwerk für den Umgang mit ChatGPT an die Hand zu geben.
Eine gezielte Beratung von Unternehmen zum Einsatz von KI ist insbesondere vor dem Hintergrund der kommenden KI-Verordnung sinnvoll. Denn diese knüpft besondere Pflichten an den Einsatz von KI in Unternehmen. Gerne beraten wir Sie in diesem Zusammenhang. Sprechen Sie uns an!
Dieser Artikel wurde mit Hilfe von KI optimiert. Das Lektorat erfolgte durch DeepL Write.