Es wird für KI-Entwickler fast unmöglich sein, sich von Plagiatsklagen, Diebstahl und illegalem Zugriff auf private Daten zu befreien. Die KI kann nicht ohne riesige Mengen an Informationen trainiert werden und niemand hat die Erlaubnis, ins Internet zu gehen und alles zu sammeln, was er findet.
Es wird immer schwieriger, mit den Urheberrechtsansprüchen gegen generative KI Schritt zu halten, und letzte Woche wurde eine neue Sammelklage vor Gericht eingereicht.
Dieses Mal verklagen die Autoren Nvidia wegen ihrer KI-Plattform NeMo, einem Sprachmodell, das es Unternehmen ermöglicht, ihre eigenen Chatbots zu erstellen und zu trainieren, wie Ars Technica berichtet. Sie behaupten, dass das Unternehmen es mit einem umstrittenen Datensatz trainiert hat, der ihre Bücher ohne Zustimmung illegal verwendet.
Nvidia verwendete gestohlene Bücher, um ihre KI zu trainieren
Die Autoren Abdi Nazemian, Brian Keene und Stewart O’Nan forderten einen Geschworenengerichtsprozess und verlangten von Nvidia Schadensersatz und die Vernichtung aller Kopien des Books3-Datensatzes, der zur Versorgung der großen sprachlichen Modellen (LLM) von NeMo verwendet wird.
Es wird behauptet, dass dieser Datensatz eine Schattenbibliothek namens Bibliotek mit 196.640 raubkopierten Büchern kopiert.
„Zusammenfassend hat NVIDIA zugegeben, seine NeMo Megatron-Modelle mit einer Kopie des Datensatzes The Pile trainiert zu haben“, behauptet die Klage. „Daher hat NVIDIA zwangsläufig auch seine NeMo Megatron-Modelle mit einer Kopie von Books3 trainiert, da Books3 Teil von The Pile ist“.
Einige Bücher, die von den Klägern verfasst wurden, sind Teil von Books3 – einschließlich der verletzten Werke – und daher hat Nvidia zwangsläufig seine NeMo Megatron-Modelle in einer oder mehreren Kopien der verletzten Werke trainiert und damit die Urheberrechte der Kläger direkt verletzt, erklären sie.
Als Antwort erklärte Nvidia gegenüber The Wall Street Journal: „Wir respektieren die Rechte aller Content-Ersteller und sind der Meinung, dass wir NeMo in voller Übereinstimmung mit dem Urheberrechtsgesetz erstellt haben“.
Im letzten Jahr wurden OpenAI und Microsoft wegen Urheberrechtsverletzung von Autoren von Sachbüchern verklagt, die behaupteten, dass die Unternehmen Geld mit ihren Werken verdienten, aber sich weigerten, ihnen zu bezahlen. Anfang dieses Jahres wurde eine ähnliche Klage eingereicht.
Dies geschieht im Rahmen einer Klage von Nachrichtenorganisationen wie The Intercept und Raw Story und natürlich der rechtlichen Maßnahme, die von der New York Times eingeleitet wurde.