Werbung

Nachrichten

Kehren wir zu den alten Gewohnheiten zurück? Die Technische Leiterin von OpenAI gibt an, nicht zu wissen, mit welchen Daten Sora trainiert wurde

Mira Murati ist unsicher, ob Sora mit Daten aus sozialen Netzwerken trainiert wurde

Kehren wir zu den alten Gewohnheiten zurück? Die Technische Leiterin von OpenAI gibt an, nicht zu wissen, mit welchen Daten Sora trainiert wurde
Pedro Domínguez

Pedro Domínguez

  • Aktualisiert:

Jedes Mal, wenn ein Technologieunternehmen eine neue künstliche Intelligenz einführt, stellt sich die erste Frage: „Woher stammen die Daten, mit denen sie trainiert wurde?“. KI-Modelle werden mit großen Datensätzen trainiert, die dem Modell helfen, Muster zu erkennen, Vorhersagen zu treffen oder Sprache zu verstehen.

ChatGPT Download

Und es ist nicht zu übersehen, dass viele KIs mit Daten trainiert wurden, die auf illegale oder zumindest zweifelhafte Weise erhalten wurden, einschließlich des beliebten ChatGPT von OpenAI. Aus diesem Grund ist es umso überraschender, dass die technische Leiterin dieses Unternehmens, Mira Murati, nicht klar ist, woher die Daten stammen, die zur Schulung von Sora, der neuen KI des Unternehmens, verwendet wurden, die in der Lage ist, Videos zu generieren.

Während eines Interviews mit The Wall Street Journal, das am 13. März veröffentlicht wurde, gab Murati äußerst vage Antworten, als sie nach der Quelle der Daten für das OpenAI-Modell Sora gefragt wurde, das in der Lage ist, Videos aus Textanweisungen zu generieren. „Wir verwenden öffentlich verfügbare Daten und lizenzierte Daten“, antwortete Murati auf die Frage, wie das Unternehmen sein nächstes Modell trainiert.

Joanna Stern, Journalist des WSJ, fragte dann, ob Sora mit Daten von Plattformen wie YouTube, Instagram oder Facebook trainiert wurde, woraufhin Murati antwortete: „Ich bin mir nicht sicher“ und fügte hinzu: „Sie wissen schon, wenn sie der Öffentlichkeit zur Verfügung standen. Aber ich bin mir nicht sicher. Ich bin mir nicht sicher darüber.“

Vor dem Wechseln zu einem anderen Thema, erwähnte Stern die Partnerschaft von OpenAI mit dem Bildarchivunternehmen Shutterstock und fragte, ob ihre Daten zur Schulung von Sora verwendet werden könnten. „Ich werde nicht ins Detail gehen über die verwendeten Daten. Aber es handelte sich um öffentliche oder lizenzierte Daten“, fügte Murati hinzu. Später bestätigte die Geschäftsführung dem WSJ, dass tatsächlich Daten von Shutterstock zur Schulung von Sora verwendet wurden.

ChatGPT Download
Pedro Domínguez

Pedro Domínguez

Das Neueste von Pedro Domínguez

Editorialrichtlinien