Die New York Times hat den OpenAI-Webcrawler blockiert. pausieren des Zugriffs des Unternehmens auf Zeitungsinhalte für lTraining seiner generativen KI-Modelle. Die Entscheidung betrifft ein technisches Detail der Website der Zeitung, stellt jedoch eine Spannung zwischen der Verlagswelt und der technologischen Welt dar. Aufgrund ungelöster Probleme in der Beziehung zwischen die KI und urheberrechtlich geschützte Inhalte.
New York Times blockiert Webcrawler, um ChatGPT-KI zu trainieren
Die New York Times blockierte den Zugriff des OpenAI-Webcrawlers, des Bots, der Webseiten scannt, um die Zuordnung bereitzustellen das Material zum Trainieren Ihrer eigenen Modelle der künstlichen Intelligenz. Tatsächlich überwacht ChatGPT mehrere Online-Sites, um Algorithmen zu erstellen, die Vorhersagen darüber treffen, wie Sätze auf der Grundlage Ihrer Anfrage gebildet werden.
Seitenüberprüfung NYT robots.txt stellt fest, dass GPTBot, Der von OpenAI Anfang dieses Monats eingeführte Crawler war von der New York Times verboten. Nach den Erkenntnissen von The Verge über die Wayback Machine des Internet Archive scheint es, dass der Header den Crawler blockiert hat bereits am 17. August.
Diese Änderung kommt später zur Aktualisierung der Nutzungsbedingungen der New York Times Anfang dieses Monats, zielte darauf ab, die Verwendung seiner Inhalte für das Training von Modellen der künstlichen Intelligenz zu verbieten. Der Zeitungssprecher, Charlie Stadtlander, Er lehnte es ab, sich in der amerikanischen Presse zu seinen Kollegen zu äußern. OpenAI reagierte auch nicht sofort auf eine Bitte um Stellungnahme.
Rechtliche Schritte am Horizont
Die New York Times erwägt derzeit die Möglichkeit, rechtliche Schritte gegen OpenAI einzuleiten wegen angeblicher Verstöße im Zusammenhang mit Rechte an geistigem Eigentum. Diese Situation wurde letzte Woche von NPR gemeldet.
Sollte beschlossen werden, die Klage fortzusetzen, würde sich die New York Times anderen anschließen, darunter auch dem Komiker Sarah Silverman und zwei weitere Autoren, Sie alle reichten im Juli Klage gegen das Unternehmen ein. Bei dieser Aktion ging es um die Verwendung Books3, ein Datensatz, der zum Trainieren von ChatGPT verwendet wirddie Tausende von umfassen könnte urheberrechtlich geschützte Werke. Darüber hinaus schloss sich die New York Times Zahlen wie an Matthew Butterick, ein Programmierer und Anwalt. Was argumentiert, dass die Data-Mining-Praktiken des Unternehmens denen entsprechen Verletzung von Eigentumsrechten an der Software.
Der Kampf der New York Times könnte das ChatGPT-Training verlangsamen, bittet aber nicht darum, es ganz zu stoppen. Vielmehr wird gefordert, dass urheberrechtlich geschütztes Material nicht zum Trainieren von Bots verwendet werden darf. Oder dass, wenn sie es nutzen wollen, Rechteinhaber gerecht bezahlen. Wie alle Menschen, die sich durch das Lesen von Büchern und Zeitungen „trainieren“: KI kann es viel schneller, aber warum sollte sie es tun, ohne um Erlaubnis zu fragen?