Studio Previti | Il New York Times fa causa a OpenAI

“Independent journalism is vital to our democracy. It is also increasingly rare and valuable.”

Con questa frase volta ad esaltare l’importanza dell’indipendenza del giornalismo per la democrazia americana si apre il Complaint redatto dall’avvocato della celebre casa editrice di periodici “The New York Times Company”, che nel mese di dicembre ha fatto causa alle multinazionali statunitensi Microsoft Corporation e OpenAI per asserita violazione del diritto d’autore per l’uso non autorizzato di milioni di articoli di cui il New York Times è proprietario.

L’azione del New York Times

L’atto, depositato dal New York Times il 27 dicembre 2023, attribuisce all’intelligenza artificiale la responsabilità della creazione di contenuti tratti dal lavoro della testata giornalistica di fama mondiale.

In particolare, secondo NYT, ChatGPT sarebbe stata addestrata – tramite strumenti di IA generativa fondati sui c.d. LLM (Large Language Models) – a copiare, riprodurre e parafrasare le pubblicazioni del Times, riportando in modo letterale estratti di articoli del quotidiano sulla base delle richieste (output) provenienti dagli utenti. Il tutto, s’intende, senza il consenso del periodico.

Nel complaint depositato a fine dicembre il New York Times ha altresì lamentato la diffusione di informazioni falsamente riconducibili al Times attraverso il fenomeno definito “hallucination”, letteralmente “allucinazione”. Si tratta di una risposta che la macchina fornisce all’utente, senza avere alcuna certezza della veridicità della stessa: viene così generata un’esperienza sensoriale apparentemente realistica che, tuttavia, non corrisponde ad alcuna fonte reale, sicché, nella migliore delle ipotesi tale risposta sarà non del tutto corretta, nella peggiore sarà falsa (benché non riconoscibile come tale). E per i revisori umani è molto difficile distinguere le “allucinazioni” da ciò che è vero. Vien da sé che tale condotta danneggia ulteriormente il periodico, il quale – oltre a subire un danno di natura commerciale e concorrenziale – è vittima di un rilevante danno reputazionale nella misura in cui si vede attribuita la fonte di tali informazioni.

In una controversia di questo tipo l’aspetto certamente più complesso è quello concernente la raccolta degli elementi di prova al fine di dimostrare l’avvenuta violazione, da parte delle multinazionali tecnologiche, dei principi posti alla base del diritto d’autore.

In particolare, il legale del NYT si è servito dell’ausilio di tecnici per dimostrare che il dataset di addestramento per GPT include un corpus interno costituito da OpenAI chiamato “Webtext”, che comprende i contenuti testuali di 45 milioni di link postati dagli utenti del social network “Reddit”, tra i quali – a detta del legale di NYT – rientra una quantità impressionante di contenuti raccolti dal Times (si parla nell’atto del c.d. “webscarping”, letteralmente: “raschiare dal web”).

La linea difensiva delle convenute

La linea difensiva delle controparti in causa non poteva che essere fondata sulla disciplina del “fair use” (uso legittimo): l’eccezione al diritto d’autore disciplinata dall’art. § 107 del Copyright Act del 1976 che ha consentito a grandi artisti – sicuramente sui generis – come Jeff Koons, Richard Prince, Luther Campbell e molti altri di ottenere un riconoscimento alla propria opera dell’ingegno, benché nata da un’altra opera d’arte (si vedano, a titolo esemplificativo, gli arresti giurisprudenziali Blanch v. Koons del 2000, che riconosceva l’autonoma tutelabilità della fotografia di Koons tratta da uno scatto della fotografa di moda Andrea Blanch; Cariou v. Prince del 2009, per l’utilizzo e reinterpretazione da parte di Richard Prince delle fotografie denominate “Canal Zone”; del fotografo Patrick Cariou; Campbell v. Acuff-Rose Music, Inc, del 1994 per la riproduzione – riconosciuta legittima da parte della Suprema Corte degli Stati Uniti – della canzone “Pretty woman” da parte dei membri del gruppo musicale composto da Luke skyywalke (Luther Campbell), Fresh Kid Ice, Mr. Mixx e Brother Maquis.)

In base a quanto disposto da tale norma, dunque, va considerato lecito e non configgente con le disposizioni in materia di diritto d’autore l’utilizzo dell’opera nel caso in cui la compressione dei diritti dell’autore sia giustificata da un interesse generale, che viene ritenuto prevalente rispetto a quello personale del titolare, come ad esempio per ragioni di critica, cronaca, insegnamento, ricerca

etc.; inoltre è sempre consentito l’utilizzo dell’opera altrui quando il risultato finale è distante rispetto all’opera utilizzata (si parla di “uso trasformativo”), per tale intendendosi gli usi che aggiungono qualcosa di nuovo, con uno scopo ulteriore o un carattere diverso, e non sostituiscono l'uso originale dell'opera.

Le convenute hanno dunque sostenuto che, poiché le opere del NYT non sono rese disponibili al pubblico in quanto tali, ma sono state usate allo specifico scopo di addestrare i sistemi di AI, tale uso deve essere consentito poiché trattasi di un uso trasformativo e non espressivo. Ritenendo, quindi, pienamente legittimo l’uso senza licenza dei contenuti di proprietà del NYT, le controparti hanno respinto ogni tentativo di trattativa con cui l’attrice cercava invano di ottenere un compenso equo e – a parere di chi scrive – legittimo per l’utilizzo dei suoi contenuti.

OpenAI già in precedenza ha pattuito dei compensi per l’uso di materiale protetto: basti pensare al gruppo editoriale tedesco Alex Springer titolare delle testate giornalistiche “Politico” e “Business Insider” che ha recentemente stretto un accordo con OpenAI per consentire a ChatGPT di prelevare informazioni direttamente da entrambe le fonti, oppure all’Associated Press che ha concluso un contratto biennale volto a consentire a OpenAI, dietro un corrispettivo, di addestrare i suoi modelli sulla base delle sue notizie.

Conclusioni

Per quanto di fondamentale importanza, questa controversia non è la prima e sicuramente non sarà l’ultima in materia di intelligenza artificiale e diritto d’autore, attesa la facilità (e frequenza) con cui le macchine sono in grado di elaborare informazioni partendo da opere dell’ingegno.

Al momento tra i più importanti casi in materia si annoverano Getty Images v Stability AI (UK), Does v. GitHub, Microsoft e OpenAI (San Francisco), Kadrey v. Meta Platforms, Inc. (San Francisco), Sarah Andersen v. Midjourney et al. (San Francisco), Authors Guild et al. v. OpenAI (New York), Sig. Thaler vs. US Copyright Office “A recent entrance to Paradise” (18 ago. 2023, U.S. District Court for the District of Columbia (Washington), Sig. Kashtanova vs. US Copyright Office “Zarya of the Down” (21 apr. 2023), Sig. Biancheri vs. RAI “The Scent of the Night” (Cass., ord. n. 1107 del 16 gennaio 2023) e, da ultimo, la decisione del Beijing Internet Court del 27 novembre.2023: Mr. Li vs. Ms. Liu “Spring Breeze Brings Tenderness” (di cui si è già parlato in un nostro precedente articolo).

Vi è dunque da chiedersi, che cosa succederà se ad avere la meglio sull’ingegno dell’uomo saranno le macchine con i loro sviluppatori?

Si parlerà di una nuova forma di arte, quella tecnologica, oppure, nel nostro caso, di una nuova frontiera del giornalismo? Forse sì. Tuttavia, l’esperienza umana non è surrogabile da una macchina benché la stessa sia (comunque) frutto dell’intelletto: la difficoltà starà dunque nel trovare il modo per far sì che i due strumenti – esperienza e intelligenza (artificiale) – convergano per ottenere un risultato utile per la società e non decettivo.

Del resto, occorre rammentare che tra i propositi stilati dal G7 nel Codice di Condotta (elaborato nell’ambito del Processo di Hiroshima sull’IA) è emerso con tutta evidenza che i modelli di IA devono essere addestrati secondo un approccio antropocentrico, affinché sia la tecnologia al servizio dell’uomo, e non viceversa. Da qui la necessità – ritenuta dal G7 di primaria importanza – di prevedere una serie di misure appropriate per la protezione della proprietà intellettuale.

Avv. Eleonora Carletti