
L’Intelligenza Artificiale è oggi al centro di numerosi dibattiti. Tra questi, quello relativo alla possibilità di utilizzare opere protette ai fini dell’addestramento dei sistemi di IA. Sul punto, si iniziano a registrare le prime pronunce della giurisprudenza, tra cui il recente provvedimento del 23.6.2025 emesso dalla United States District Court – Northern District of California, in cui si affronta il tema del fair use e della violazione del copyright in relazione all’uso di libri da parte della società Anthropic PBC per l’addestramento di modelli linguistici.
I fatti.
La società Anthropic PBC – impresa che sviluppa software di intelligenza artificiale (“IA”) – ha scaricato da internet numerose opere protette (in particolare, libri) ed ha, inoltre, acquistato, copie cartacee di libri, che ha poi provveduto a digitalizzare. Ciò, al fine di costituire una “biblioteca centrale” contenente un elevato numero di libri, da utilizzare per l’addestramento di modelli linguistici a supporto dei propri servizi di intelligenza artificiale.
Una precisazione: molti dei libri scaricati online provenivano da siti pirata.
Alcuni autori di taluni dei libri facenti parte della “biblioteca centrale” di Anthropic e reperiti tramite fonti illecite (“piratati”) hanno, dunque, agito nei confronti di quest’ultima per veder riconosciuta la violazione del copyright in relazione alle proprie opere.
La pronuncia statunitense.
L’utilizzo delle opere protette – per come effettuato da Anthropic – può ritenersi coperto dal “fair use”? Secondo il giudice statunitense, si, ma entro taluni limiti.
Il giudice, in particolare, afferma che le opere – peraltro utilizzate nella loro interezza – sono state trasformate radicalmente nel processo di addestramento dei modelli linguistici, tanto da assumere una funzione diversa da quella originaria: non più lettura, ma astrazione dei suoi elementi linguistici. Dunque, stando alla pronuncia statunitense, l’uso di opere intere può comunque essere ritenuto “fair use”, quando ciò è giustificato dalla finalità trasformativa e dall’impossibilità di ottenere lo stesso risultato con un uso più limitato.
Se fin qui pare potersi affermare che la condotta di Anthropic sia stata ritenuta dal giudice americano del tutto legittima, vi è, tuttavia, un ulteriore elemento da prendere in esame: la provenienza delle opere, in molti casi illecita, in quanto reperite da siti pirata. Tale elemento è idoneo, di per sé, a rendere la condotta di Anthropic illegittima e, dunque, non coperta dal “fair use” statunitense.
In sintesi, stando alla pronuncia in esame, l’uso di opere protette per l’addestramento dei sistemi di IA – laddove avvenga in maniera “trasformativa” – può considerarsi lecito, ma diviene illecito allorquando tali opere siano di provenienza illegale (come nel caso di siti pirata).
Confronto con la normativa europea e nazionale.
Le eccezioni al diritto d’autore – così come il “fair use” americano – hanno lo scopo di effettuare un bilanciamento tra la protezione delle opere dell’ingegno (e dei relativi aventi diritto) con la libertà di utilizzo delle stesse per determinate finalità.
E così, la direttiva 790/2019/UE (c.d. “Direttiva Copyright”) introduce all’art. 4 una specifica eccezione in relazione all’estrazione di testo e di dati (c.d. “text and data mining” - “TDM”) e, in particolare, «per le riproduzioni e le estrazioni effettuate da opere o altri materiali cui si abbia legalmente accesso ai fini dell'estrazione di testo e di dati» (art. 4 Direttiva Copyright – cfr. anche art. 3 in relazione al text and data mining).
Conformemente alla menzionata direttiva, la L. 633/1941 – come modificata a seguito del recepimento della Direttiva Copyright (d.lgs. 177/2021) – prevede all’art. 70-quater, per quanto qui rileva, che «Fermo restando quanto previsto dall'articolo 70-ter, sono consentite le riproduzioni e le estrazioni da opere o da altri materiali contenuti in reti o in banche di dati cui si ha legittimamente accesso ai fini dell'estrazione di testo e di dati […]».
Fin qui, nessun riferimento espresso al text and data mining con specifico riguardo all’IA. Tuttavia, il disegno di legge sull’intelligenza artificiale – per come da ultimo approvato – prevede all’art. 25 (“Tutela del diritto d'autore delle opere generate con l'ausilio dell'intelligenza artificiale”) che «Alla legge 22 aprile 1941, n. 633, sono apportate le seguenti modificazioni: […] b) dopo l'articolo 70-sexies, è inserito il seguente:
“Art. 70-septies. – […] le riproduzioni e le estrazioni da opere o da altri materiali contenuti in rete o in banche di dati a cui si ha legittimamente accesso, ai fini dell’estrazione di testo e di dati attraverso modelli e sistemi di intelligenza artificiale, anche generativa, sono consentite” in conformità alle disposizioni di cui agli articoli 70-ter e 70-quater”».
Conclusioni.
In attesa che l’iter legislativo si concluda, è possibile notare come la normativa europea e nazionale (e, da ultimo, il d.d.l. IA, laddove richiama l’art. 70-quater) – così come la pronuncia statunitense sopra esaminata – pongano una condizione indefettibile ai fini del riconoscimento dell’eccezione TDM: la legittima provenienza delle opere protette. In assenza di tale requisito, nessuna eccezione “fair use” può essere riconosciuto.