Uno sguardo alle "class action" americane contro gli operatori di AI per il riconoscimento dei diritti d’autore tra "input" e "output"

Uno sguardo alle "class action" americane contro gli operatori di AI per il riconoscimento dei diritti d’autore tra "input" e "output"
Recentemente sono state instaurate numerose class action avanti alle più importanti corti federali statunitensi di primo grado al fine di vedere riconosciuta la violazione dei diritti d’autore esistenti su diverse opere presenti online, utilizzate per l’allenamento dei sistemi di Intelligenza Artificiale (“IA”) e da questi similmente riproducibili. Si presenta quindi uno stato dell’arte, per sommi capi, dei contenziosi in essere per tenerne monitorati gli sviluppi, di rilevante interesse per tutti i titolari di diritti d’autore e diritti connessi.

Sviluppatori di software open source vs. Microsoft, GitHub e Open AI

Nel novembre 2022 veniva presentata avanti alla corte distrettuale federale di San Francisco, California, la prima class action per conto di un gruppo di creatori di software open source che anni prima, gratuitamente, avevano deciso di condividere sul database del sito hosting GitHub le loro stringhe di codice ad uso pubblico, all’unica condizione che al momento della loro copia o utilizzo venisse fatta menzione del nome dell’autore del software originale per il riconoscimento di paternità.

Tali sviluppatori, che han chiesto e ottenuto la garanzia di anonimità fino all’odierno stadio iniziale del processo, dal momento che il loro avvocato ha ricevuto minacce di morte in relazione a tale causa, sostengono che in seguito all’acquisto di GitHub da parte di Microsoft e alla creazione, in collaborazione con OpenAI, di Copilot e Codex, due sistemi di intelligenza artificiale, i loro software iniziali siano stati usati senza autorizzazione per il training delle IA che ora sarebbero in grado di creare autonomamente, su richiesta, nuovi software asseritamente copie o derivati dei primi, senza per altro riportare menzione alcuna dei creatori originari tramite la c.d. “Copyright Management Information - CMI”. Non solo: i servizi di Copilot e Codex sarebbero a pagamento, ponendo in essere un ingiusto arricchimento a beneficio delle società convenute e a discapito dei creatori “umani” che sarebbero altresì vittime della concorrenza sleale delle IA.

La posizione dei colossi americani convenuti sembra però marmorea: chiedono il rigetto del caso perché il database di GitHub era pubblicamente disponibile affinchè tutti potessero imparare, incluse le IA; inoltre i termini di servizio di GitHub, accettati dagli sviluppatori al momento della condivisione dei loro codici, prevedeva la concessione di una licenza gratuita e non esclusiva a GitHub – rectius di Microsoft – per usare, riprodurre, archiviare e condividere i contenuti caricati ai fini dei servizi offerti da GitHub, che ora includono anche Copilot. In ultimo, per quanto qui di interesse, le violazioni degli artt. 1201-1205 del Digital Millennium Copyright Act (DMCA), a tutela della circonvenzione di misure tecnologiche per la tutela del copyright, non sarebbero state violate perché gli attori non avrebbero dimostrato che le IA nei loro output riproducano copia o derivazione delle opere originarie e pertanto, non essendo copie, non dovrebbero riportare i CMI.

La causa è ancora in corso, ma il Giudice Tigar si è già espresso con un’ordinanza preliminare l’11 maggio 2023 per rigettare le accuse di cospirazione ai danni degli attori e la richiesta di un provvedimento dichiarativo sull’esistenza dei diritti senza entrare nel merito dei danni. Con il medesimo provvedimento il Giudice ha momentaneamente rigettato le accuse, con la possibilità per le parti di emendare i propri atti, mentre ha ritenuto di potersi procedere sin da subito con la domanda per l’accertamento della violazione degli artt. 1202(b)(1) e 1202(b)(3) DMCA che sanzionano la rimozione o alterazione intenzionale delle CMI e la distribuzione di opere di cui si è a conoscenza della rimozione o alterazione delle CMI, nonché la violazione delle licenze in sé dei software originari che prevedevano l’attribuzione al proprietario, le “copiright notice” e i termini della licenza.

Le parti hanno depositato nuovi atti tra giugno e luglio e l’ultima udienza si è tenuta lo scorso settembre ad uno stadio ancora embrionale della causa, che potrebbe protrarsi fino al 2025 almeno, in assenza di accordi tra le parti.

Artisti illustratori e disegnatori vs. Stability AI, Midjourney e DeviantArt

Con uno schema similare al precedente caso, un gruppo di artisti, principalmente illustratori, ha chiesto alla medesima corte di San Francisco che venisse accertata la violazione dei loro diritti d’autore a carico di Stability AI, DeviantArt e Midjourney poiché, sfruttando lo scraping effettuato dall’organizzazione tedesca LAION (“Large-Scale Artificial Intelligence Open Network”) delle loro opere d’arte principalmente caricate anni fa su DeviantArt, quando questa era ancora solo una community di condivisione di immagini digitali, tramite copia, embedding e utilizzo di queste immagini come training data per Stable Diffusion, il software open source di intelligenza artificiale per la creazione di immagini fondato da Stability AI e utilizzato poi da Midjourney e DeviantArt per i loro sistemi di AI lanciati nel 2022.

Grazie a questi sistemi di IA chiunque ora può chiedere un’immagine “nello stile di” un determinato artista, pertanto secondo gli attori questi sistemi violerebbero i loro diritti d’autore sia al momento della copia di input mai autorizzata delle loro opere nel database di allenamento delle IA, sia al momento dell’output che è perfino in grado di riportare la sigla “copiata” dell’autore. Sarebbero stati asseritamente violati anche i diritti al nome degli artisti poiché nel momento in cui si chiede “un’opera nello stile di” il nome che segue produce degli indebiti guadagni per i titolari dei sistemi di AI, visto che alcuni di questi sono a pagamento. Inoltre, sarebbero stati anche qui illecitamente rimossi i riferimenti agli autori delle opere originarie, in violazione delle licenze online e i termini di servizio di DeviantArt, che non avrebbe potuto permettere a terzi l’uso commerciale delle opere in esso presenti.

In seguito alla prima udienza, il Giudice Orrick ha emesso una prima ordinanza il 30 ottobre 2023 in risposta alle eccezioni preliminari avanzate dalle tre società, che chiedono il rigetto immediato delle domande perché non circostanziate da fatti e prove concreti della copia iniziale delle opere né tantomeno della loro riproduzione nell’output delle AI, poiché lo “stile” non sarebbe un’espressione degna di ricevere la tutela concessa dal diritto d’autore, e quanto fatto rientrerebbe comunque nell’eccezione del “fair use” concessa per gli usi trasformativi dell’opera originaria.

Il Giudice ha riconosciuto la legittimazione ad agire solo in capo ad un’artista - Sarah Andersen, capofila della class action, poiché l’unica ad aver registrato le sue opere presso il Copyright Office degli Stati Uniti – chiedendo però che venissero meglio individuate le opere che si assumono violate, accogliendo in questo stadio preliminare la domanda di accertamento della violazione diretta dei suoi diritti d’autore verso StabilityAI, ma rigettando tutte le altre domande, pur con la possibilità per gli artisti di depositare entro fine novembre una comparsa modificata e più approfondita su tutti i punti in modo da discuterne nuovamente.

Scrittori vs. OpenAI

L’ultima nota class action in materia, questa volta pendente avanti alla Southern District Court di New York, è del 19 settembre 2023, avviata dalla gilda degli autori statunitensi e da scrittori di primo piano, quali ad esempio John Grisham, contro OpenAI, per la riproduzione e uso non autorizzato delle loro opere nel training di ChatGPT. La prova della copia dei libri all’interno del database di OpenAI sarebbe nel fatto che su richiesta ChatGPT sa fornirne un riassunto preciso, e sembra plausibile che molti di questi libri siano stati trovati su siti pirata come la nota Z-Library. I testi sarebbero non solo stati usati per “insegnare” all’intelligenza artificiale come parlare, ma anche come scrivere al pari di uno scrittore, anche specifico, o per fornire estratti e sommari dei libri, ottenendo indebiti vantaggi da una situazione di concorrenza sleale con gli scrittori in carne ed ossa.

Identica causa è iniziata sempre in settembre a San Francisco tra scrittori e Meta, per il training della sua IA “LLaMa”.

Le ultime due cause sono state appena introdotte, quindi ancora non possono conoscersi i pensieri delle corti in merito, ma certamente possono confermarsi dei tratti comuni alle precedenti cause, il cui studio e analisi potrà dirsi determinante. Quanto, infatti, verrà deciso dai giudici statunitensi in merito a (i) la configurazione di illeciti nello scandagliare il web e copiare dati e opere coperte da diritto d’autore all’interno di un database, (ii) il riconoscimento di un’opera derivata o di un’integrale riproduzione non autorizzate nell’output dei sistemi di IA, (iii) la violazione delle licenze di contenuti online e dei termini di servizio dei siti di condivisione o vendita di contenuti e in ultimo, ma non meno importante, (iv) il tema della modalità con cui ottenere la prova delle asserite violazioni, potrà certamente influenzare anche il pensiero e le interpretazioni dei giudici del vecchio continente.

Avv. Chiara Arena

Newsletter

Iscriviti per ricevere i nostri aggiornamenti

* campi obbligatori