Oltre l'uomo

Intelligenza artificiale, nuove tecnologie, attualità e riflessioni filosofiche.

Qualche giorno fa mi è capitato di vedere una notizia piuttosto interessante: la Warner Bros, famosa casa cinematografica, ha deciso da fare causa a Midjourney, sistema di IA generativa con oltre 19 milioni di utenti. L’accusa è duplice: da un lato la Midjourney, Inc (sviluppatrice e proprietaria dell’omonimo sistema) avrebbe fatto uso di contenuti protetti da copyright per addestrare il suo programma; dall’altro, l’intelligenza artificiale stessa si sarebbe rivelata in grado di creare nuove immagini contenenti personaggi appartenenti alla Warner Bros, violandone quindi la proprietà intellettuale. Una breve indagine ha inoltre rivelato come la Disney e la Universal Pictures abbiano intentato delle cause simili solo pochi mesi fa.

Ho trovato l’intera cosa piuttosto sorprendente, anche se forse non per i motivi che ci si potrebbe aspettare. Le accuse avanzate dalle tre case cinematografiche in questione sono infatti assolutamente corrette: Midjourney, come tutti i sistemi di GAI (Generative AI), è addestrato sulla base di enormi dataset, che includeranno sicuramente contenuti coperti da copyright, e bastano pochi secondi di ricerca su Google per trovare un’ampia varietà di immagini realizzate dall’IA in cui sono presenti i personaggi della Warner Bros. Anzi, a dirla tutta questa non è nemmeno la prima volta che tali argomenti vengono utilizzati da chi si oppone all’IA: il dibattito sul tema va già avanti da un paio di anni. Quello che mi lascia invece perplesso è il fatto che, per quanto teoricamente valida, questa causa poggia in realtà su delle basi piuttosto fragili, in quanto non tiene conto di una serie di elementi rilevanti che ne vanno a minare la solidità.

L’accusa

Prima di continuare con questo argomento penso che sia però necessario fare un passo indietro ed esaminare più nel dettaglio le due parti dell’accusa in questione. La prima, come ho detto, riguarda l’uso di immagini coperte dalla proprietà intellettuale per addestrare i modelli di IA: per realizzare una GAI funzionante sono infatti necessarie quantità assolutamente immense di dati, nell’ordine delle centinaia di milioni o dei miliardi. Ovviamente, ottenere dataset di dimensioni sufficientemente ampie non è sempre facile, motivo per cui le imprese che operano in questo settore fanno spesso uso di un metodo conosciuto come “web scraping”, che consiste sostanzialmente nel navigare da una pagina web all’altra, copiando nel frattempo tutti i contenuti di interesse, che in questo caso sarebbero le immagini. L’intero processo è automatizzato e gestito da un apposito programma, permettendo così di raccogliere una mole considerevole di dati in un periodo di tempo limitato e senza dover dedicare troppa manodopera al problema. Come si può immaginare, un sistema del genere finirà necessariamente per recuperare delle immagini tutelate dal copyright, portando quindi ad accuse di violazione della proprietà intellettuale. Detto questo, vorrei però notare che quello del web scraping è un argomento abbastanza complesso dal punto di vista legale, in cui può non essere semplicissimo orientarsi: solo per fornire un’idea, la raccolta di dati pubblicamente disponibili e non protetti da login è generalmente considerata accettabile, a meno che essi non siano coperti dal copyright o provengano da un sito in cui i termini di servizio ne vietano l’uso; tuttavia, ci sono anche alcune eccezioni a questa regole, come il “fair use” americano e altre leggi simili, che specificano delle situazioni in cui il copyright non è applicabile, o il divieto categorico di usare i dati ottenuti per fare concorrenza sleale, anche se la loro acquisizione è tecnicamente legale.

Per quanto riguarda invece la seconda parte della causa avanzata dalla WB, essa è fondata sulle capacità generative di Midjourney: il colosso della cinematografia sostiene infatti che questo sistema di IA sia in grado di realizzare immagini che violano il copyright. Più nello specifico, il programma sarebbe capace di riprodurre personaggi i cui diritti d’autore appartengono alla Warner Bros stessa, come Superman, Bugs Bunny o Scooby-Doo, garantendo peraltro un elevato livello di qualità, che può rendere difficile il compito di distinguere tra un contenuto creato da un artista ufficiale e uno “AI-generated”. L’accusa si fonda quindi sul fatto che la creazione e condivisione di contenuti protetti dalla proprietà intellettuale è illegale, rendendo quindi illecite le attività di Midjourney. A questo punto è però necessario precisare che la questione del copyright è in realtà un po’ più complessa di quanto sembri: in generale, la legge stabilisce infatti che l’uso di personaggi, ambientazioni e altri elementi tutelati è strettamente vietato se è per scopi commerciali o crea danno al titolare dei diritti, mentre l’uso a scopo privato è tipicamente valido. Quello che ci interessa veramente è però l’ambito della condivisione non commerciale, che è, tecnicamente parlando, un’infrazione, ma viene spesso non solo tollerata, ma anche promossa, purché non danneggi l’azienda proprietaria o il suo brand.

La critica

Conclusa questa premessa possiamo quindi tornare al nostro tema principale, ossia le debolezze presenti nella causa intentata dalla WB, alcune delle quali potrebbero ormai essere evidenti ad un lettore attento. Andiamo dunque ad esaminarle una ad una:

  1. Innanzitutto, bisogna stabilire se il web scraping sia davvero illegale. Posto che la raccolta dei dati non abbia violato termini di servizio e si sia limitata a contenuti disponibili pubblicamente, può allora essere difficile argomentare che Midjourney ne faccia un uso scorretto. Le immagini sono infatti utilizzate solamente per addestrare il modello e non per scopi economici o per fare concorrenza, il che crea una situazione molto particolare e difficile da definire da un punto di vista legale. A tal riguardo vorrei quindi menzionare due cause che si sono recentemente concluse, ossia quelle contro Meta ed Anthropic: le due aziende sono infatti state accusate di aver fatto uso di testi tutelati dalla proprietà intellettuale per addestrare i loro chatbot, un argomento sostanzialmente identico a quello avanzato contro Midjourney. In entrambi i processi il giudice ha però dato ragione alle imprese, stabilendo che l’uso di contenuti protetti da copyright per scopi educativi ricade nell’ambito del già menzionato “fair use”, rendendolo così legale. Non è quindi difficile immaginare che lo stesso ragionamento possa essere esteso anche alle immagini;
  2. In secondo luogo, è importante ricordare che Midjourney è un semplice generatore di immagini, uno strumento messo a disposizione di una moltitudine di utenti, e la sua capacità di violare il copyright è solo incidentale al suo funzionamento. Da questo punto di vista esso è sostanzialmente paragonabile ad un tablet da disegno, o addirittura a carta e matita: un attrezzo di per sé assolutamente neutrale, che può essere utilizzato sia in modo positivo che in modo negativo. E, in effetti, ad essere illegale non è tanto la generazione dei contenuti, quanto l’uso che ne viene fatto dagli utilizzatori. Immaginiamo di avere tre persone che sfruttano Midjourney per realizzare un’immagine di Superman: la prima mette l’illustrazione ottenuta come sfondo del suo desktop, la seconda la pubblica su Twitter, mentre la terza cerca di venderla. In base a quanto abbiamo detto sul copyright, quello che ha fatto la prima persona è lecito (uso personale), quello che ha fatto la terza è illegale (uso commerciale), mentre quello che ha fatto la seconda è tecnicamente non legale, ma verrà probabilmente ignorato (condivisione non commerciale). In termini pratici, il fatto che Midjourney sia stato realizzato per uno scopo legittimo può essere usato come difesa, complicando ulteriormente la causa;
  3. Ultimo, ma non per questo meno importante, è il semplice fatto che tutto quello di cui è accusata l’IA di Midjourney viene fatto ormai da anni da migliaia di esseri umani, senza che le grandi aziende sentano il bisogno di intervenire. Opere di intrattenimento come film, libri o videogiochi tendono infatti ad attrarre fan, molti dei quali andranno poi a creare nuovi contenuti basati proprio sul prodotto culturale che ha attirato il loro interesse. Ovviamente, questo “fan content” non è del tutto legale, in quanto basato su personaggi e ambientazioni coperti dal diritto d’autore. Tuttavia, nella maggior parte dei casi queste violazioni non vengono perseguite, in quanto sarebbe un’attività lunga, complessa e costosa, che porterebbe assai pochi guadagni e potrebbe anzi danneggiare il brand e generare sentimenti negativi da parte della stessa fanbase che rende un prodotto profittevole. Di conseguenza, la tutela del copyright tende invece a concentrarsi su casi di uso a scopi di lucro o di plagio, lasciando i fan liberi di creare e condividere, seppur entro certi limiti. Partendo da questa premessa, vorrei quindi porre una semplice domanda: da un punto di vista legale, c’è una vera differenza tra la fan art realizzata da persone reali e le immagini generate da un’IA? I contenuti sono gli stessi, come anche l’uso di materiali ufficiali come punto di riferimento, gli scopi per cui vengono realizzati, i siti dove vengono pubblicati, e via dicendo. In base a quale logica è possibile vietare le immagini create dall’intelligenza artificiale, quando quelle fatte dagli esseri umani sono tacitamente accettate? Sarebbe una scelta paradossale.

Le conseguenze

In conclusione, mi sembra che questa causa presenti una serie di debolezze abbastanza considerevoli. Ammetto di non essere un esperto in ambito legale, e il giudizio finale non spetta certo a me, ma la presenza di precedenti a sfavore, di zone grigie aperte a multiple interpretazioni, e di possibili linee di difesa che appaiono potenzialmente molto efficaci non depone certamente a favore di una vittoria facile e veloce da parte della Warner Bros. Francamente, penso che questo sia un bene: la causa a Midjourney si avvicina un po’ troppo alla censura per i miei gusti, e temo che potrebbe creare un precedente negativo sia per quanto riguarda la libertà dei fan di creare e condividere contenuti, sia dal punto di vista del modo in cui percepiamo e facciamo uso dell’IA. Le difficoltà nel trovare dati concreti sull’impatto economico dei sistemi di intelligenza artificiale generativi non aiutano, in quanto fanno apparire quella delle grandi aziende più come una reazione basata sulla paura di quello che potrebbe succedere, piuttosto che un’operazione difensiva contro un danno reale. In ogni caso, penso che il risultato di questa causa sarà molto importante, in quanto essa evidenzia la mancanza di una legislazione chiara e precisa sull’uso della GAI, che stabilisca cosa essa può e non può fare, come si devono applicare ad essa le leggi già esistenti, e se debba essere considerata equivalente alle attività umane o meno. Di conseguenza, questa sentenza potrebbe giocare un ruolo fondamentale nel definire questi elementi, aiutandoci così a risolvere alcuni problemi molto sentiti nell’ambito dell’interazione tra copyright e IA generativa.

Posted in

Lascia un commento