Come proteggere le tue immagini dai generatori artistici AI
Mentre è divertente imitare le opere di artisti scomparsi come Van Gogh o Frida Kahlo con un generatore di intelligenza artificiale, lo stesso non vale per gli artisti viventi. Consentire a chiunque di creare un’immagine “nello stile di” un artista può far sì che il loro mercato venga inondato di imitazioni; aggiungendo confusione sull’autenticità e una potenziale perdita di reddito.
In risposta, le persone stanno cercando un modo per proteggere le proprie immagini dai generatori di arte AI. Le risposte potrebbero non essere perfette o infallibili, ma ci sono modi in cui puoi difendere le tue immagini dall’uso da parte dei generatori di arte AI.
In che modo i generatori di intelligenza artificiale ottengono le tue immagini
I generatori di arte AI attraversano un periodo di “addestramento” per imparare a produrre un’immagine quando viene fornito un prompt di testo. Come parte del processo di apprendimento, ha bisogno di studiare centinaia di milioni di coppie immagine-testo per generare infine un’immagine accurata di oggetti, colori e scene del mondo reale, insieme a tecniche artistiche e stile.
Si dà il caso che i modelli di intelligenza artificiale debbano imparare dalla creatività degli umani. Ad esempio, Midjourney e Stability Diffusion sono due generatori di arte AI addestrati sul set di dati LAION-5B open source, contenente miliardi di immagini provenienti da Internet.
Utilizzando i web crawler per “raschiare” i siti Web alla ricerca di dati, questi set di dati creano elenchi di URL di immagini, oltre alla loro didascalia, in qualcosa che potrebbe assomigliare a un enorme foglio di calcolo Excel. Se hai pubblicato la tua arte online prima, potrebbe essere in un set di dati di immagini e quindi utilizzata per addestrare l’intelligenza artificiale, indipendentemente dal fatto che tu abbia acconsentito o meno.
1. Rinuncia ai set di dati di addestramento AI
Spawning è un gruppo di artisti il cui popolare sito web, Have I Been Trained? , può essere utilizzato per vedere se le tue immagini sono nel set di dati LAION-5B. Assumendosi la responsabilità, in seguito hanno aggiunto la funzione per rinunciare al set di dati. In base a un accordo, Spawning trasmetterà gli elenchi di esclusione degli utenti a LAION, che ha affermato che rispetterà la richiesta e rimuoverà tali immagini dalla sua raccolta.
Lo strumento di opt-out di Spawning richiede ancora un certo sviluppo poiché, al momento in cui scriviamo, non è possibile aggiungere più immagini contemporaneamente. Né esistono accordi di rinuncia con altri set di dati che potrebbero essere utilizzati per addestrare modelli di intelligenza artificiale.
Poiché molte aziende di intelligenza artificiale non rivelano i dettagli più fini su come sono costruiti i loro modelli di intelligenza artificiale, a volte non è chiaro quale set di dati stiano utilizzando. DALL-E è un popolare generatore di arte AI che non condivide queste informazioni.
In alternativa, se utilizzi DeviantArt per condividere la tua opera d’arte, le tue immagini sono ora protette per impostazione predefinita dall’uso per i set di dati di addestramento AI. Funziona contrassegnando la tua immagine con “noai”, il che significa che se si scopre che un modello AI ha utilizzato la tua immagine per l’addestramento, violerà i Termini di servizio di DeviantArt.
Naturalmente, queste misure di opt-out non vengono applicate, quindi possono essere ignorate da terze parti se lo desiderano. Sebbene questa non sia la soluzione più efficiente, sta aprendo la strada a più regole e regolamenti per proteggere il lavoro degli artisti.
In un mondo ideale, le persone avrebbero la possibilità di aderire, invece di dover rinunciare. Speriamo che ciò accada in futuro. Per maggiori dettagli su come rimuovere le tue immagini dai set di dati, consulta la nostra guida su come disattivare le tue immagini dalla formazione AI.
2. Copyright il tuo lavoro
Se la pratica di raschiare immagini da Internet sia legale è stata portata all’attenzione dei tribunali. E aiutare gli artisti a presentare prove dalla loro parte è il copyright dell’immagine che possiedono.
All’inizio del 2023, la nota fumettista Sarah Andersen faceva parte di un gruppo di artisti che ha intentato una causa contro le società di intelligenza artificiale Stability AI e Midjourney, nonché contro il sito di condivisione artistica DeviantArt, per aver cancellato l’opera della loro arte senza consenso, inclusa l’arte di innumerevoli milioni di altri artisti.
Un altro esempio è il sito Web di immagini stock, Getty Images, che ha intentato una causa contro Stability AI per aver raschiato le sue immagini senza licenza. Il modo in cui ha scoperto che le sue immagini protette da copyright venivano utilizzate è stato quando le immagini generate dall’intelligenza artificiale hanno iniziato a essere visualizzate con la filigrana di Getty Images, un indizio abbastanza ovvio.
Mentre la legalità sarà determinata a tempo debito, il copyright è una delle poche cose che possono essere utilizzate per lottare per i diritti del lavoro degli artisti, come visto nei casi che abbiamo citato. Potrebbe non essere aggiornato con la tecnologia AI, ma può aggiungersi alla tua difesa andando avanti.
È una pratica che vale comunque la pena conoscere in modo da poter proteggere il tuo lavoro dal furto, indipendentemente dal fatto che l’IA sia coinvolta o meno. Segui la nostra guida su come tutelare il copyright delle tue foto per uno sguardo approfondito su come funziona.
3. Blocca i crawler del sito Web con Robots.txt
I set di dati di immagini sono in grado di indicizzare solo un gran numero di immagini perché utilizzano qualcosa chiamato web crawler. Come potrebbe suggerire il nome, strisciano attraverso i siti Web alla ricerca di informazioni particolari.
Alcuni crawler sono utili e aiutano i motori di ricerca come Google a trovare e indicizzare le informazioni più pertinenti da visualizzare nella pagina dei risultati di ricerca. Altri vengono utilizzati per raschiare i siti Web alla ricerca di immagini da includere nei set di dati di addestramento AI.
È qui che entra in gioco Robots.txt. Robots.txt è un file di testo che può essere inserito nel codice di back-end di un sito web per dire ai web crawler cosa possono e non possono scansionare. Puoi usarlo per impedire a un crawler di guardare determinate pagine o file, il che è utile se non vuoi che le tue immagini vengano utilizzate dall’intelligenza artificiale.
Se vuoi saperne di più, leggi la nostra guida su cos’è un web crawler e come funziona. Per coloro che hanno un sito Web, chiedi al tuo sviluppatore web di incorporare un Robots.txt nel codice del tuo sito Web per impedire che le tue immagini vengano scartate dai set di dati di addestramento AI.
Cosa aspettarsi in futuro
È frustrante dover competere con i modelli di intelligenza artificiale, ma sono in arrivo altre soluzioni.
Da un lato, i procedimenti giudiziari stanno elaborando ciò che è legale e come funziona il copyright con la generazione di immagini AI. L’esito di questi dibattiti pubblici fisserà gli standard legali, e possibilmente i regolamenti tempestivi, che le aziende di intelligenza artificiale dovranno seguire.
D’altra parte, gli sviluppatori stanno pensando a come risolvere il problema utilizzando la nuova tecnologia. In uno studio promettente, la ricerca mostra che è possibile utilizzare l’IA per combattere se stessa rendendo un’immagine “non apprendibile” ai set di dati di addestramento dell’IA.
Come spiega la dott.ssa Sarah Monazam Erfani dell’Università di Melbourne : “Abbiamo ideato una tecnica basata sull’apprendimento automatico che identifica e modifica un numero sufficiente di pixel in un’immagine per confondere l’intelligenza artificiale e trasformarla in un’immagine ‘non apprendibile’. Il cambiamento è molto piccolo e impercettibile per gli occhi umani, ma introduce abbastanza “rumore” in un’immagine da renderla inutile per l’addestramento dell’IA.
Se sei una persona interessata dai generatori di immagini AI, vale la pena far sentire la tua voce in modo che queste aziende siano spinte a cambiare le loro pratiche. È stato solo grazie al forte feedback della community di DeviantArt che è stata creata una nuova preferenza di opt-out, quindi assicurati di fornire feedback alle piattaforme di condivisione artistica e alle società di intelligenza artificiale.
Difendere le tue immagini dall’intelligenza artificiale
Puoi proteggere le tue immagini dai generatori di arte AI disattivando i set di dati di addestramento AI, tutelando i diritti d’autore delle tue immagini e utilizzando lo standard Robots.txt. Sebbene non garantisca che le tue immagini rimangano fuori dai sistemi di intelligenza artificiale, l’utilizzo di tutti e tre i metodi ti darà la migliore difesa fino a quando non verranno sviluppate più soluzioni.
Stanno arrivando nuovi strumenti, inclusi modi per regolare impercettibilmente la tua immagine in modo che l’IA non possa imparare da essa, rendendola inutile per addestrare i generatori di arte AI. Nel frattempo, non mollare. Ci sono ancora modi per proteggere le tue immagini dai generatori di arte AI.
Lascia un commento