DALL-E 2 AI di OpenAI è una cattiva notizia per alcuni artisti
DALL-E 2 di OpenAI è stato uno shock per coloro che pensavano che l’intelligenza artificiale non avrebbe mai (o almeno non presto) iniziato a penetrare nel regno della creatività. Ma DALL-E 2 è qui per tenere occupati gli artisti?
Come funziona DALL-E 2?
Il DALL-E 2 è così impressionante che sembra quasi una magia, ma i dettagli generali di come crea immagini così straordinarie e realistiche non sono poi così difficili da capire.
DALL-E 2 è costituito da due componenti principali. Il primo è GPT-3 , che è probabilmente l’algoritmo di apprendimento automatico del linguaggio naturale più avanzato fino ad oggi. DALL-E 2 utilizza anche un altro modello OpenAI noto come CLIP (Contrastive Language-Image Pre-training).
GPT-3 e CLIP consentono a un computer di comprendere e generare un linguaggio naturale complesso. Addestrando una rete neurale DALL-E con miliardi di immagini e le loro descrizioni in linguaggio naturale da (principalmente) Internet, apprende le relazioni tra i concetti.
In un certo senso, DALL-E è l’opposto della comune pratica di apprendimento automatico in cui fornisci un’immagine e l’IA cerca di descrivere ciò che vede.
Pensa alla famigerata app ” Not a Hot Dog ” del programma televisivo della Silicon Valley . La differenza qui è che invece di chiedere all’IA se l’immagine è un hot dog o meno, descrivi un hot dog e crea un’immagine di hot dog completamente originale basata su tutto ciò che ha appreso su di loro.
La seconda parte importante di DALL-E è come genera le immagini. Utilizza una tecnica nota come “diffusione”. In particolare, la comprensione della descrizione in linguaggio umano di un’immagine che è stata creata viene trasformata in un’immagine utilizzando un modello OpenAI chiamato GLIDE . GLIDE acquisisce un’immagine costituita da rumore generato in modo casuale e quindi rimuove gradualmente quel rumore fino a quando non corrisponde all’immagine come descritto nel linguaggio naturale. È un po’ come uno scultore che inizia con un pezzo di marmo e lo scheggia fino a quando rimane solo la statua.
Per una descrizione molto più tecnica e dettagliata di DALL-E 2 sotto il cofano, consigliamo vivamente la spiegazione di DALL-E 2 sul blog di deep learning di AssemblyAI.
Perché DALL-E 2 è così rivoluzionario
DALL-E 2 è tutt’altro che il primo software di machine learning in grado di generare immagini. Ci sono stati molti sistemi precedenti e DALL-E 2 si basa sulle lezioni apprese da quegli altri progetti. Allora perché questa volta sembra una svolta decisiva?
Un motivo importante è che le immagini realizzate da DALL-E e DALL-E 2 sono esteticamente gradevoli. Altri sistemi di imaging AI spesso producono immagini che le persone descrivono come inquietanti o come qualcosa di un sogno. È un po’ come la Uncanny Valley, ma per l’arte. Il DALL-E 2 crea immagini che hanno chiaramente un occhio artistico o un senso estetico dietro di loro.
Pertanto, le immagini create dal DALL-E 2 sono paragonabili alle immagini realizzate da artisti o fotografi di talento che hanno sviluppato il loro senso estetico per tutta la vita. Non è difficile immaginare che qualcuno come questo guardi le immagini che il DALL-E 2 può produrre in pochi secondi e si senta come se stessero per diventare irrilevanti.
Il sistema non solo è in grado di creare splendide immagini ad alta risoluzione in pochi secondi da indicazioni del linguaggio naturale, ma può anche personalizzare e modificare tali immagini o fornire più varianti di un’immagine esistente, anche una fornita dall’utente. Questo significa che gli artisti dovrebbero invece mettere in valigia i loro cavalletti e tavolette da disegno e ” imparare a programmare “?
DALL-E 2 significa che gli artisti cambieranno, non scompariranno
OpenAI è stata molto attenta a presentare semplicemente la sua tecnologia al mondo. Questo è ragionevole, poiché c’è chiaramente molto spazio per gli abusi. Tuttavia, ora che hanno dimostrato che può essere fatto, non ci sarà tempo prima che i ricercatori di IA commerciali o indipendenti replichino ciò che fa DALL-E e lo rendano disponibile a tutti. I grandi attori dell’apprendimento automatico hanno anche i loro artisti di intelligenza artificiale ad alte prestazioni che aspettano il loro tempo, come Google Imagen .
Poiché il vaso di Pandora non può essere chiuso, dovremo accettare che il mondo delle belle arti cambierà irrevocabilmente, ma questo non significa che gli artisti se ne siano andati.
Un modo per vederla è che questo tipo di tecnologia rende possibile creare arte nelle mani di chiunque. L’enfasi si sta ora spostando dalla capacità tecnica di creare immagini alla capacità di descrivere e ripetere accuratamente la tua visione finché ciò che vedi sullo schermo non corrisponde a ciò che avevi in mente. In altre parole, più persone saranno ora in grado di esprimersi visivamente, così come più persone saranno ora in grado di eseguire calcoli accurati grazie all’esistenza di calcolatrici.
Alcuni tipi di artisti potrebbero non avere più modelli di business praticabili. Se stai guadagnando commissioni a pagamento , avrai difficoltà a competere con un programma in grado di creare centinaia di immagini all’ora in base alla descrizione di un cliente e apportare modifiche a quelle immagini quasi istantaneamente. Invece, puoi utilizzare questi strumenti per realizzare la tua visione e quindi vendere quelle immagini uniche in base ai tuoi sentimenti.
Il cliente ha sempre ragione
È anche importante ricordare che alla fine queste immagini sono create per il consumo umano. Noi esseri umani abbiamo il nostro insieme di valori che va oltre la comodità e l’eccellenza tecnica. In un mondo in cui l’arte generata è abbondante e quindi relativamente economica e usa e getta, ci sarà sempre un pubblico disposto ad apprezzare (e acquistare) l’arte creata dall’uomo, semplicemente perché può essere relativamente rara.
In altre parole, software come DALL-E 2 potrebbero segnare la fine per gli artisti che si guadagnano da vivere facendo arte su una catena di montaggio, ma è improbabile che smorzino le prospettive per artisti che hanno qualcosa da dire e che hanno un’identità visiva unica, con attraverso il quale puoi parlare.
Lascia un commento