Google Imagen è la nuova Intelligenza Artificiale, un progetto a metà tra l’entusiasmante ed il preoccupante Scopri di più
Tu scrivi il testo, anche complesso e Google Imagen crea l’immagine corrispondente. No, non parliamo di un giochino da bambini con forme preimpostate, né di un qualcosa che proviene da un film di fantascienza.
Parliamo di qualcosa di assolutamente reale, già funzionante, anche se ad accesso limitato e su cui si possono trovare molte informazioni e dettagli su Internet.
Cosa fa Google Imagen
Ultima e più evoluta IA (Intelligenza Artificiale) tra quelle prodotte dai big della tecnologia, Google Imagen è un sistema evoluto che prende un testo inserito dall’utente e lo trasforma in un immagine a colori, dettagliata ed impressionante dal punto di vista della qualità e della fantasia della realizzazione.
Ma partiamo da più lontano, cosa si intende con IA per text-to-Imagen?
Text-to-Imagen
La mancanza di fantasia è una costante in una buona fetta della popolazione, una mancanza che Google, ma anche Microsoft e molti altri hanno cercato di compensare tramite l’uso massivo di intelligenza artificiale.
Le IA Text-To-Imagen si occupano appunto della generazione di immagini complesse partendo da un testo digitato dall’utente.
Attenzione, non un testo semplice come “mela”, “automobile” o “persona in bici”, ma testi molto più complessi, come quelli, le cui immagini generate hanno fatto scalpore su Internet:
E tante altre, che sono diventate ormai uno standard, tanto da diventare il test tipico per verificare la qualità e padronanza dei sistemi IA.
Qualcosa di entusiasmante, ma allo stesso tempo anche molto preoccupante e rischioso, come spiega in maniera brillante la giornalista e divulgatrice scientifica Celia Guimaraes:
“Imagen” usa l’intelligenza artificiale per risultati sorprendenti di text-to-image, che però presenta notevoli ricadute etiche, tanto che l’azienda stessa non l’ha resa disponibile al pubblico
Celia Guimaraes
Google Imagen ed i suoi fratelli sono quindi sistemi che permettono di partire da un insieme di parole di senso compiuto, che vengono elaborate dal sistema di Machine Learning e mostrate in un opera che può essere realizzata in svariati stili pittorici e di disegno (dall’olio al carboncino, dallo schizzo al cubismo).
La proposta Google
Il gigante di Mountain View non poteva non seguire anche questo filone dell’intelligenza artificiale.
Il risultato di questo studio che unisce Machine Learning, capacità di elaborazione e machine learning è Google Imagen, una tecnologia, che stupisce, convince e preoccupa allo stesso tempo.
Stupisce
Il risultato è davvero molto realistico ed è realizzato attraverso una miriade di stili, abbinamenti e colori che effettivamente lascia a bocca aperta.
Convince
Parliamo di un risultato di qualità, bello e di valore, per un prodotto che, se aperto al pubblico potrebbe davvero rivoluzionare il settore della grafica e dell’editing.
Preoccupa
Il motivo in cui questo prodotto è anche in beta riservata a pochi selezionati utenti è molto chiaro. Le preoccupazioni principalmente sono due:
Prossimi passi
Secondo il team che ha sviluppato Google Imagen, denominato Google Brain, le potenzialità di questa tecnologia sono praticamente infinite.
Jeff Dean responsabile Intelligenza Artificiale di questa sezione ritiene infatti che una soluzione come Google Imagen potrebbe davvero essere d’aiuto a tutte le funzioni che necessitano di creatività e fantasia in ambito grafico.
Ciò che è necessario fare è quindi “solamente” testare a fondo l’Intelligenza Artificiale, che in questo momento si può considerare al pari di un bambino geniale che però non conosce ancora a fondo l’etica e le regole di comportamento.
Un evoluzione che è già in corso, grazie ad un programma basato su beta tester selezionati, le cui richieste a Google Imagen sono supervisionate da Google.
Il Brain Team di Google Imagen racchiude in un ottima frase il motivo per cui lo stesso non è ancora aperto al pubblico:
“Si basa su codificatori di testo addestrati su dati non curati su scala web e quindi eredita i pregiudizi sociali e i limiti dei modelli linguistici di grandi dimensioni. Di conseguenza, c’è il rischio che Imagen abbia codificato stereotipi e rappresentazioni dannose, il che spiega la nostra decisione di non rilasciare Imagen per l’uso pubblico senza ulteriori garanzie.”
Altri rischi
Altri possibili rischi dati dall’implementazione di Google Imagen vanno a colpire, come in tutti i miglioramenti dati dalle tecnologie l’impatto che lo stesso potrebbe generare sul mondo del lavoro.
Dagli studi di grafica ai creatori di manga, sono molte le categorie che potrebbero, almeno in parte venire sostituite da Google Imagen.
Certamente, si tratta di progresso ed in un modo o nell’altro non lo possiamo e dobbiamo fermare, ma sono molte le implicazioni da valutare prima di un eventuale rilascio pubblico.
La critica
C’è poi un altro aspetto che è da considerare e che emerge in molti forum e dibattiti sulla rete. Ad oggi sono davvero poche le persone che abbiano visto Google Imagen al lavoro. I detrattori di Google Imagen, per certi versi “esagerati” ma che hanno giustamente un senso logico, si chiedono se davvero Google Imagen abbia generato le splendide immagini partendo dal testo o se qualche “umano” abbia corretto le descrizioni di quanto richiesto a Google Imagen in base a quanto generato dall’Intelligenza Artificiale.
Tra dubbi, certezze, stupore e preoccupazione, sono ancora molte le sfide che attendono Google Imagen.