Ogni settimana ci sono novità sui tool di Intelligenza Artificiale generativa. Ne escono di nuovi, e quelli esistenti cambiano: ad esempio su ChatGPT cambiano frequentemente le feature nell’interfaccia, i plugin da installare. I filoni più popolari di questo fenomeno rimangono sempre due:
- Text-to-text: tool nei quali inserisci una richiesta in formato testo (prompt) e il sistema ti restituisce una risposta in formato testo (ChatGPT, Google Bard, ClaudeAI)
- Text-to-image: tool nei quali inserisci una richiesta in formato testo (sempre prompt) e il sistema ti restituisce un’immagine (DALL-E, Midjourney).
La novità forse più grossa però delle scorse settimane è che Google Bard ha introdotto le funzionalità di analisi dati e creazione data visualization. Su questo abbiamo fatto un piccolo esperimento e – attenzione! – per adesso funziona solo in inglese (cioè, se inserisci il tuo prompt in inglese, il sistema può produrre grafici, ma non lo fa se inserisci il tuo prompt in un’altra lingua). Google Bard è in grado di:
- individuare una fonte dati,
- selezionare i dati che ci servono (nel nostro caso, tasso di disoccupazione in Italia)
- rappresentarli prima in una tabella
- costruire un grafico con un piccolo script in python
- restituirci sia il grafico (scaricabile in formato immagine) che il codice python utilizzato.
A questo punto, abbiamo il nostro output, diciamo così “semilavorato”, per il quale dobbiamo verificare i dati, e possiamo fare delle personalizzazioni o chiedendole a Bard o modificando direttamente il codice. Il risultato è il seguente: clicca sull’immagine in basso per vedere tutto il processo di generazione del grafico, il risultato è buono ma Bard cerca di fare il furbo, se leggi la conversazione fino in fondo! 🙂
Rimane però un grande dilemma: l’esperimento che abbiamo fatto sembra non essere riproducibile! Cioè, se apriamo un’altra chat su Bard e proviamo a creare lo stesso risultato, Bard ci risponderà in maniera sempre diversa! Questa dinamica è effettivamente molto differente rispetto a come siamo soliti usare pezzettini di conoscenza online. Ad esempio, se c’è qualcosa che non va nel nostro computer (una periferica che non funziona, un bug che non riusciamo a risolvere), generalmente cerchiamo una soluzione online, e troviamo ricette per fare il fix da Aranzulla.it a Stackoverflow.com che possiamo replicare: istruzioni chiare, risultato uguale. Nell’usare tool di Generative AI invece la risposta è sempre diversa, perché questi tool funzionano così, non hanno risposte predeterminate e le generano in maniera probabilistica in base a ciò che chiediamo.
Se vuoi approfondire, puoi provare un altro esperimento. In questo caso un utente su Medium racconta come creare una gif animata partendo da zero. Ha chiesto a DALL-E di creare un personaggio, poi di creare uno sprite sheet che contenta i singoli frame in cui questo personaggio fa dei piccoli movimenti (ricorda i cavalli di Muybridge di quasi due secoli fa!), e infine di spacchettare i singoli frame e unirli in una gif animata. Abbiamo provato a replicare l’esperimento, e sembra impossibile ottenere gli stessi risultati!
Insomma, il dilemma rimane e torna alla mente il vecchio saggio “L’opera d’arte nell’epoca della riproducibilità tecnica”: gli stumenti tecnici cambiano la natura dell’arte o di un contenuto creativo (ok, nel nostro caso non è arte dai! 😀) e fanno perdere l’unicità. Posso creare ad esempio una copia perfetta della Gioconda e appenderla nella mia cameretta. Quello che invece creo con tool di Generative AI è alla fine non replicabile/riproducibile alla stessa maniera, anche per me stesso, pur esenguendolo nello stesso identico modo. Un bel rompicapo insomma, che mostra ancora una volta quanto questa tecnologia sia differente dalle precedenti con le quali abbiamo confidenza, e quanto ci sia da sperimentare e imparare prima di capirne concretamente i modi di utilizzo migliori.
In basso e a questo link il nostro sprite sheet fatto con DALL-E con i frame che rappresentano un Boston Terrier in movimento: abbiamo provato a migliorare l’output, ma il risultato è un mezzo disastro! E li disastro non è riproducibile esattamente alla stessa maniera. Provare per credere! 🙂