La GIF animata che vedi in basso mostra i vari step del funzionamento di un sistema di Large Language Model, la tecnologia che sta sotto il cofano di ChatGPT. L’immagine mostra cosa accade da quando inseriamo la nostra richiesta (prompt) fino a quando il sistema restituisce una risposta. Tutti questi step sono spiegati in dettaglio sulla parte sinistra.

Su X l’autore ha dato numerose spiegazioni, rispondendo anche alle domande degli utenti sul come e perché ha costruito un progetto così articolato e dispendioso in questo thread, scatenando una conversazione molto interessante.
Un utente ha raccolto queste informazioni e le ha fatte analizzare e riscrivere a Mem.ai: si tratta di un sistema (anch’esso sfrutta l’intelligenza artificiale) che riesce a riorganizzare contenuti, note e immagini che abbiamo raccolto qua e la, creando un testo che metta tutto insieme in un discorso di senso compiuto. Il risultato di questo Mem.ai è molto interessante e sul sito troverai anche una versione gratuita con cui testarlo.
Dallo screenshot in basso si riescono a comparare questi modelli per dimensione: quello indicato con la freccina blu, che si chiama “Nano” è il modello utilizzato nella visualizzazione. Gli altri sono modelli successivi e più grandi, come il GPT-3 che in teoria dovrebbe corrispondere alla versione gratuita di ChatGPT, usata dalla gran parte degli utenti.

La rappresentazione grafica di questi modelli di linguaggio viene considerata un ottimo strumento per comprensione e apprendimento su come funzioni l’intelligenza artificiale nella parte che riguarda i Large Language Model. Ad esempio quella che trovi raccontata in questo post è la visualizzazione con spiegazione dei cosiddetti matmul, che in maniera casereccia potremmo definire come i mattoncini Lego che compongono poi i modelli del cosiddetti Machine Learning.
Alcuni sviluppatori o architetti del software (come quello citato qui) possono aiutarsi nella comprensione di questi strumenti tramite queste visualizzazioni. A questo link e nell’immagine in basso vedi a esempio un cubo di questi mattoncini Lego, composti da tanti punti rossi e azzurri. Se ci passi sopra col mouse, vedrai che ad ogni puntino è associato un numero. Quel numero è un parametro (diciamo che è come se fosse un atomo). Se non lo sapevi già, quando sentirai parlare di «large language model con N miliardi di parametri», adesso hai un’idea meno vaga di cosa stiano dicendo: sono questi mattoncini Lego a forma di pallini, rossi e azzurri. 🙂

Per i non addetti ai lavori (ma anche per tanti che lo sono) è veramente difficile comprendere tutta questa complessità. Il bellissimo canale Youtube di Piero Savastano può essere però un luogo in cui cercare spiegazioni, e perdersi tra i tantissimi tutorial gratuiti presenti.