Ma quanti lavori si possono fare con i dati? Con questo articolo continuiamo a curiosare tra le professioni “data based” e ti presentiamo Giuseppe Sollazzo, che si occupa di AI in ambito sanitario, è attivista per gli Open Data e, come leggerai, usa i dati anche extra lavoro.
Ci spieghi che cos’è e come si diventa “Head of Artificial Intelligence Skunkworks and Deployment” del National Health Service inglese?
Ammetto che è il ruolo dal nome più hipster della mia vita professionale. In sostanza, si tratta di permettere al servizio sanitario britannico di provare l’intelligenza artificiale su progetti di scala limitata. Per farlo lavoro con un team e ho un budget di programma di circa £10M per i prossimi 4 anni, da usare per progetti brevi che affrontino problemi esistenti e che possano in qualche modo far luce su “come si usa l’AI” in ambito sanitario. La visione degli AI Skunkworks è che attraverso la condivisione di esperienze, la co-produzione di soluzioni e il rilascio di codice open source si possa espandere la conoscenza dell’AI nel sistema sanitario da un punto di vista pratico, mentre produciamo soluzioni ai “pain points” ordinari dei colleghi che lavorano nel servizio sanitario nazionale.
L’ispirazione viene dagli Skunk Works di Lockheed, che durante la guerra riuscirono a produrre un aereo da guerra molto innovativo con un nuovo metodo di produzione: dedicando un team piccolo, agile, e multidisciplinare, a un problema specifico e a breve-medio termine.
Noi facciamo lo stesso: offriamo a chiunque si occupi di sanità pubblica di usare le nostre risorse per provare ad applicare l’intelligenza artificiale ai loro problemi, clinici e non. Facendo questo, permettiamo a chi si occupa di sanità di toccare con mano che cos’è davvero l’intelligenza artificiale, quando funziona e quando non funziona – siamo molto aperti a parlare di fallimenti oltre che di successi – e in un certo senso spiegando che non c’è “magia”. La visione a lungo termine è che il servizio sanitario possa compiere scelte solide in ambito AI senza paura né hype.
Come ci si diventa… personalmente è stato un viaggio interessante, fatto di successi e fallimenti da cui imparare 🙂 Due sono stati gli elementi chiave:
- prima di tutto, la passione per la “multidisciplinarietà”, che è stato un po’ il leitmotiv dei miei studi e della mia carriera. Sono stato infatti prima in IT tradizionale, poi in IT per la ricerca: da lì è nato un interesse per tutto ciò che ha a che fare coi “dati”, che si tratti di tecnologia o di politiche);
- interessarmi sia alla parte di infrastruttura per i dati, che alla parte di applicazione, e scoprire che concentrarsi sul capire e spiegare ad altri il contesto è ciò che mi da soddisfazione.
In che modo utilizzi i dati nel tuo lavoro e quanto sono stati importanti nell’ultimo anno e mezzo?
I progetti che gestisco sono tutti nel campo dell’intelligenza artificiale, e quindi si tratta spesso di estrarre “big data” da sistemi esistenti, che siano clinici o non. Personalmente, al momento faccio poco direttamente coi dati, e un po’ mi dispiace! Il mio team ovviamente se ne occupa più direttamente, e come parte del budget abbiamo anche la possibilità di lavorare con aziende esterne, solitamente su una base di progetti a breve termine (5-6 sprint in 12 settimane), orientati a produrre un risultato tangibile. Il mio ruolo è quello di enabler, di motivatore, e – questo mi piace dirlo scherzosamente ma ha un fondo di verità – di quello che ne ha viste tante ma proprio tante e quindi sa tirare le leve giuste e capire quando è il caso di spingere e quando di fermarsi.
Essendo arrivato a NHSX a pandemia già in corso, non ho avuto moltissimo a che fare con la corsa per i dati sul COVID-19. I miei colleghi del team di AI Imaging, per esempio, hanno messo velocemente su quello che è un database nazionale di immagini diagnostiche di pazienti per cercare di applicare l’AI al problema della diagnosi COVID-19. Io durante il primo anno della pandemia ero al Ministero dei Trasporti britannico, e mi sono occupato tanto di acquisizione di dati più che della loro analisi. È subito emerso che c’era un’esigenza di collezionare dati a livello nazionale, in un contesto in cui il trasporto è invece spesso gestito localmente: un problema noto ma che solo la pandemia ha permesso di superare, almeno in parte. Durante una crisi si riescono a costruire piattaforme di dati più facilmente, ma siamo consapevoli che queste scelte andrebbero invece prese “in tempo di pace”.
Come si svolge una tua giornata tipo?
Se solo potessi prevederlo! 🙂 Non ci sono due giorni uguali, e questo è interessante. Molte delle mie giornate lavorative includono decine di meeting, che sono un classico stereotipo del dipendente pubblico. Molti di questi meeting sono per seguire i progetti che stiamo gestendo, o per prendermi cura del mio team e di altri team che riportano al mio capo, di cui sono il “vice”.
Poi ci sono tantissimi meeting con potenziali organizzazioni nel sistema sanitario nazionale con cui stiamo facendo i primi passi: gran parte del mio lavoro è centrato sul costruire rapporti con ospedali, centri trasfusionali, e altre organizzazioni che si occupano di sanità, in modo che si possa insieme cercare di applicare l’intelligenza artificiale a problemi esistenti e tangibili.
E solo alla fine di tutto questo c’è un po’ di lavoro tecnico, che però è più centrato sul controllo della qualità e dei processi che nello scrivere codice. Spesso sono anche virtualmente in giro a presentare il nostro lavoro a conferenze, podcast e meetup.
Quali sono i dati con cui lavori?
Lavoriamo con qualunque tipo di dato che sia alla base di un processo del servizio sanitario, che sia clinico o no. Per esempio, al momento stiamo seguendo un progetto per creare un sistema di allineamento automatico delle lastre delle TAC, quindi si tratta principalmente di immagini.
In realtà ci sono anche casi in cui non siamo riusciti a partire con un progetto perché mancano dati sufficientemente dettagliati.
Per esempio, un team di dermatologi sta cercando di creare un sistema di grading automatico delle piaghe da decubito che copra l’intero range di fototipi secondo la scala di Fitzpatrick, un modo per capire come evolveranno le piaghe in pazienti dalla pelle di colore diverso. È un’idea interessantissima con potenziali benefici per i pazienti di ogni gruppo etnico, però non ci sono dataset disponibili con fotografie sufficienti per ogni gruppo sulla scala, e quindi stiamo cercando di capire come creare una piattaforma per la raccolta di questi dati, in modo da creare un modello predittivo e far sì che sia una raccolta etica e non soggetta a bias.
Ti batti per gli Open Data, ci spieghi meglio perché sono fondamentali?
Mi batto per gli Open Data perché, al di là della loro utilità immediata, sono spesso la punta dell’iceberg di un processo che li genera, pubblica, e usa. Quel processo, che è spesso invisibile, crea discussioni e conversazioni dentro le autorità pubbliche che possono creare collaborazione, trasparenza, e innovazione quasi come effetto collaterale. Non posso non citare Clare Moriarty, segretario permanente (la massima carica non-politica) al Ministero dell’Ambiente all’epoca dei loro rilasci di open data: “Rilasciare i nostri dati aperti“, disse Clare (mia traduzione), “fu solo metà del problema. Più rilevante fu l’effetto che questo processo ebbe sul lavorare apertamente tra colleghi. Questa apertura e trasparenza portò a discussioni interessanti su come il modello di Open Government è collegato alla accountability. Parlare di open data ci portò a discutere come essere individui più aperti e trasparenti, come costruire rispetto e fiducia. ‘Open’ ha tanti livelli di significato – essere aperti alle sfide, aperti a nuove esperienze e nuove idee, essere aperti alla diversità“.
Da tecnologo, sono naturalmente affascinato dall’uso degli open data, dai problemi che quei dati rappresentano e possono spiegare, dalle infrastrutture e standard che possiamo stabilire per rendere quei dati più utili e facili da consumare. Ma è il resto dell’iceberg che è davvero importante.
Sei Co-founder di Open Data Camp UK – the national unconference for the Open Data Community. Ci parli di come è cresciuto l’evento negli anni e del concetto di unconference?
Una unconference è una conferenza senza programma prestabilito. Il programma viene creato dai partecipanti stessi all’inizio dell’evento: chi vuole discutere di un certo argomento, può proporre una discussione, e insieme riempiamo l’agenda per la giornata.
Il bello di Open Data Camp è che nonostante gli alti e bassi dell’agenda Open Data in UK, è diventato un appuntamento per la comunità che si interessa a open data per incontrarsi, scambiare idee, e ritrovare le energie. Si tratta di una comunità eterogenea: ci sono partecipanti interessati alla tecnologia, ai data standards, alle policy data, alla trasparenza, c’è sempre un folto gruppo di attivisti OpenStreetMap e geografi, parecchi data journalist e statistici, e abbiamo anche avuto un paio di funzionari piuttosto senior del governo.
Con Open Data Camp abbiamo organizzato 7 eventi a partire dal 2014. Ci siamo incontrati a Winchester, Bristol, Manchester, Belfast, Cardiff, Londra, e – a causa della pandemia – abbiamo anche fatto un più breve “Open Data Cafe” quest’anno. L’evento supera regolarmente i 100 partecipanti, e a Belfast arrivammo a quasi 150 grazie alla vicinanza con la Repubblica d’Irlanda. Open Data Camp è completamente organizzato da volontari come me, è un evento non-profit che ha sempre coperto tutte le spese organizzative attraverso sponsorship di aziende ed enti pubblici appartenenti alla comunità.
Hai dei suggerimenti per chi vorrebbe lavorare con i dati?
Uno su tutti: trova un problema che ti appassiona, e cerca di analizzarlo coi dati. Spesso sarà frustrante, o scoprirai che i dati mancano. Quello è solo il punto di partenza.
Tra l’altro questo suggerimento l’ho vissuto personalmente recentemente. Mi sono trasferito in una zona che ho poi scoperto non avere internet a banda larga. E per creare una campagna di pressione per convincere le compagnie a investire, ho dovuto scartabellare i (pochi) dati locali e nazionali sulla diffusione della broadband e i piani pubblici, per dimostrare alle autorità locali che senza un’intervento non ci sarebbe mai stato un piano di sviluppo della rete internet nella mia strada.
Ecco, la campagna sarebbe stata possibile anche senza dati, ma i dati l’hanno resa più forte.
E, se mi è concesso, il secondo suggerimento è un piccolo “plug”, come si dice qui: iscriversi alla mia data newsletter “Quantum of Sollazzo” 🙂
immagine principale by Franki Chamaki on Unsplash