Thomas Smith, Co-fondatore e CEO di Gado Images ed esperto di tecnologia, privacy, intelligenza artificiale e fotografia, ha condotto un esperimento utilizzando il sistema di intelligenza artificiale GPT-3 di OpenAI. Tale sistema basa le sue conoscenze su miliardi di pagine web e decine di migliaia di libri ed è in grado di generare quasi ogni tipo di testo, come già abbiamo avuto modo di verificare. Lo scopo dell’esperimento era quello di capire quale ruolo potrà avere l’utilizzo dell’IA da parte delle autorità sanitarie e dei governi in future epidemie.
Thomas Smith ha integrato le informazioni già in possesso di GPT-3 dandogli le seguenti: “Un nuovo coronavirus è stato scoperto a Wuhan, in Cina, nel dicembre del 2019 e ha iniziato a diffondersi in tutto il mondo”.
Poi ha iniziato con la prima domanda: “Come è passato il virus agli umani? Quali erano gli animali ospiti intermedi?”, alla quale è seguita la seguente risposta “Il virus è passato agli umani dai pipistrelli. Gli ospiti animali intermedi sono sconosciuti”. Come si può notare, essa è perfettamente in linea con quanto si sa, ad oggi, sull’origine del Covid 19. Alla seconda domanda ” Quali fasce di popolazione sono più colpite dal virus?”, GPT-3 ha risposto: “Anziani e persone affette da malattie croniche”. Questo è completamente vero e non scontato: nella pandemia di influenza spagnola del 1918 i giovani hanno sofferto più degli anziani .
Alla terza domanda: ” Quali altre condizioni peggiorano il virus?”, GPT-3 ha risposto “asma, diabete e malattie renali”. Secondo lo studio Nature, “asma grave”, diabete e “funzione renale ridotta” sono tre delle condizioni preesistenti più significative per il rischio di contrarre il virus. Anche in questo caso, GPT-3 ha fatto tutto questo senza sapere nulla della pandemia oltre a ciò che gli ha scritto l’esperimentatore: le sue conclusioni sono presumibilmente basate sulla sua conoscenza dei coronavirus e delle precedenti pandemie.
Sebbene abbia correttamente indicato i fattori di rischio relativi all’età e alla salute, tuttavia, GPT-3 ha trascurato quelli sociali. Secondo lo studio Nature, essere maschio e di colore espone a un rischio maggiore di morte, mentre GPT-3 ha scritto che “il virus avrà un impatto uguale su maschi e femmine” e che “caucasici e asiatici” sarebbero i più colpiti dal virus. Lo stesso è successo in un altro caso. Quando gli è stato chiesto “Le persone saranno disposte a indossare maschere negli Stati Uniti per fermare la diffusione del virus?”, GPT-3 ha risposto affermativamente in quanto “il virus si diffonde nell’aria e le mascherine aiuteranno a prevenirne la diffusione”. Il sistema è quindi perfettamente in linea con la scienza, pur avendo a disposizione pochissime informazioni sulle specifiche del virus.
Come per i fattori di rischio etnici e di genere, però, esso ha vacillato nel prevedere come sarebbe diventato politicamente polarizzante indossare la maschera. Ciò perché nel suo mondo idealizzato tutti indosserebbe una maschera, perché farlo ha un senso scientifico.
Alla domanda: “In che modo i governi tenteranno di contenere il virus?”, GPT-3 ha risposto che “cercheranno di contenere il virus chiudendo i confini, imponendo restrizioni di viaggio e isolando gli individui infetti”, come in effetti è successo.
Dopo le domande, Smith ha messo in atto un secondo approccio: fornire a GPT-3 informazioni scientifiche più ampie lasciando che esso scrivesse risposte narrative. Inserendo nel sistema il testo ” Non appena il genoma del virus è stato sequenziato, sono iniziati i lavori per lo sviluppo di un vaccino”, GPT-3 ha scritto che “Il primo vaccino è stato sviluppato in un tempo record di 9 mesi da un consorzio internazionale di aziende farmaceutiche, ed era pronto entro settembre 2020. È stato somministrato a 30 milioni di persone nel solo Regno Unito”.
GPT-3 ha quindi previsto correttamente la velocità record dello sviluppo del vaccino e la enorme diffusione delle campagne di vaccinazione. A metà del 2020, molti eminenti esperti non credevano che un vaccino sarebbe stato pronto entro la fine dell’anno, e tanti altri neanche entro la metà del 2021. Anche con dati scientifici limitati, quindi, GPT-3 è stato capace di fare previsioni più vicine alla realtà.
Anche sulle varianti il sistema si è dimostrato sorprendentemente preciso. Quando Smith ha inserito la frase ” Se il virus muta, i siti di mutazione previsti che aumenterebbero la virulenza includono”, il sistema l’ha completata con il testo “sito di legame degli eritrociti e sito di scissione della furina”. Secondo Nature , sia la variante Delta che quella Alpha “hanno alterato i siti di scissione della furina”, e si pensa che questa alterazione le renda trasmissibili più velocemente. L’affermazione di GPT-3 sui siti di legame della furina sembra allinearsi quasi perfettamente con la scienza. Data solo una descrizione di base della struttura del virus, GPT-3 ha essenzialmente previsto con successo la variante Delta.
Ancora più interessante è il fatto che nell’implicare il “sito di legame degli eritrociti”, GPT-3 potrebbe aver previsto un tipo completamente nuovo di variante. Gli eritrociti sono cellule presenti nel sangue. Sebbene Covid-19 non sia considerato un virus trasmesso per via ematica, ha un impatto importante sulle cellule del sangue e alcune prove suggeriscono che le infetti direttamente. Se il virus mutasse per infettare le cellule del sangue in modo più efficiente e per viaggiare attraverso di esso, sembra suggerire GPT-3, questo lo renderebbe molto più virulento.
Il GPT-3 non è certamente accurato al 100% quando si tratta di fare previsioni su Covid-19. Per esempio, secondo il sistema l’origine del virus sarebbe l’Arabia Saudita. Ha anche previsto che il Pakistan e l’Indonesia avrebbero avuto alti tassi di mortalità, cosa che non è successa.
Nel complesso, tuttavia, l’esperimento di Thomas Smith ha dimostrato la grande affidabilità di GPT-3. Anche con input estremamente scarsi, ha fornito previsioni sorprendentemente accurate sul virus e sul corso della pandemia, al punto che non è azzardato ipotizzare un utilizzo dell’IA in questo campo in futuro.
Smith scrive che “I sistemi di intelligenza artificiale spesso mancano di buon senso, ma sono fantastici rilevatori di schemi. In molti casi, un sistema di deep learning ben addestrato può individuare schemi molto meglio dell’uomo. Se il mondo dovesse nuovamente affrontare un nuovo virus simile a Covid-19, i responsabili delle decisioni potrebbero addestrare un sistema come GPT-3 utilizzando ciò che è noto sul nuovo agente patogeno, e quindi porre domande mirate sul virus stesso o sui suoi sviluppi futuri. Tale sistema potrebbe potenzialmente trovare connessioni con precedenti pandemie, somiglianze con altri agenti patogeni e altri modelli utili, e utilizzarli per suggerire misure di salute pubblica, oppure prevedere persino il probabile corso di diffusione del nuovo virus. GPT-3 ha previsto fatti chiave (che il virus si diffonde nell’aria e l’importanza delle mascherine) utilizzando informazioni che sarebbero state quindi disponibili alle autorità sanitarie già nel febbraio del 2020”.
Ma Smith non si è tirato indietro quando ha dovuto fare al sistema la domanda più importante di tutte: “Quando finirà la pandemia?” La risposta di GPT-3? Nel 2023.
Nino Mallamaci