La Nasa si avvarrà dell’Intelligenza Artificiale (AI) della IBM applicando per la prima volta la tecnologia dei foundation model ai dati satellitari di Osservazione della Terra con l’obiettivo di potenziare e velocizzare l’analisi dell’enorme mole di dati geoscientifici e spaziali raccolti e sperimentare nuovi approcci di studio.
Indice degli argomenti
La prima dei foundation model
Il gigante dell’informatica, specializzatosi da anni in cloud ed intelligenza artificiale, lavorerà a stretto contatto con il Marshall Space Flight Center della Nasa che si trova ad Huntsville, nello stato americano dell’Alabama. Il lavoro congiunto mira ad applicare per la prima volta ai dati satellitari i foundation model, ovvero modelli di AI che sono addestrati su una vasta serie di dati non classificati e possono essere impiegati anche in contesti diversi dai quali sono stati originariamente addestrati.
Dal linguaggio all’analisi dati
I foundation model hanno portato notevoli progressi nel settore del Natural Language Processing (Nlp) durante gli ultimi cinque anni e si pensa che possano essere applicati anche in ambiti al di fuori del linguaggio. Da qui l’idea di impiegarli nell’Osservazione della Terra la cui mole di dati è in costante crescita e ha raggiunto dimensioni ciclopiche, difficilmente gestibili. L’obiettivo è impiegare i foundation model per catalogare e analizzare questi dati accelerando le scoperte scientifiche e fornendo nuovi strumenti di comprensione per problemi urgenti come i cambiamenti climatici.
Comprendere i cambiamenti climatici
Il lavoro congiunto di Big Blue e Nasa sarà suddiviso inizialmente su due progetti. Il primo addestrerà un foundation model sul gruppo di dati Harmonized Landsat Sentinel-2 (Hls) della Nasa che riguardano i cambiamenti della crosta terrestre. L’obiettivo è identificare i cambiamenti nell’impronta geografica causati da fenomeni quali disastri naturali, gli andamenti ciclici dei raccolti e degli habitat della fauna selvatica fornendo, in definitiva, un’analisi critica dei sistemi ambientali del nostro pianeta.
Risposte più veloci
Un altro progetto sarà applicare un modello Nlp a quasi 300.000 articoli di riviste sulla scienza della Terra per organizzare la letteratura e rendere più semplice la scoperta di nuove conoscenze. Il modello, che contiene uno dei più grandi software di AI addestrati finora su Red Hat OpenShift, utilizza PrimeQA, il sistema multilingue open-source di Ibm per l’allenamento di modelli conversazionali (domanda-risposta). Il nuovo modello di linguaggio potrebbe così essere impiegato nei processi di gestione e controllo dei dati scientifici della Nasa.
Il modello open source
Altri progetti, non ancora deliberati, potrebbero riguardare la costruzione di un foundation model per previsioni meteorologiche utilizzando Merra2, un dataset di osservazioni atmosferiche. La nuova collaborazione tra Ibm e Nasa si iscrive all’interno di Open Source Science Initiative, un programma che punta a creare nel prossimo decennio una community scientifica aperta, inclusiva, trasparente e collaborativa sfruttando nuove tecnologie e nuovi approcci sfruttando un modello organizzativo e di sviluppo ripreso proprio dal mondo dell’informatica.
Approccio diversificato
“L’aspetto positivo dei foundation model è che possono essere potenzialmente utilizzati per molte applicazioni derivate. La creazione di questi foundation model non può essere presa in carico da team di piccole dimensioni. È necessario che i team di diverse organizzazioni contribuiscano con le loro differenti prospettive, risorse e competenze” ha dichiarato Rahul Ramachandran, senior research scientist presso il Marshall Space Flight Center della Nasa.
Applicazioni in espansione
“I foundation model si sono dimostrati efficaci nell’elaborazione del linguaggio naturale ed è arrivato il momento di espanderli a nuovi domini e modalità importanti per il business e la società. L’applicazione di foundation model a dati geospaziali, sequenze di eventi, serie temporali e altri fattori non linguistici all’interno dei dati della scienza della Terra potrebbe rendere di colpo disponibili informazioni di enorme valore per un gruppo molto più ampio di ricercatori, aziende e cittadini. In definitiva, potrebbe rendere più facile l’attività di tutti coloro che lavorano su alcuni dei problemi climatici più urgenti” ha affermato Raghu Ganti, principal researcher di IBM.