Satellogic, società leader nella raccolta di dati di osservazione della Terra con risoluzione inferiore al metro, ha annunciato il rilascio di un ampio set di dati aperti di immagini ad alta risoluzione, provenienti dall’archivio dell’azienda, per supportare l’addestramento di foundation models.
Indice degli argomenti
3 milioni di immagini
Il set di dati contiene circa 3 milioni di immagini Satellogic di località uniche – 6 milioni di immagini, comprese le rivisitazioni delle località – provenienti da tutto il mondo. Ogni immagine ha una dimensione di 384 per 384 pixel, per un totale di 900 Gigapixel che coprono diversi tipi di uso del suolo, oggetti, aree geografiche e stagioni. L’intero set di dati è disponibile su Hugging Face.
Interazione con l’AI
“A seguito di un flusso di pubblicazioni recenti, con il rilascio di questo ampio set di dati intendiamo accelerare lo sviluppo di modelli fondamentali nel campo dell’osservazione della Terra – spiega Javier Marin, applied AI director di Satellogic -. Invece di affidarci agli analisti per la selezione e l’elaborazione manuale delle immagini satellitari, presto inizieremo a interagire con modelli AI di osservazione della Terra di grandi dimensioni con l’accesso a immagini ad alta risoluzione e in tempo reale del nostro pianeta per ricavare queste intuizioni”.
Licenza Creative Commons
I dati Satellogic sono rilasciati sotto una licenza Creative Commons, che ne consente l’uso commerciale con attribuzione. Un paper di presentazione del dataset sarà pubblicato a breve insieme al rilascio di un modello di base, un autoencoder mascherato (scalable self-supervised learners for computer vision), costruito su di esso. Il paper descrive come è stato costruito il dataset, l’architettura del modello e l’impostazione sperimentale. Questo lavoro è il risultato della collaborazione di Satellogic con un eccezionale team di ricercatori guidati da Alexandre Lacoste di ServiceNow sotto la guida di Yoshua Bengio.