Come fa un'IA a imparare a riconoscere le valanghe
Come si insegna a un'IA a rilevare le valanghe? La risposta è: dati, dati, dati. Un'IA può fare solo ciò che le si insegna. In questo caso specifico, ciò significa che bisogna "mostrare" al modello molte foto di valanghe. Naturalmente, è necessario mostrare all'IA anche foto che non mostrano valanghe, perché solo così può imparare a distinguerle. Se l'addestramento venisse effettuato esclusivamente o prevalentemente con foto di valanghe, il modello avrebbe un forte bias, cioè tenderebbe a riconoscere una valanga anche se non se ne vedono. Per il progetto CADS sono state utilizzate 4090 foto, sulle quali è stato possibile identificare un totale di 7228 valanghe singole. Le foto utilizzate nel progetto sono state in gran parte fornite dal Servizio di Allerta Valanghe Tirolo e sono state scattate principalmente nella regione alpina di lingua tedesca, soprattutto in Tirolo. Nel processo di addestramento sono state utilizzate tecniche di aumento dei dati, ad esempio variazioni di colore e riflessioni orizzontali casuali, per migliorare la generalizzazione del modello.
Le foto di valanghe utilizzate nel progetto di ricerca dovevano essere "etichettate" prima di poter iniziare l'addestramento vero e proprio. Da un lato, è stato necessario disegnare un poligono attorno al profilo della valanga, dall'altro, è stato necessario assegnare un'etichetta all'immagine. L'etichetta si riferiva al tipo di valanga, ovvero valanga a lastroni, valanga di neve scorrevole o valanga di neve sciolta. Questa forma di etichettatura è sembrata la più sensata, poiché i tre tipi di valanga differiscono per le loro caratteristiche visive. Ad esempio, la valanga di neve a lastroni è caratterizzata da un bordo lineare, mentre le valanghe di neve scorrevole rivelano il sottosuolo e le valanghe di neve sciolta sono caratterizzate da un bordo di valanga puntiforme e da un runout a forma di pera. In questo modo, il modello può essere istruito non solo per rilevare le valanghe in generale, ma anche per differenziare i singoli tipi di valanga. Con l'aiuto di queste "annotazioni", l'addestramento può ora iniziare. Per accelerare il processo, sono stati utilizzati modelli di deep learning esistenti, come il modello di riconoscimento degli oggetti YOLO (v5).
Quanto funziona effettivamente il modello?
Delle foto etichettate, una parte (10%) è stata conservata dalla formazione. Questo gruppo di foto è stato successivamente utilizzato per convalidare le prestazioni del modello. Durante la convalida, le valanghe rilevate dal modello e i loro riquadri di delimitazione vengono confrontati con quelli del set di test. I risultati della validazione in questo "set di prova" sono stati estremamente soddisfacenti: è stato raggiunto un alto tasso di rilevamento e il tasso di valanghe "trascurate" - i cosiddetti falsi negativi - è rimasto basso. Questo è importante per una possibile applicazione pratica in futuro, poiché gli eventi valanghivi trascurati possono talvolta avere gravi conseguenze se, ad esempio, la catena di soccorso non viene messa in moto in tempo in caso di valanga che coinvolge persone o se le misure di sicurezza vengono avviate troppo tardi nel caso di infrastrutture alpine (ad esempio, la chiusura di strade). Le conseguenze dei falsi positivi, cioè quando viene segnalato un rilevamento di valanga anche se non si è verificata alcuna valanga, non sono altrettanto gravi. Tuttavia, questi falsi allarmi sono fastidiosi. Quindi è meglio che anche questa cifra sia stata mantenuta bassa. Per la prima fase di implementazione pratica, sembra ragionevole che la decisione del modello - "valanga" o "nessuna valanga" - sia ulteriormente verificata da esperti del settore. In caso di classificazione errata, la foto corrispondente può essere etichettata correttamente e aggiunta al set di dati di addestramento, al fine di migliorare continuamente la qualità del modello.