Comment une IA apprend-elle à détecter les avalanches
Comment apprend-on à une IA à détecter les avalanches ? La réponse est : des données, des données, des données. Une IA ne peut faire que ce qu'on lui apprend. Dans ce cas d'application concret, cela signifie donc qu'il faut "montrer" au modèle de très nombreuses photos d'avalanches. Bien sûr, il faut aussi montrer à l'IA des photos sur lesquelles on ne voit pas d'avalanche, c'est la seule façon pour elle d'apprendre à faire la différence. Si l'entraînement était effectué exclusivement ou en grande partie avec des photos d'avalanches, le modèle aurait un fort biais, c'est-à -dire qu'il aurait tendance à reconnaître une avalanche, même s'il n'y en a pas du tout. Pour le projet CADS, 4090 photos au total ont été utilisées, sur lesquelles 7228 avalanches individuelles ont pu être identifiées. Les photos utilisées dans le projet ont été en grande partie mises à disposition par le Lawinenwarndienst Tirol et ont été prises principalement dans l'espace alpin germanophone, en particulier au Tyrol. Des techniques d'extension des données ont été utilisées dans le processus d'entraînement, par exemple des variations de couleurs et des réflexions horizontales aléatoires, afin d'améliorer la généralisation du modèle.
Les photos d'avalanches utilisées dans le projet de recherche devaient encore être "labellisées" avant le début de l'entraînement proprement dit. D'une part, un polygone devait être dessiné autour du contour de l'avalanche, d'autre part, un label devait être attribué à la photo. Ce label se référait à chaque fois au type d'avalanche, à savoir avalanche de plaque de neige, avalanche de glissement ou avalanche de neige meuble. Cette forme de labellisation semblait la plus judicieuse, car les trois types d'avalanche se distinguent par leurs caractéristiques visuelles. L'arête de rupture marquée en forme de ligne est par exemple typique des avalanches de plaque de neige, les avalanches de glissement laissent apparaître le substrat, les avalanches de neige meuble se distinguent par leur rupture ponctuelle et leur écoulement en forme de poire. Ainsi, on peut apprendre au modèle non seulement à détecter les avalanches en général, mais aussi à distinguer les différents types d'avalanches. À l'aide de ces "annotations", l'entraînement peut maintenant commencer. Pour accélérer le processus, on a eu recours à des modèles de deep learning existants, comme par exemple le modèle de reconnaissance d'objets YOLO (v5).
Quel est le fonctionnement réel du modèle?
Une partie (10%) des photos étiquetées a été retenue par l'entraînement. Ce pool de photos a ensuite été utilisé pour valider la performance du modèle. Au cours de la validation, les avalanches détectées par le modèle ou leurs "bounding boxes" sont comparées à celles du "test set". Les résultats de la validation dans ce "test set" ont été extrêmement réjouissants : un taux de détection élevé a pu être atteint et le taux d'avalanches "oubliées" - ce que l'on appelle les faux négatifs - a pu être maintenu à un niveau bas. Ceci est important pour une éventuelle application pratique à l'avenir dans la mesure où les avalanches oubliées peuvent parfois être lourdes de conséquences, par exemple si la chaîne de sauvetage n'est pas mise en place à temps lors d'une avalanche impliquant des personnes ou si les mesures de sécurisation de l'infrastructure alpine (par ex. barrage routier) sont engagées trop tard. Les conséquences des faux positifs, c'est-à -dire lorsqu'une détection d'avalanche est signalée alors qu'aucune avalanche ne s'est produite, ne sont pas si graves. De telles fausses alertes n'en sont pas moins gênantes. C'est donc une bonne chose que cette valeur ait pu être maintenue à un niveau bas. Pour la première phase de l'introduction pratique, il semble judicieux que la décision du modèle - "avalanche" ou "pas d'avalanche" - soit encore vérifiée par des experts du domaine. En cas de classification erronée, la photo correspondante peut être correctement étiquetée et ajoutée à l'ensemble des données d'entraînement afin d'améliorer en permanence la qualité du modèle.