Publication en Biologie Polaire – Équipe ‘Observatoires du Vivant’

RFIDeep : Explorer le potentiel de l'apprentissage profond pour l'identification par radiofréquence !

Les principaux traits phénologiques et d’histoire de vie de populations sauvages suivies par radiofréquence peuvent désormais être déterminés automatiquement par les méthodes d'intelligence artificielle. Au travers d’un réseau dense de collaborations internationales, le Département de Biologie Polaire a mis au point une nouvelle application de l'apprentissage profond “RFIDeep” pour classer automatiquement les saisons de reproduction et déduire les paramètres classiques de reproduction et de survie des animaux suivis par la technologie d'identification par radiofréquence (RFID).

Le suivi automatique de la faune sauvage est devenu un outil essentiel en écologie. En particulier, l'identification par radiofréquence (RFID) est désormais une technologie très répandue pour estimer les paramètres phénologiques, de reproduction et de survie de nombreuses espèces. Cependant, alors que la RFID produit de vastes jeux de données, aucune méthode permettant un traitement fiable et rapide de cette masse de données n'était encore disponible à ce jour. Dans ce contexte, les approches d'apprentissage profond, utilisées pour résoudre des problèmes similaires dans d'autres domaines scientifiques, pourraient nous aider à surmonter ces défis analytiques pour valoriser tout le potentiel des suivis par RFID.

Notre étude propose un flux de travail d'apprentissage profond, nommé "RFIDeep", visant à estimer des caractéristiques écologiques individuelles, telles que le statut et le succès reproducteur, à partir de données de marquage-recapture RFID. Pour démontrer les performances de RFIDeep sur des jeux de données massifs et complexes, nous avons utilisé un suivi électronique et automatique à long terme d'un oiseau marin longévif qui se reproduit en colonies denses et qui réalise de nombreux allers-retours entre son site de reproduction à terre et ses sites d'alimentation en mer, le Manchot royal (Aptenodytes patagonicus).


Pour déterminer le statut reproducteur et la phénologie des individus pour chaque saison de reproduction, nous avons tout d'abord développé une architecture de réseau neuronal convolutif unidimensionnel (1D-CNN). Ensuite, pour tenir compte de la variabilité phénologique et des limites techniques de l'acquisition de données sur le terrain, nous avons développé une étape d'augmentation de données imitant un décalage des dates de reproduction et simulant des détections RFID manquantes, un problème courant avec les systèmes basés sur la RFID. Enfin, pour identifier les phases de la reproduction utilisées lors de la classification, nous avons inclus un outil de visualisation permettant aux utilisateurs de se familiariser et de comprendre ce qui est généralement considéré comme une "boîte noire" en apprentissage profond. Grâce à ces trois étapes, nous avons atteint une grande précision pour tous les paramètres de reproduction : 96,3 % pour le statut de reproduction ; 86,9 % pour la phénologie ; 97,3 % pour le succès de la reproduction.

RFIDeep met ainsi en évidence le potentiel de l'intelligence artificielle pour suivre les changements qui s'opèrent au sein des populations animales, décuplant les avantages des suivis automatiques par marquage-recapture des populations sauvages non perturbées. RFIDeep est un code source ouvert, ce qui facilite l'utilisation, l'adaptation ou le perfectionnement des données RFID pour une grande variété d'espèces. Outre un gain de temps considérable pour l'analyse de ces jeux de données volumineux, notre étude démontre la capacité des modèles CNN à détecter, de manière autonome, des motifs pertinents d’un point de vue écologique au sein des données d’identification, grâce à des techniques de visualisation qui sont rarement utilisées en écologie.

En plus de fournir des données fondamentales précieuses sur l'écologie et les tendances des populations, le traitement automatisé et standardisé de ces données massives, et leur intégration en continu et en temps quasi réel, permettent de gérer et de sécuriser les séries temporelles biologiques à long terme, ainsi que d'optimiser leur utilisation et réutilisation, ce qui est essentiel pour répondre aux principes FAIR. Ces informations, en temps quasi réel, sur l’état de santé des populations et de leurs écosystèmes sont aussi capitales afin d’alerter nos gouvernements, et de mettre en œuvre rapidement des mesures de conservation efficaces.

Publication :

Bardon G., Cristofari R., Winterl A., Barracho T., Benoiste M., Ceresa C., Chatelain N., Courtecuisse J., Fernandes F.A.N., Gauthier-Clerc M., Gendner J.-P., Handrich Y., Houstin A., Krellenstein A., Lecomte N., Salmon C.E., Trucchi E., Vallas B., Wong E., Zitterbart D.P., Le Bohec C. (2023) RFIDeep: Unfolding the potential of deep learning for radio-frequency identification. Methods in Ecology and Evolution. doi: 10.1111/2041-210X.14187
 

Pour plus de renseignements, veuillez contacter :
M. Gaël Bardon
Dr Céline Le Bohec