An automatic classifier of bat sonotypes around the world
Résumé
1. Bioacoustics is one of the most popular methods in bat research. Bat species are identifiable through their echolocation call features (e.g. peak frequency, duration, bandwidth) but the amounts of recordings to process generally require the help of machine learning algorithms. Yet, classifiers are only developed in some areas of the world and it may take dozens of years before they are available everywhere because reference calls are still lacking for numerous species. Our goal was to develop a universal classifier that would classify bat sonotypes according to call shape and peak frequency.
2. To achieve this, we first defined eight sonotype categories that cover all bat echolocation shapes worldwide. We then trained a classifier using random forest decision trees with a database of 1,154,835 labelled sound events containing bat and non-bat sounds from four continents. After classification, we developed a process to group detected sound events according to the probability scores of their predicted sonotype category and their peak frequency. We then tested the performance of our classifier on a different set of recordings originating from five continents.
3. Depending on the bat sonotype tested, the performance (area under ROC curve) of our classifier ranged between 0.77 and 0.99 for low-quality calls (SNR < 25 dB). Performance ranged between 0.89 and 1 for middle- or high-quality calls (SNR ≥ 25 dB). The performance for bat feeding buzz classification ranged between 0.93 and 0.98 depending on the SNR. The classifier was not developed to classify bat social calls; the majority of them were classified as a bat sonotype.
4. The classifier is an open data format and can be used by anyone to study bats around the world. It can be used to spot acoustically described species but for which a classifier was not developed, and even to detect species that were not acoustically described yet. The grouping of sound events according to call sonotype and peak frequency may be used to describe bat communities and compare the composition of acoustic niches across time and space. This allows the monitoring of bats and the assessment of bat conservation issues in any region of the world.
1. La bioacoustique est l'une des méthodes les plus populaires pour l’étude des Chiroptères. Les espèces de chauves-souris sont identifiables grâce aux propriétés de leurs cris d’écholocation (ex. fréquence dominante, durée, largeur de bande) mais les quantités d'enregistrements à analyser demandent généralement l'aide d'algorithmes en apprentissage machine. Cependant, les classificateurs ne sont développés que dans certaines régions du monde, et cela pourrait durer des dizaines d'années avant qu'ils ne soient disponibles partout, car les cris de référence manquent encore chez de nombreuses espèces. Notre but était de développer un classificateur universel qui classifierait les sonotypes de chauves-souris en fonction de la forme des cris et des fréquences dominantes.
2. Afin de parvenir à cette fin, nous avons d'abord défini huit catégories de sonotypes qui couvrent toutes les formes d’écholocation à travers le monde. Nous avons ensuite entraîné un classificateur en utilisant des forêts d'arbres décisionnels avec une base de données de 1 154 835 évènements sonores étiquetés contenant des sons de chauves-souris et de non-chauves-souris issus de quatre continents. Après classification, nous avons développé un procédé pour regrouper les évènements sonores détectés en fonction des scores de probabilité de leur catégorie de sonotype prédite et de leur fréquence dominante. Nous avons ensuite testé la performance de notre classificateur sur un jeu différent d'enregistrements issus de cinq continents.
3. Selon le sonotype testé, la performance (aire sous la courbe ROC) de notre classificateur variait entre 0,77 et 0,99 pour les cris de basse qualité (SNR < 25 dB). La performance variait entre 0,89 et 1 pour les cris de qualité moyenne ou haute (SNR > 25 dB). La performance pour les buzz de capture de proie variait entre 0,93 et 0,98 en fonction du SNR. Le classificateur n'a pas été développé pour classer les cris sociaux; la majorité d'entre eux ont été classés en sonotype de chauve-souris.
4. Le classificateur est une donnée ouverte et peut être utilisé par quiconque souhaitant étudier les chauves-souris à travers le monde. Il peut être utilisé pour repérer des espèces décrites acoustiquement mais pour lesquelles il n'existe pas encore de classificateur, et même pour détecter des espèces encore non décrites acoustiquement. Le groupement d’évènement sonores en fonction du sonotype et de la fréquence dominante peut être utilisé pour décrire des communautés de chauves-souris et comparer la composition des niches acoustiques à travers le temps et l'espace. Cela permet le suivi et l’évaluation de problématiques de conservation des Chiroptères dans n'importe quelle région du monde.
Fichier principal
Roemer et al. - An automatic classifier of bat sonotypes around th.pdf (5.98 Mo)
Télécharger le fichier
Origine | Fichiers produits par l'(les) auteur(s) |
---|