Étude de l’outil de suivi des données d’évolution de la couverture arborée mondiale GLAD 

Par Mikaela Weisse et Rachael Petersen

La Partie 1 de la série du blog est disponible ici.

Dans la Partie 1 de la série du blog sur la précision des données de la couverture arborée GLAD, nous avons présenté deux évaluations différentes de la précision des données mondiales en perte et gain de la couverture arborée produites par le Dr. Matt Hansen et des collaborateurs du groupe Global Land Analysis and Discovery (GLAD) de l’Université du maryland, de Google, de l’Institut d’études géologiques des États-Unis (USGS) et de l’Administration nationale de l’aéronautique et de l’espace (NASA). Aujourd’hui, nous aborderons plus en détail les facteurs responsables de l’augmentation des erreurs et la manière dont ils affectent l’utilisation des données.

Quelles sont les causes des erreurs de données ?

Les erreurs sont inévitables dans des données qui tentent de simplifier le monde. Dans le cas des données de la couverture arborée mondiale GLAD, elles sont réparties en trois catégories : les données de perte de la couverture arborée, celles de gain et celles sans changement. Pour la plupart des mesures, les données en « perte » GLAD possèdent des taux d’erreurs moins élevés que des ensembles de données similaires. Par exemple, des données récentes tirées de Landsat sur l’évolution de la couverture terrestre et des forêts dans les années 1990 comportaient des taux d’erreurs de 21 et 17 %, respectivement. Cependant, certaines zones dans les données GLAD ont des taux d’erreurs de 20 % et plus. Les taux d’erreurs les plus élevés peuvent résulter d’un ensemble de facteurs, dont :

  • La faible densité de la canopée de la couverture arborée, telle que l’on peut l’observer dans le biome subtropical, ce qui rend plus difficile la détection des pertes, puisque les changements de la couverture arborée du sol nu sont moins visibles que dans une forêt dense.
  • Les clairières de petite échelle, comme celles qui prédominent en Afrique subsaharienne, qui sont plus susceptibles d’être manquées ou sous-estimées par l’ensemble de données, puisqu’elles possèdent davantage de bordures comparées à leur surface. Les pixels en bordure de clairières sont souvent flous sur les images satellites, de ce fait les données manquent un grand nombre de « pertes » dans ces petites zones.
  • Les changements graduels, tels que le gain de la couverture arborée, plus difficiles à détecter que les changements soudains.

Il est également important de se rappeler l’échelle évaluée dans ces études. Les deux évaluent la précision des données d’importantes régions ou continents, mais pas celle des zones locales. C’est-à-dire que lorsque nous sommes confiants quant à la précision générale des données aux échelles mondiale et régionale, nous ne nous pouvons pas nous prononcer sur la précision d’un emplacement spécifique.

Dans quelle mesure la précision est-elle suffisamment précise ? Cela dépend.

Nous savons que les données GLAD ne sont pas parfaites, et que les taux d’erreurs varient même entre les régions et les biomes, mais cela ne nous indique toujours pas si la précision des données est suffisante pour nous donner des renseignements sur l’évolution des forêts mondiales. La réponse : cela dépend du lieu que vous observez et de la manière dont vous souhaitez utiliser les données.

Au moment de décider s’il convient d’utiliser les données dont vous avez besoin, la première étape consiste à comprendre la précision des données. Félicitations, vous avez déjà commencé en lisant cette série ! L’étape suivante consiste à déterminer en quoi la précision et les erreurs éventuelles peuvent avoir des répercussions sur votre application spécifique. La question de la précision des données est différente pour chaque cas d’utilisation, mais voici quelques lignes directrices :

  • Étudiez les tendances et les modèles à grandes échelles: les taux d’erreurs globaux sont relativement faibles comparés à des ensembles de données similaires, nous avons donc confiance en l’utilisation des données pour étudier les tendances et les modèles à grandes échelles (par ex., mondiale, régionale, nationale).
  • Utilisez des moyennes sur 3 ans: étant donné les incertitudes d’une année sur l’autre, nous vous recommandons d’utiliser des moyennes sur 3 ans. Les nuages se mettent littéralement en travers de la « vue » des satellites, en particulier dans les zones tropicales humides où les nuages peuvent obscurcir la visibilité en dessous, et ce, la majeure partie de l’année. Cela signifie que parfois des arbres peuvent être abattus ou brûlés sous la couverture nuageuse et cela n’est détecté que l’année suivante. Les utilisateurs des données peuvent atténuer ces incertitudes en étudiant la moyenne de plusieurs années.
  • Évaluez les emplacements généraux de perte: alors que la précision n’a pas été évaluée aux échelles locales, nous savons que la plupart des « pertes » manquées se produisent en bordure, nous pouvons donc utiliser en toute confiance les données pour identifier localement l’emplacement général de perte.
  • Utilisez avec prudence les mesures locales: cependant, faire des mesures précises localement (par ex., des hectares de perte de la couverture arborée, le carbone émis par la déforestation) exige davantage d’informations sur la précision à l’emplacement spécifique. Par exemple, en prenant connaissance du contexte local, par l’imagerie satellitaire, en comparant les données d’évolution d’autres forêts, etc.
  • Faites correspondre votre niveau de confiance avec la précision: évitez les affirmations erronées qui s’appuieraient sur des données peu précises (c.-à-d., les zones à faible densité de canopée, le gain de la couverture arborée, etc.).

En cas de questions concernant votre cas d’utilisation, vous pouvez contacter notre communauté via le forum de discussion GFW dans lequel d’autres utilisateurs discutent des points forts et des limites des données.

Les données GLAD en situation

Bien que n’étant pas exemptes d’erreurs, les données GLAD restent le meilleur ensemble de données de perte de la couverture arborée mondiale, avec une méthodologie homogène dans le monde entier permettant de suivre les tendances mondiales, ainsi qu’une résolution suffisamment élevée pour surveiller et découvrir les zones locales de perte de la couverture arborée, telles que dans les sables bitumeux du Canada ou pour la production du cacao au Pérou. Les données représentent une amélioration majeure, par rapport aux données mondiales précédentes sur l’évolution de la forêt : un grand nombre s’appuie sur des données à faible résolution spatiale (250 ou 500 mètres), tandis que d’autres (telles que l’évaluation des ressources forestières de la FAO) ne sont pas spatialement explicites ou mises à jour aussi fréquemment. Les données locales se vantent souvent d’avoir des taux d’erreurs inférieurs, puisqu’elles sont calibrées pour cette situation spécifique, mais elles s’avèrent coûteuses à produire et rarement disponibles d’une année sur l’autre.

Les données d’évolution de la couverture arborée GLAD ne sont pas une représentation parfaite de la perte ou du gain de la couverture arborée, et certains aspects des données ont des taux d’erreurs élevés. Cependant, ce sont les meilleures données disponibles sur l’évolution de la couverture arborée à l’échelle mondiale et elles sont disponibles gratuitement sur Global Forest Watch. Nous espérons que par ces explications sur la précision des données et l’incitation à prendre en considération les taux d’erreurs avant de passer à l’application, nous pouvons renforcer les capacités de nos utilisateurs à déterminer les conclusions appropriées qui peuvent mettre à l’épreuve la déforestation quotidienne (« business as usual ») à travers le monde.