Por Mikaela Weisse e Rachael Petersen

A Parte 2 dessa série de blog encontra-se disponível aqui.

Em 2013, o Dr. Matt Hansen e os seus colaboradores da Universidade de Maryland, do grupo de Análises e Descobertas de Territórios Globais (GLAD), juntamente ao Google, Serviço Geológico dos EUA (USGS) e a Administração Nacional de Aeronáutica e Espaço (NASA) divulgaram o primeiro método de escala global para o monitoramento anual das mudanças na cobertura vegetal usando imagens de resolução Landsat de 30 metros, revolucionando a maneira como as florestas são avaliadas e monitoradas. Os dados das mudanças de cobertura vegetal do GLAD (anteriormente designados como os dados de mudança de cobertura vegetal Hansen) consistem em dois mapas: um da perda anual de cobertura vegetal de 2001-2014, E o outro do ganho acumulado de cobertura vegetal durante o período entre 2000-2012.

O Global Forest Watch (GFW) disponibiliza essas informações livremente na Internet para que todos possam visualizá-las e analisá-las através do seu mapa interativo simples de usar. Além da plataforma rica em análises, o Blog GFW tem como objetivo ajudar as pessoas comuns a compreender os dados, explicando os métodos subjacentes e os resultados em termos acessíveis. Esse blog é o primeiro de uma série de duas partes técnicas que abordam a precisão dos dados de mudança de cobertura vegetal globais do GLAD. Nesta parte, vamos explicar como os autores mediram com precisão os dados, e na segunda parte vamos explorar o que isso significa para quem está acessando as informações.

Como podemos medir a precisão de dados de sensoriamento remoto?

Na detecção remota, a precisão dos dados é medida pela comparação entre a alteração detectada em amostras de área de um mapa com as verdadeiras alterações de cobertura vegetal do local, também conhecidos como “dados verdadeiros”, o que é geralmente determinado por meio de outras imagens de satélite ou visitas de campo. É uma boa prática avaliar os “dados verdadeiros” de forma independente ou sem olhar para o mapa em fase de avaliação, porque isso garante que os investigadores sejam imparciais em suas avaliações. A precisão geral é o percentual da amostra de pixels em que o mapa e os dados verdadeiros apresentam variações.

No entanto, a precisão geral pode ser superestimada quando a cobertura vegetal estável (nesse caso, florestas inalteradas) prevalece sobre as mudanças (perda e ganho) – os erros na identificação de mudanças são sobrepujados pela forma como o computador identifica a cobertura vegetal estável. Examinar os falsos positivos (também conhecidos como erros de comissão) e os falsos negativos (também conhecidos como erros de omissão) das mudanças pode proporcionar uma visão mais correta da precisão dos dados. Um falso positivo é um pixel de 30 metros rotulado como “perda” ou “ganho” no mapa, mas que não se alterou no mundo real. Um falso negativo é o oposto, um pixel rotulado como “nenhuma mudança” pelos dados sendo que na verdade houve ganho ou perda de cobertura vegetal.

O quão precisos são os dados de alteração da cobertura vegetal GLAD?

Os autores dos dados publicaram duas avaliações de precisão até a presente data, a primeira no original Science article por Hansen et al. (2013) e a segunda em um estudo recente de Tyukavina et al. (2015) sobre a perda de carbono em florestas. No primeiro estudo, os autores avaliaram de forma independente a verdadeira mudança de 1.500 blocos de amostras (120 metros de cada lado) usando imagens do Landsat, MODIS e Google Earth. Os dados verdadeiros foram, então, comparados com os mapas de “perda” e “ganho” a nível mundial, e dentro dos quatro grandes biomas – tropical, subtropical, temperado e boreal.

Em uma escala global, o mapa de “perda” tinha uma taxa de falsos positivos de 13% e uma taxa de falso negativo de 12%. O mapa de “ganho” teve uma taxa significativamente mais elevada de erro, com uma taxa de falso-positivo de 24% e uma taxa de falso negativo de 26%. Os erros de “perda” e “ganho” variam consideravelmente entre os quatro grandes biomas, o que sugere que a precisão pode ser maior ou menor dependendo da localização em particular.

PERDA GANHO
Bioma Falso-positivos Falso-negativos Falso-positivos Falso-negativos
Global 13% 12,2% 23,6% 26,1%
Tropical 13% 16,9% 18,1% 52,0%
Subtropical 20,7% 20,6% 14,5% 17,6%
Temperado 11,8% 6,1% 38,0% 23,5%
Boreal 12,2% 6,1% 23,3% 1,6%

Os autores realizaram outro teste para determinar a precisão temporal dos dados de “perda”, na medida em que o mapa detecta perdas no ano correto. Usando os mesmos 1.500 blocos, os autores compararam o ano da “perda” no mapa com a maior mudança nos blocos de validação. Eles descobriram que o ano atribuído às perdas de cobertura vegetal observado foi correto em 75,2% das vezes, e estava correto um ano antes ou depois em 96,7% das vezes.

Enquanto o primeiro estudo mostrou a precisão em escalas regionais e globais, o segundo estudo tratou da precisão dos dados nos trópicos e em uma resolução maior. O segundo estudo analisou a precisão de 3.000 pixels individuais (30 x 30 metros), distribuídos por regiões tropicais da África Subsaariana e Sul e Sudeste da Ásia e da América Latina, em comparação com os dados verdadeiros das imagens do Landsat e Google Earth. Eles encontraram taxas ativas e positivas abaixo de 20% em todas as áreas, exceto na África Subsaariana, que teve 48% de falsos negativos. Os autores suspeitam que a baixa precisão na África esteja relacionada com a prevalência de distúrbio em pequena escala, o que é mais difícil de mapear com uma resolução de 30 metros. Descobriram também que mais de 85% de falso-negativos ocorrem dentro de um pixel mapeado como “perda”, sugerindo que a maior parte do equívoco na perda ocorre nos blocos adjacentes de outras áreas de perda.

PERDA GANHO
Continente Falso-positivos Falso-negativos
África subsaariana 4% 48%
Sul / Sudeste da Ásia 8% 14%
América Latina 4% 17%

O que significa tudo isso?

É importante entender como a precisão é medida e estar ciente dos erros inseridos ​​nos dados. Mas mesmo que não seja 100% preciso os dados de cobertura vegetal GLAD ainda podem nos fornecer informações valiosas?  Confira a Parte 2 dessa série de blog, onde vamos explorar o que todos esses números significam para os usuários dos dados GLAD.