ESTIMATIVAS DA ACURÁCIA DO MAPEAMENTO DA COBERTURA DA TERRA PELO PROJETO MAPBIOMAS
ACESSE O PAINEL DE ESTATÍSTICA DE ACURÁCIA DAS COLEÇÕES
A análise de acurácia é a principal forma de avaliação da qualidade do mapeamento realizado pelo MapBiomas. Além de dizer qual a taxa de acerto geral, a análise de acurácia também revela estimativas das taxa de acerto e de erro para cada classe mapeada. O MapBiomas avaliou a acurácia global e para cada classe de uso e cobertura para todos os anos entre 1985 e 2022.
As estimativas da acurácia foram baseadas na avaliação de uma amostra de píxeis, que chamamos de base de dados de referência, composta por ~85.000 amostras. O número de píxeis na base de dados de referência foi pré-determinado por técnicas de amostragem estatística. Em cada ano, cada píxel da base de dados de referência foi avaliado por técnicos treinados em interpretação visual de imagens Landsat. A avaliação da acurácia foi realizada usando métricas que comparam a classe mapeada com a classe avaliada pelos técnicos na base de dados de referência.
Em cada ano, a análise de acurácia é feita a partir da tabulação cruzada das frequências amostrais das classes mapeadas e reais, no formato da Tabela 1. As frequências ni,j representam o número de píxeis na amostra classificados como classe i, e avaliados como classe j. Os totais marginais de linha,, representam o número de amostras mapeadas como classe i, enquanto que os totais marginais de coluna, , representam o número de amostras que foram avaliadas pelos técnicos como classe j. A Tabela 1 é chamada de matriz de erros ou matriz de confusão.
Tabela 1: Matriz de erros amostral genérica
A partir dos resultados da Tabela 1, as proporções amostrais em cada célula da tabela são estimadas por . A matriz de valores é então usada para gerar:
- As acurácias do usuário: São as estimativas das frações de píxels do mapeamento, para cada classe, corretamente classificados. A acurácia do usuário está associada ao erro de comissão, que é o erro cometido ao atribuir um pixel à classe i, quando este pertence a alguma outra classe. A acurácia do usuário para a classe i é estimada por e o erro de comissão por . Essas métricas estão associadas a confiabilidade da de cada classe mapeada.
- Acurácias do produtor: São as frações amostrais de píxels de cada classe corretamente atribuídos às suas classes pelos classificadores. A acurácia do produtor está associada ao erro de omissão, que ocorre quando deixamos de mapear um pixel da classe j corretamente. A acurácia do produtor para a classe j é estimada por e o erro de omissão por . Essas métricas estão associadas à sensibilidade do classificador, ou seja, a capacidade de distinguir corretamente determinada classe entre demais.
- Acurácia global: É a estimativa da proporção de acerto global dos classificadores. A estimativa é dada por , a soma da diagonal principal da matriz de proporções. O complementar da acurácia, ou o erro total ainda é decomposto em discordância de área e discordância de alocação1. A discordância de área mede a fração do erro atribuída à quantidade de área atribuída incorretamente às classes pelo mapeamento, enquanto a discordância de alocação à proporção de erros de deslocamento.
A matriz também provém estimativas dos diferentes tipos de erros. Por exemplo, é possível ver através dessas a estimativa da composição de área de cada classe mapeada. Assim, além da taxa de acerto da classe mapeada como floresta, por exemplo, estimamos também qual a fração dessas áreas que podem ser pastagens ou outras classes de cobertura e uso da terra, para cada ano. Entendemos que esse nível de transparência informa os usuários e maximiza o potencial do uso do mapeamento pelos vários tipos de usuários. Para isso, construímos um aplicativo para facilitar a visualização da acurácia e dos erros do mapeamento
SOBRE OS GRÁFICOS
ESTATÍSTICAS GERAIS
Mostram a acurácia total média anual e o erro decomposto em discordância de área e alocação.
GRÁFICO 1. GRÁFICO DA ACURÁCIA TOTAL ANUAL:
Este gráfico mostra a acurácia total e o erro total por ano. O erro total é decomposto em discordância de área e de alocação. A acurácia é plotada na parte superior e os erros na parte inferior do gráfico.
GRÁFICO 2. MATRIZ DE ERROS:
Esse gráfico mostra a acurácia do usuário, do produtor, e as confusões entre classes, para cada ano. O primeiro mostra as confusões de cada classe mapeada. O segundo mostra as confusões de cada classe real.
GRÁFICO 3. HISTÓRICO DE CLASSES:
Esse gráfico permite inspecionar as confusões de uma determinada classe ao longo do tempo. A acurácia do usuário e do produtor para cada classe é exibida, junto com as confusões em cada ano.