MapBiomas Solo
Mapas anuais do estoque de carbono orgânico do solo
Mapas estáticos da granulometria (argila, silte e areia) e textura do solo
Essa é uma síntese do método desenvolvido e aplicado no MapBiomas Solo para modelagem espacial da granulometria e espaço-temporal do estoque de carbono orgânico do solo no território brasileiro. Acesse a descrição detalhada dos dados, métodos e algoritmos em https://doi.org/10.58053/MapBiomas/3KXXVV.
1. Introdução
O MapBiomas Solo desenvolveu a segunda coleção (versão beta) de mapas anuais de estoque de carbono orgânico do solo (COS) no Brasil, para o período de 1985 a 2023 com resolução espacial de 30 metros (Tabela 1). Os mapas apresentam o estoque de carbono orgânico do solo, em toneladas por hectare (t/ha), nos primeiros 30 cm de profundidade do solo.
A Coleção 2 do MapBiomas Solo também traz como novidade mapas da granulometria do solo (versão beta), expressa como a percentagem das frações minerais argila, silte e areia, para cinco camadas de profundidade (0-10, 10-20, 20-30, 0-20 e 0-30 cm) (Tabela 1). Adicionalmente, são apresentados mapas da classificação textural do solo (versão beta) para as camadas de 0-10, 0-20 e 0-30 cm de profundidade segundo três esquemas de classificação (cinco, oito e treze classes texturais).
Os mapas foram desenvolvidos utilizando dados de solo de campo publicados no Repositório SoilData (http://soildata.mapbiomas.org/) e dezenas de variáveis preditoras disponíveis em bases públicas de dados espaciais. Os mapas de propriedades do solo podem ser acessados no módulo do Solo da plataforma do MapBiomas (https://plataforma.brasil.mapbiomas.org/solo). Na plataforma, as propriedades do solo podem ser visualizadas para diferentes recortes territoriais, ambientais e administrativos.
Tabela 1. Mapas de propriedade do solo com resolução espacial de 30 m disponibilizados no módulo do MapBiomas Solo para o território brasileiro.
Propriedade do solo | Definição | Tipo de variável | Camada do solo | Resolução temporal | Ano nominal¹ |
Estoque de carbono orgânico do solo (COS) | Mapas de estoques de COS | Contínua (estoques de 20 a 255 t/ha e 2 a 26 kg/m²) | 0 – 30 cm | Anual | Não se aplica |
Granulometria | Mapas de teores (%) de areia, silte e argila | Contínua (teores de 0 a 100%) | 0-10, 10-20, 20-30, 0-20 e 0-30 cm | Não se aplica | 1990 |
Textura | Mapas de classes de texturas do solo | Categórica (cinco, oito e treze classes) | 0-10, 10-20, 20-30, 0-20 e 0-30 cm | Não se aplica | 1990 |
2. Conceito
A coleção de mapas de granulometria e estoque de carbono do solo foi produzida utilizando algoritmos de aprendizado de máquina do tipo random forest. Esse algoritmo modela relações estatísticas entre dados de solo coletados no campo e variáveis preditoras. As variáveis preditoras estáticas representam os fatores de formação do solo (clima, organismos, relevo e material de origem), que explicam a variação espacial das propriedades do solo. Já as variáveis preditoras dinâmicas capturam os vetores de mudança ao longo do tempo, como alterações climáticas e mudanças no uso e manejo do solo.
O modelo random forest é composto por centenas de árvores de regressão independentes, cada uma treinada com porções distintas dos dados de treinamento. Cada árvore constrói relações estatísticas específicas entre os dados de solo e as variáveis preditoras, simulando cientistas do solo trabalhando de forma autônoma e utilizando diferentes subconjuntos de dados para identificar padrões solo-paisagem.
As variáveis preditoras abrangem todo o território brasileiro, algumas com frequência anual ao longo da série de 38 anos (1985–2023). Isso permite aplicar o modelo random forest treinado com amostras de campo a áreas não amostradas, gerando estimativas das propriedades do solo em escala nacional. O processo resulta nos mapas estáticos e anuais do MapBiomas Solo. O fluxo de trabalho é apresentado na Figura 1, e as próximas seções descrevem as amostras de treinamento, as variáveis preditoras e o processo de modelagem e mapeamento das propriedades do solo.
Figura 1. Fluxograma do método para geração dos mapas anuais de estoque de carbono orgânico do solo e mapas estáticos de granulometria e textura do solo do Brasil.
3. Amostras de treinamento
Dados de solo foram coletados de 262 estudos publicados no repositório SoilData (http://soildata.mapbiomas.org/). Após análise, 182 estudos foram selecionados para a modelagem espacial da granulometria do solo (argila, silte e areia). Esses estudos abrangem 11.633 pontos distribuídos pelo Brasil, totalizando 19.965 camadas de solo até 40 cm de profundidade (Figura 2). Para cada camada, as proporções percentuais de argila, silte e areia foram transformadas em “log-razões aditivas” — log(argila/areia) e log(silte/areia) — uma representação matemática que melhora a estabilidade do processo de modelagem.
Um total de 250 conjuntos de dados foi selecionado para a modelagem espaço-temporal do estoque de carbono orgânico do solo. Esses dados representam 15.729 pontos distribuídos pelo Brasil, com informações sobre 29.881 camadas de solo. Algumas propriedades, como a quantidade de fragmentos grossos e a densidade do solo, estavam ausentes em muitas amostras. Esses valores faltantes foram estimados por meio de modelos estatísticos conhecidos como funções de pedotransferência. Após essa etapa, 12.575 pontos e 19.028 camadas, provenientes de 236 conjuntos de dados, foram considerados aptos para compor as amostras de treinamento do modelo espaço-temporal do estoque de carbono orgânico no solo (Figura 2).
O estoque de carbono orgânico do solo (g/m²) foi calculado para cada camada pela equação: teor de carbono × (1 – fragmentos grossos) × densidade do solo × espessura da camada. Nos pontos de amostragem com múltiplas camadas até 30 cm de profundidade, os estoques de carbono de cada camada foram somados para compor o estoque total de carbono orgânico no ponto.
Figura 2. Distribuição espacial das amostras de treinamento obtidas no campo, utilizadas na modelagem espacial da granulometria do solo (esquerda; n = 19.965 amostras) e espaço-temporal do estoque anual de carbono orgânico do solo (direita; n = 12.575 amostras).
O processamento dos dados de solo de campo foi realizado localmente, utilizando R e Python, e na nuvem, utilizando o Google Earth Engine. O código desenvolvido está disponível sob licença aberta no repositório GitHub em https://github.com/Laboratorio-de-Pedometria/mapbiomas-soc. Os dados estão disponíveis sob a licença aberta Creative Commons Atribuição CC-BY no repositório SoilData, nos seguintes links: https://doi.org/10.60502/SoilData/P6R332 (granulometria) e https://doi.org/10.60502/SoilData/SXCSDK (estoque de carbono).
4. Variáveis preditoras
Dados de variáveis preditoras, em formatos raster e vetorial, foram obtidos de bancos de dados abertos (Tabela 2). Eles incluem mapas estáticos (um para toda a série) e dinâmicos (um para cada ano da série), cobrindo todo o Brasil. Após integração no Google Earth Engine, os dados tiveram vazios preenchidos e resolução padronizada para 30 m. Propriedades do solo foram agregadas para a camada de 0–30 cm e dados multicategóricos transformados em variáveis indicadoras binárias (presença ou ausência da categoria). No total, 105 variáveis preditoras plausíveis para modelagem espacial da granulometria e espaço-temporal do estoque de carbono foram incluídas.
A classificação climática de Köppen foi incluída para capturar os efeitos de larga escala do clima. Efeitos localizados da hidrologia e da mudança climática foram representados por indicadores de cobertura do solo com lâmina d’água ao longo da série. Mapas de fitofisionomia e províncias estruturais do IBGE foram usados para representar os efeitos de larga escala da vegetação primária e da geologia. Variáveis morfométricas do terreno, derivadas do modelo digital de elevação, foram obtidas da base do Geomorpho90m para representar os efeitos locais do relevo.
Índices de vegetação como NDVI, SAVI e EVI foram derivados de imagens anuais dos satélites Landsat. O efeito de longo prazo da vegetação no solo foi modelado com médias móveis ponderadas desses índices, considerando os últimos sete anos e atribuindo maior peso aos anos recentes. O efeito temporal da cobertura e uso da terra foi representado pela evolução da idade de cada classe do MapBiomas Cobertura 9.0. Pressões antrópicas e naturais sobre a vegetação foram incorporadas com dados do MapBiomas Degradação e MapBiomas Fogo.
Mapas estáticos de propriedades e classes de solo relacionados à granulometria e ao estoque de carbono orgânico foram obtidos do SoilGrids e da FAO. Mapas de granulometria, no entanto, foram obtidos dos produtos gerados nesta Coleção 2 do MapBiomas Solo. Índices espectrais obtidos a partir de imagens Landsat foram usados para indicar o conteúdo de minerais no solo. Recortes territoriais, como a classificação de biomas do IBGE e a posição espacial, foram utilizados para representar as relações entre clima, organismos, relevo, geologia e solo.
Quadro 2. Variáveis preditoras estáticas e dinâmicas usadas na modelagem da granulometria e estoque anual de carbono orgânico do solo associadas ao fator de estado ou vetor de mudança do solo que elas representam.
Fator ou vetor | Variável preditora | Aplicação | Tipo de variável |
Solo | Teor de areia, silte e argila Fonte: MapBiomas Solo, Coleção 2.0 | Carbono e granulometria | contínua; estática |
Propriedades do solo como capacidade de troca catiônica, teor de nitrogênio total e pH em água Fonte: SoilGrids 2.0 | Carbono | contínua; estática | |
Probabilidade de ocorrência de classes de solo Fonte: SoilGrids 1.0 e FAO GBSmap | Carbono e granulometria | contínua; estática | |
Índices espectrais indicadores de minerais como óxidos de ferro, argilominerais e quartzo Fonte: Imagens Landsat | Carbono e granulometria | contínua; estática | |
Clima | Classificação climática de Köppen Fonte: Alvares et al. (2013) | Carbono e granulometria | categórica; estática |
Hidrologia; Mudança climática | Cobertura do solo com lâmina de água (ocorrência/ausência e frequência absoluta) Fonte: MapBiomas, Coleção 9.0 | Carbono | contínua; estática |
Organismos | Classificação da vegetação primária (fitofisionomia)Fonte: IBGE | Carbono e granulometria | categórica; estática |
Permanência e mudança da cobertura e uso da terra | Idade da classe de cobertura e uso da terraFonte: MapBiomas, Coleção 9.0 | Carbono | contínua; dinâmica |
Índices de vegetação como NDVI, SAVI e EVI Fonte: Imagens Landsat | Carbono e granulometria | contínua; dinâmica | |
Perda de organismos | Indicadores de degradação da vegetação nativa (distância de borda de uso antrópico) Fonte: MapBiomas Degradação, Coleção Beta | Carbono | contínua; dinâmica |
Indicadores de ocorrência de fogo (ocorrência acumulada; frequência no período; anos desde o último fogo) Fonte: MapBiomas Fogo, Coleção 3.0 | Carbono | contínua; dinâmica e estática | |
Relevo | Variáveis morfométricas do terreno como declividade, índice topográfico composto e elevação Fonte: Geomorpho90m | Carbono e granulometria | contínua; estática |
Geologia | Classificação da geologia (províncias estruturais) Fonte: IBGE | Granulometria | categórica; estática |
Território ou posição espacial | Classificação territorial por bioma Fonte: IBGE | Carbono e granulometria | categórica; estática |
Coordenadas geográficas (latitude e longitude) | Carbono | contínua; estática |
5. Modelagem e mapeamento
As matrizes de treinamento para os modelos random forest de granulometria (espacial) e estoque de carbono orgânico (espaço-temporal) foram geradas cruzando as amostras de treinamento com as variáveis preditoras. Para a granulometria, as variáveis preditoras incluíram a profundidade da camada e a granulometria da camada superior. A configuração ideal de parâmetros de cada modelo e a lista final de variáveis preditoras para cada propriedade do solo foram determinadas após treinar e avaliar várias combinações de parâmetros, utilizando técnicas de reamostragem como bootstrap e validação cruzada. No total, foram selecionadas 68 e 90 variáveis preditoras para os modelos de granulometria e estoque de carbono, respectivamente.
Dois modelos random forest foram treinados para a granulometria, um para cada razão log-aditiva log(argila/areia) e log(silte/areia). Esses modelos foram aplicados às variáveis preditoras para gerar mapas das razões log-aditivas para as profundidades de 0-10, 10-20 e 20-30 cm. Os mapas gerados foram convertidos para a escala original de conteúdo percentual de argila, silte e areia, e agregados para as camadas de 0-20 e 0-30 cm. A seguir, os mapas de granulometria foram classificados usando três esquemas texturais diferentes (cinco, oito e treze classes) (Figura 3).
Figura 3. Esquemas de classificação da textura do solo com cinco (esquerda), oito (centro) e treze (direita) classes em função do conteúdo de argila, silte e areia (triângulo textural).
Três modelos random forest foram treinados para o estoque de carbono orgânico do solo, um para o bioma Amazônia, outro para o bioma Pampa e outro para os biomas Caatinga, Pantanal, Cerrado e Mata Atlântica. Essa divisão considerou a disponibilidade de amostras de treinamento em cada área. Os modelos treinados foram aplicados às variáveis preditoras para cada um dos 38 anos da série (1985-2023). Para cada pixel, os resultados das árvores de regressão foram agregados pela mediana, considerada o valor predito.
A modelagem e mapeamento foram realizadas localmente, usando R e Python, e na nuvem, utilizando o Google Earth Engine. O código desenvolvido está disponível sob licença aberta no repositório GitHub em https://github.com/mapbiomas. Os dados estão disponíveis sob a licença aberta Creative Commons Atribuição CC-BY no repositório MapBiomas Data, nos seguintes links: https://doi.org/10.58053/MapBiomas/8LQB4S (granulometria) e https://doi.org/10.58053/MapBiomas/TVRX77 (estoque de carbono).