MapBiomas Solo

Mapas anuais do estoque de carbono orgânico do solo
Mapas estáticos da granulometria (argila, silte e areia) e textura do solo

Essa é uma síntese do método desenvolvido e aplicado no MapBiomas Solo para modelagem espacial da granulometria e espaço-temporal do estoque de carbono orgânico do solo no território brasileiro. Acesse a descrição detalhada dos dados, métodos e algoritmos em https://doi.org/10.58053/MapBiomas/3KXXVV.

1. Introdução

O MapBiomas Solo desenvolveu a segunda coleção (versão beta) de mapas  anuais de estoque de carbono orgânico do solo (COS) no Brasil, para o período de 1985 a 2023 com resolução espacial de 30 metros (Tabela 1). Os mapas apresentam o estoque de carbono orgânico do solo, em toneladas por hectare (t/ha), nos primeiros 30 cm de profundidade do solo.

A Coleção 2 do MapBiomas Solo também traz como novidade mapas da granulometria do solo (versão beta), expressa como a percentagem das frações minerais argila, silte e areia, para cinco camadas de profundidade (0-10, 10-20, 20-30, 0-20 e 0-30 cm) (Tabela 1). Adicionalmente, são apresentados mapas da classificação textural do solo (versão beta) para as camadas de 0-10, 0-20 e 0-30 cm de profundidade segundo três esquemas de classificação (cinco, oito e treze classes texturais).

Os mapas foram desenvolvidos utilizando dados de solo de campo publicados no Repositório SoilData (http://soildata.mapbiomas.org/) e dezenas de variáveis preditoras disponíveis em bases públicas de dados espaciais. Os mapas de propriedades do solo podem ser acessados no módulo do Solo da plataforma do MapBiomas (https://plataforma.brasil.mapbiomas.org/solo). Na plataforma, as propriedades do solo podem ser visualizadas para diferentes recortes territoriais, ambientais e administrativos.

Tabela 1. Mapas de propriedade do solo com resolução espacial de 30 m disponibilizados no módulo do MapBiomas Solo para o território brasileiro.

Propriedade do soloDefiniçãoTipo de variávelCamada do soloResolução temporalAno nominal¹
Estoque de carbono orgânico do solo (COS)Mapas de estoques de COSContínua (estoques de 20  a 255  t/ha e 2 a 26 kg/m²)0 – 30 cmAnualNão se aplica
GranulometriaMapas de teores (%) de areia, silte e argilaContínua (teores de 0 a 100%)0-10, 10-20, 20-30, 0-20 e 0-30 cmNão se aplica1990
TexturaMapas de classes de  texturas do soloCategórica (cinco, oito e treze classes)0-10, 10-20, 20-30, 0-20 e 0-30 cmNão se aplica1990
¹ O “ano nominal” refere-se ao ano (por exemplo, 1990) atribuído aos mapas de granulometria e textura, representando dados de campo de múltiplos anos (1958–2023); isso simplifica a aplicação dos dados em exercícios de modelagem.

2. Conceito

A coleção de mapas de granulometria e estoque de carbono do solo foi produzida utilizando algoritmos de aprendizado de máquina do tipo random forest. Esse algoritmo modela relações estatísticas entre dados de solo coletados no campo e variáveis preditoras. As variáveis preditoras estáticas representam os fatores de formação do solo (clima, organismos, relevo e material de origem), que explicam a variação espacial das propriedades do solo. Já as variáveis preditoras dinâmicas capturam os vetores de mudança ao longo do tempo, como alterações climáticas e mudanças no uso e manejo do solo.

O modelo random forest é composto por centenas de árvores de regressão independentes, cada uma treinada com porções distintas dos dados de treinamento. Cada árvore constrói relações estatísticas específicas entre os dados de solo e as variáveis preditoras, simulando cientistas do solo trabalhando de forma autônoma e utilizando diferentes subconjuntos de dados para identificar padrões solo-paisagem.

As variáveis preditoras abrangem todo o território brasileiro, algumas com frequência anual ao longo da série de 38 anos (1985–2023). Isso permite aplicar o modelo random forest treinado com amostras de campo a áreas não amostradas, gerando estimativas das propriedades do solo em escala nacional. O processo resulta nos mapas estáticos e anuais do MapBiomas Solo. O fluxo de trabalho é apresentado na Figura 1, e as próximas seções descrevem as amostras de treinamento, as variáveis preditoras e o processo de modelagem e mapeamento das propriedades do solo.


Figura 1. Fluxograma do método para geração dos mapas anuais de estoque de carbono orgânico do solo e mapas estáticos de granulometria e textura do solo  do Brasil.

3. Amostras de treinamento

Dados de solo foram coletados de 262 estudos publicados no repositório SoilData (http://soildata.mapbiomas.org/). Após análise, 182 estudos foram selecionados para a modelagem espacial da granulometria do solo (argila, silte e areia). Esses estudos abrangem 11.633 pontos distribuídos pelo Brasil, totalizando 19.965 camadas de solo até 40 cm de profundidade (Figura 2). Para cada camada, as proporções percentuais de argila, silte e areia foram transformadas em “log-razões aditivas” — log(argila/areia) e log(silte/areia) — uma representação matemática que melhora a estabilidade do processo de modelagem.

Um total de 250 conjuntos de dados foi selecionado para a modelagem espaço-temporal do estoque de carbono orgânico do solo. Esses dados representam 15.729 pontos distribuídos pelo Brasil, com informações sobre 29.881 camadas de solo. Algumas propriedades, como a quantidade de fragmentos grossos e a densidade do solo, estavam ausentes em muitas amostras. Esses valores faltantes foram estimados por meio de modelos estatísticos conhecidos como funções de pedotransferência. Após essa etapa, 12.575 pontos e 19.028 camadas, provenientes de 236 conjuntos de dados, foram considerados aptos para compor as amostras de treinamento do modelo espaço-temporal do estoque de carbono orgânico no solo (Figura 2).

O estoque de carbono orgânico do solo (g/m²) foi calculado para cada camada pela equação: teor de carbono × (1 – fragmentos grossos) × densidade do solo × espessura da camada. Nos pontos de amostragem com múltiplas camadas até 30 cm de profundidade, os estoques de carbono de cada camada foram somados para compor o estoque total de carbono orgânico no ponto.


Figura 2. Distribuição espacial das amostras de treinamento obtidas no campo, utilizadas na modelagem espacial da granulometria do solo (esquerda; n = 19.965 amostras) e espaço-temporal do estoque anual de carbono orgânico do solo (direita; n = 12.575 amostras).

O processamento dos dados de solo de campo foi realizado localmente, utilizando R e Python, e na nuvem, utilizando o Google Earth Engine. O código desenvolvido está disponível sob licença aberta no repositório GitHub em https://github.com/Laboratorio-de-Pedometria/mapbiomas-soc. Os dados estão disponíveis sob a licença aberta Creative Commons Atribuição CC-BY no repositório SoilData, nos seguintes links: https://doi.org/10.60502/SoilData/P6R332 (granulometria) e https://doi.org/10.60502/SoilData/SXCSDK (estoque de carbono).

4. Variáveis preditoras

Dados de variáveis preditoras, em formatos raster e vetorial, foram obtidos de bancos de dados abertos (Tabela 2). Eles incluem mapas estáticos (um para toda a série) e dinâmicos (um para cada ano da série), cobrindo todo o Brasil. Após integração no Google Earth Engine, os dados tiveram vazios preenchidos e resolução padronizada para 30 m. Propriedades do solo foram agregadas para a camada de 0–30 cm e dados multicategóricos transformados em variáveis indicadoras binárias (presença ou ausência da categoria). No total, 105 variáveis preditoras plausíveis para modelagem espacial da granulometria e espaço-temporal do estoque de carbono foram incluídas.

A classificação climática de Köppen foi incluída para capturar os efeitos de larga escala do clima. Efeitos localizados da hidrologia e da mudança climática foram representados por indicadores de cobertura do solo com lâmina d’água ao longo da série. Mapas de fitofisionomia e províncias estruturais do IBGE foram usados para representar os efeitos de larga escala da vegetação primária e da geologia. Variáveis morfométricas do terreno, derivadas do modelo digital de elevação, foram obtidas da base do Geomorpho90m para representar os efeitos locais do relevo.

Índices de vegetação como NDVI, SAVI e EVI foram derivados de imagens anuais dos satélites Landsat. O efeito de longo prazo da vegetação no solo foi modelado com médias móveis ponderadas desses índices, considerando os últimos sete anos e atribuindo maior peso aos anos recentes. O efeito temporal da cobertura e uso da terra foi representado pela evolução da idade de cada classe do MapBiomas Cobertura 9.0. Pressões antrópicas e naturais sobre a vegetação foram incorporadas com dados do MapBiomas Degradação e MapBiomas Fogo.

Mapas estáticos de propriedades e classes de solo relacionados à granulometria e ao estoque de carbono orgânico foram obtidos do SoilGrids e da FAO. Mapas de granulometria, no entanto, foram obtidos dos produtos gerados nesta Coleção 2 do MapBiomas Solo. Índices espectrais obtidos a partir de imagens Landsat foram usados para indicar o conteúdo de minerais no solo. Recortes territoriais, como a classificação de biomas do IBGE e a posição espacial, foram utilizados para representar as relações entre clima, organismos, relevo, geologia e solo.

Quadro 2. Variáveis preditoras estáticas e dinâmicas usadas na modelagem da granulometria e estoque anual de carbono orgânico do solo associadas ao fator de estado ou vetor de mudança do solo que elas representam.

Fator ou vetorVariável preditoraAplicaçãoTipo de variável
SoloTeor de areia, silte e argila Fonte: MapBiomas Solo, Coleção 2.0Carbono e granulometriacontínua; estática
Propriedades do solo como capacidade de troca catiônica,  teor de nitrogênio total e pH em água Fonte: SoilGrids 2.0Carbonocontínua; estática
Probabilidade de ocorrência de classes de solo Fonte: SoilGrids 1.0 e FAO GBSmapCarbono e granulometriacontínua; estática
Índices espectrais indicadores de minerais como óxidos de ferro, argilominerais e quartzo Fonte: Imagens LandsatCarbono e granulometriacontínua; estática
ClimaClassificação climática de Köppen Fonte: Alvares et al. (2013)Carbono e granulometriacategórica; estática
Hidrologia; Mudança climáticaCobertura do solo com lâmina de água (ocorrência/ausência e frequência absoluta) Fonte: MapBiomas, Coleção 9.0Carbonocontínua; estática
OrganismosClassificação da vegetação primária (fitofisionomia)Fonte: IBGECarbono e granulometriacategórica; estática
Permanência e mudança da cobertura e uso da terraIdade da classe de cobertura e uso da terraFonte: MapBiomas, Coleção 9.0Carbonocontínua; dinâmica
Índices de vegetação como NDVI, SAVI e EVI Fonte: Imagens LandsatCarbono e granulometriacontínua; dinâmica
Perda de organismosIndicadores de degradação da vegetação nativa (distância de borda de uso antrópico) Fonte: MapBiomas Degradação, Coleção BetaCarbonocontínua; dinâmica
Indicadores de ocorrência de fogo (ocorrência acumulada; frequência no período; anos desde o último fogo) Fonte: MapBiomas Fogo, Coleção 3.0Carbonocontínua; dinâmica e estática
RelevoVariáveis morfométricas do terreno como declividade, índice topográfico composto e elevação Fonte: Geomorpho90mCarbono e granulometriacontínua; estática
GeologiaClassificação da geologia (províncias estruturais) Fonte: IBGEGranulometriacategórica; estática
Território ou posição espacialClassificação territorial por bioma Fonte: IBGECarbono e granulometriacategórica; estática
Coordenadas geográficas (latitude e longitude)Carbonocontínua; estática
O processamento das variáveis preditoras foi realizado na nuvem utilizando o Google Earth Engine.

5. Modelagem e mapeamento

As matrizes de treinamento para os modelos random forest de granulometria (espacial) e estoque de carbono orgânico (espaço-temporal) foram geradas cruzando as amostras de treinamento com as variáveis preditoras. Para a granulometria, as variáveis preditoras incluíram a profundidade da camada e a granulometria da camada superior. A configuração ideal de parâmetros de cada modelo e a lista final de variáveis preditoras para cada propriedade do solo foram determinadas após treinar e avaliar várias combinações de parâmetros, utilizando técnicas de reamostragem como bootstrap e validação cruzada. No total, foram selecionadas 68 e 90 variáveis preditoras para os modelos de granulometria e estoque de carbono, respectivamente.

Dois modelos random forest foram treinados para a granulometria, um para cada razão log-aditiva log(argila/areia) e log(silte/areia). Esses modelos foram aplicados às variáveis preditoras para gerar mapas das razões log-aditivas para as profundidades de 0-10, 10-20 e 20-30 cm. Os mapas gerados foram convertidos para a escala original de conteúdo percentual de argila, silte e areia, e agregados para as camadas de 0-20 e 0-30 cm. A seguir, os mapas de granulometria foram classificados usando três esquemas texturais diferentes (cinco, oito e treze classes) (Figura 3).


Figura 3. Esquemas de classificação da textura do solo com cinco (esquerda), oito (centro) e treze (direita) classes em função do conteúdo de argila, silte e areia (triângulo textural).

Três modelos random forest foram treinados para o estoque de carbono orgânico do solo, um para o bioma Amazônia, outro para o bioma Pampa e outro para os biomas Caatinga, Pantanal, Cerrado e Mata Atlântica. Essa divisão considerou a disponibilidade de amostras de treinamento em cada área. Os modelos treinados foram aplicados às variáveis preditoras para cada um dos 38 anos da série (1985-2023). Para cada pixel, os resultados das árvores de regressão foram agregados pela mediana, considerada o valor predito.

A modelagem e mapeamento foram realizadas localmente, usando R e Python, e na nuvem, utilizando o Google Earth Engine. O código desenvolvido está disponível sob licença aberta no repositório GitHub em https://github.com/mapbiomas. Os dados estão disponíveis sob a licença aberta Creative Commons Atribuição CC-BY no repositório MapBiomas Data, nos seguintes links: https://doi.org/10.58053/MapBiomas/8LQB4S (granulometria) e https://doi.org/10.58053/MapBiomas/TVRX77 (estoque de carbono).