Dissertação/Tese Fusão entre bibliotecas espectrais e seleção de amostras baseada na refletância: estratégias para avaliações quantitativas de solos - PPGPV

Dissertações/Teses

Dissertação/Tese do PPGPV
Fusão entre bibliotecas espectrais e seleção de amostras baseada na refletância: estratégias para avaliações quantitativas de solos

Discente de doutorado
ADNANE BENIAICH
  • Ver currículo Lattes
  • Ver ORCID
  • Ver página pessoal
  • Defesa
  • Data: 02/09/2024
  • Hora: 14:00
  • Local: A distancia
  • Ver TCC em PDF
  • Resumo
    A espectroscopia do solo foca no desenvolvimento de técnicas e metodologias que visam compreender o comportamento espectral dos solos e quantificar seus atributos a partir dos dados de reflectância. Diversas estratégias têm sido testadas para prever propriedades do solo utilizando as faixas espectrais Vis-NIR-SWIR e Mid-IR, combinando técnicas de modelagem e fusão espectral. No entanto, a literatura apresenta uma lacuna significativa na realização de análises estatísticas comparativas para avaliar o impacto de algoritmos e técnicas de fusão espectral na melhoria do desempenho preditivo. O presente estudo procurou preencher essa lacuna ao comparar a capacidade preditiva dos espectros Vis-NIR-SWIR e Mid-IR, empregando duas técnicas de fusão espectral: a fusão por Análise de Produto Externo (OPA) e a concatenação vetorial, denominada Side-by-Side (SbS). Para a modelagem espectroscópica, foram utilizados quatro algoritmos de predição múltipla: Support Vector Machine (SVM) com funções Kernel lineares e radiais (SVM-Linear e SVM-Radial), Partial Least Squares Regression (PLSR) e Boosted Regression Trees (BRT). A análise foi conduzida com um banco de dados espectrais de amostras de solo coletadas em quatro estados do Brasil, abrangendo atributos químicos, físicos e mineralógicos. Os resultados mostraram que, embora certas propriedades, como P, K, Mg, Zn e B, apresentassem desafios na previsão precisa, independentemente da faixa espectral ou da técnica de fusão utilizada, outras propriedades exibiram melhorias significativas após a aplicação da fusão espectral. Destacadamente, a técnica de fusão OPA demonstrou um desempenho superior em comparação com a SbS, aprimorando a modelagem para a maioria das propriedades do solo. Além disso, o estudo avaliou diversos algoritmos de previsão, revelando que o SVM-Linear foi o mais eficaz no geral, provavelmente devido à sua habilidade de lidar eficazmente com dados não lineares e outliers. Por outro lado, outras técnicas foram testadas, que consistem em Fuzzy Clustering) usando as pontuações do PCA para definir os clusters. Cinco propriedades do solo (areia total, argila, carbono orgânico, capacidade de troca catiônica e acidez potencial) foram selecionadas para realizar a predição usando uma abordagem estatística e empregando a Support Vector Machine (SVM) com um kernel linear. Os resultados mostraram que o Clustering melhorou significativamente o desempenho da modelagem em todas as cinco propriedades. A melhoria percentual em R² variou de 5,56% (Areia Total) a 34,55% (Acidez Potencial), na faixa Vis-NIR-SWIR. Na faixa Mid-IR, o Clustering melhorou a modelagem de Carbono Orgânico do Solo, Acidez Potencial e Capacidade de Troca Catiônica, mas não melhorou a precisão preditiva para Areia Total e Argila. As melhorias nos clusters de melhor desempenho (considerando o melhor cluster) para SOC, Acidez Potencial e CEC variaram de aproximadamente 2,56% a 6,25%.
  • Palavras-chave:
    espectroscopia do solo; Vis-NIR-SWIR; Mid-IR; agricultura digital; avaliações quantitativas
  • Abstract
    Soil spectroscopy focuses on developing techniques and methodologies to understand the spectral behavior of soils and to quantify their attributes from reflectance data. Several strategies are tested to predict soil proprieties from vis-NIR-SWIR and mid-IR, combining modeling techniques and spectral fusion. However, only a limited number of studies have focused on conducting statistical comparative analyses to assess the effect of algorithms and spectral fusion on improving prediction performance. The presented study aimed to compare the predictive ability of vis-NIR-SWIR and mid-IR specters using two techniques of spectral fusion: fusion by Outer product analysis (OPA), and vector concatenation called here Side-by-Side (SbS). Four multiple prediction algorithms were used for the spectroscopic modeling: Support Vector Machine (SVM) with linear and radial Kernel functions (SVM-Radial and SVM-Linear), Partial Lest Square Regression (PLSR), and Boosted Regression Trees (BT). The modeling was performed using spectral database of various soil samples collected from four States in Brazil, and chemical, physical, and mineralogical attributes. It found that while certain properties like P, K, Mg, Zn, and B were challenging to predict accurately regardless of the spectral range or fusion strategy employed, other properties showed significant improvements after spectral fusion. Notably, the OPA fusion technique demonstrated superior performance compared to SbS, enhancing modeling for most soil properties. The study also evaluated different prediction algorithms, with SVM-Linear proving to be the most effective overall, likely due to its ability to handle nonlinear data and outliers effectively. On the other hand, other techniques were tested, that consist of Fuzzy Clustering) by using the PCA's scores to define the clusters. Five soil properties (total sand, clay, organic carbon, cation exchange capacity, and potential acidity) were selected to perform the prediction using a statistical approach and employing the Support Vector Machine (SVM) with a linear kernel. The results showed that the Clustering significantly improved the modeling performance across all five properties. The percentage improvement in R² ranged from 5.56% (Total Sand) to 34.55% (Potential Acidity), in the Vis-NIR-SWIR range. In the Mid-IR range, the Clustering improved the modeling of Soil Organic Carbon, Potential Acidity, and Cation Exchange Capacity but did not improve the predictive accuracy for the Total Sand and Clay. The improvements in the best-performing clusters (considering the best cluster) for SOC, Potential Acidity, and CEC ranged from approximately 2.56% to 6.25%.
  • Keywords:
    soil spectroscopy; Vis-NIR-SWIR; Mid-IR; digital agriculture; quantitative assessments
  • Banca de defesa

    Presidente
    FABRÍCIO DA SILVA TERRA
  • Nacionalidade: Brasileira
  • Ver currículo Lattes
  • Ver ORCID
  • Ver página pessoal
  • Participante interno
    ANDRÉ MEDEIROS DE ANDRADE
  • Nacionalidade: Brasileira
  • Ver currículo Lattes
  • Ver página pessoal
  • Participante interno
    Luiz E V
  • Nacionalidade: Brasileira
  • Participante externo
    ALCEU LINARES PADUA JUNIOR
  • Nacionalidade: Brasileira
  • Ver currículo Lattes
  • Ver página pessoal