Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/39098
Título: Análise de espectroscopia utilizando aprendizado de máquina para quantificação de carbono e nitrogênio
Título(s) alternativo(s): Spectroscopy analysis using machine learning for quantification of carbon and nitrogen
Autor(es): Kieling, Vinicius Henrique
Orientador(es): Oliva, Jefferson Tales
Palavras-chave: Aprendizado do computador
Quimiometria
Espectroscopia de infravermelho
Mínimos quadrados
Machine learning
Chemometrics
Infrared spectroscopy
Least squares
Data do documento: 18-Nov-2025
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Pato Branco
Citação: KIELING, Vinicius Henrique. Análise de espectroscopia utilizando aprendizado de máquina para quantificação de carbono e nitrogênio. 2025. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2025.
Resumo: A espectroscopia no infravermelho próximo (NIR) surge como alternativa promissora aos métodos tradicionais de análise de solo, oferecendo vantagens como rapidez, baixo custo e não destrutibilidade. Este trabalho propõe a aplicação de técnicas de aprendizado de máquina para calibrar modelos preditivos de teores de carbono (C) e nitrogênio (N) em solos dos tipos Latossolo e Cambissolo, utilizando dados espectrais do tipo NIR adquiridos com equipamento portátil (MyNIR). Foram testados diversos métodos de pré-processamento, sendo os mais promissores o filtro Savitzky-Golay e remoção de outliers via algoritmo Nonlinear Iterative Partial Least Squares (NIPALS) com função de perda de Huber. Os dados foram comparados entre as estratégias de Validação Cruzada de 10 Folds, Leave-One-Out e Holdout pelo método Kennard-Stone, seguidos de padronização. Modelos de Stacking Ensemble Learning com modelos base Partial Least Squares (PLS), Support Vector Machines Regression (SVR), e Ridge, e com meta-modelo Linear Regression. Os modelos foram treinados e avaliados por métricas de R², RMSE, MAE e RPD. Os resultados finais indicaram desempenho superior para Latossolo (𝑅2 = 0,91 para C e 𝑅2 = 0,89 para N), enquanto o Cambissolo apresentou resultados satisfatórios, porém menos expressivos (𝑅2 = 0,79 para C e 𝑅2 = 0,77 para N). A diferença entre solos sugere influência de características pedológicas. Os modelos demonstraram RPD > 2,0 e baixo overfitting, validando o potencial da abordagem para quantificação rápida de C e N. Este estudo contribui para a otimização de práticas agrícolas sustentáveis, alinhando-se à demanda por métodos analíticos eficientes e ambientalmente amigáveis. A técnica desenvolvida neste estudo permite uma tomada de decisão mais rápida por produtores e consultores com base no teor de matéria orgânica, indicadores de fertilidade, e disponibilidade de nutrientes.
Abstract: Near-Infrared (NIR) spectroscopy emerges as a promising alternative to traditional soil analysis methods, offering advantages such as speed, low cost, and non-destructibility. This work proposes the application of machine learning techniques to calibrate predictive models for carbon (C) and nitrogen (N) contents in Latosol and Cambisol soils, using NIR spectral data acquired with a portable equipment (MyNIR). Various pre-processing methods were tested, with the most promising being the Savitzky-Golay filter and outlier removal via the Nonlinear Iterative Partial Least Squares (NIPALS) algorithm with a Huber loss function. The data strategies were compared using 10-Fold Cross-Validation, Leave-One-Out, and Holdout via the Kennard-Stone method, followed by standardization. Stacking Ensemble Learning models were employed, using Partial Least Squares (PLS), Support Vector Machines Regression (SVR), and Ridge as base models, and Linear Regression as the meta-model. The models were trained and evaluated using the metrics 𝑅2, RMSE, MAE, and RPD. The final results indicated superior performance for Latosol (𝑅2 = 0.91 for C and 𝑅2 = 0.89 for N), while Cambisol presented satisfactory, though less expressive, results (𝑅2 = 0.79 for C and 𝑅2 = 0.77 for N). The difference between soil types suggests the influence of pedological characteristics. The models demonstrated RPD > 2.0 and low overfitting, validating the potential of the approach for rapid quantification of C and N. This study contributes to the optimization of sustainable agricultural practices, aligning with the demand for efficient and environmentally friendly analytical methods. The technique developed in this study enables faster decision-making for producers and consultants based on organic matter content, fertility indicators, and nutrient availability.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/39098
Aparece nas coleções:PB - Engenharia de Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
aprendizadomaquinasolos.pdf10,82 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons