Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/39098| Título: | Análise de espectroscopia utilizando aprendizado de máquina para quantificação de carbono e nitrogênio |
| Título(s) alternativo(s): | Spectroscopy analysis using machine learning for quantification of carbon and nitrogen |
| Autor(es): | Kieling, Vinicius Henrique |
| Orientador(es): | Oliva, Jefferson Tales |
| Palavras-chave: | Aprendizado do computador Quimiometria Espectroscopia de infravermelho Mínimos quadrados Machine learning Chemometrics Infrared spectroscopy Least squares |
| Data do documento: | 18-Nov-2025 |
| Editor: | Universidade Tecnológica Federal do Paraná |
| Câmpus: | Pato Branco |
| Citação: | KIELING, Vinicius Henrique. Análise de espectroscopia utilizando aprendizado de máquina para quantificação de carbono e nitrogênio. 2025. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2025. |
| Resumo: | A espectroscopia no infravermelho próximo (NIR) surge como alternativa promissora aos métodos tradicionais de análise de solo, oferecendo vantagens como rapidez, baixo custo e não destrutibilidade. Este trabalho propõe a aplicação de técnicas de aprendizado de máquina para calibrar modelos preditivos de teores de carbono (C) e nitrogênio (N) em solos dos tipos Latossolo e Cambissolo, utilizando dados espectrais do tipo NIR adquiridos com equipamento portátil (MyNIR). Foram testados diversos métodos de pré-processamento, sendo os mais promissores o filtro Savitzky-Golay e remoção de outliers via algoritmo Nonlinear Iterative Partial Least Squares (NIPALS) com função de perda de Huber. Os dados foram comparados entre as estratégias de Validação Cruzada de 10 Folds, Leave-One-Out e Holdout pelo método Kennard-Stone, seguidos de padronização. Modelos de Stacking Ensemble Learning com modelos base Partial Least Squares (PLS), Support Vector Machines Regression (SVR), e Ridge, e com meta-modelo Linear Regression. Os modelos foram treinados e avaliados por métricas de R², RMSE, MAE e RPD. Os resultados finais indicaram desempenho superior para Latossolo (𝑅2 = 0,91 para C e 𝑅2 = 0,89 para N), enquanto o Cambissolo apresentou resultados satisfatórios, porém menos expressivos (𝑅2 = 0,79 para C e 𝑅2 = 0,77 para N). A diferença entre solos sugere influência de características pedológicas. Os modelos demonstraram RPD > 2,0 e baixo overfitting, validando o potencial da abordagem para quantificação rápida de C e N. Este estudo contribui para a otimização de práticas agrícolas sustentáveis, alinhando-se à demanda por métodos analíticos eficientes e ambientalmente amigáveis. A técnica desenvolvida neste estudo permite uma tomada de decisão mais rápida por produtores e consultores com base no teor de matéria orgânica, indicadores de fertilidade, e disponibilidade de nutrientes. |
| Abstract: | Near-Infrared (NIR) spectroscopy emerges as a promising alternative to traditional soil analysis methods, offering advantages such as speed, low cost, and non-destructibility. This work proposes the application of machine learning techniques to calibrate predictive models for carbon (C) and nitrogen (N) contents in Latosol and Cambisol soils, using NIR spectral data acquired with a portable equipment (MyNIR). Various pre-processing methods were tested, with the most promising being the Savitzky-Golay filter and outlier removal via the Nonlinear Iterative Partial Least Squares (NIPALS) algorithm with a Huber loss function. The data strategies were compared using 10-Fold Cross-Validation, Leave-One-Out, and Holdout via the Kennard-Stone method, followed by standardization. Stacking Ensemble Learning models were employed, using Partial Least Squares (PLS), Support Vector Machines Regression (SVR), and Ridge as base models, and Linear Regression as the meta-model. The models were trained and evaluated using the metrics 𝑅2, RMSE, MAE, and RPD. The final results indicated superior performance for Latosol (𝑅2 = 0.91 for C and 𝑅2 = 0.89 for N), while Cambisol presented satisfactory, though less expressive, results (𝑅2 = 0.79 for C and 𝑅2 = 0.77 for N). The difference between soil types suggests the influence of pedological characteristics. The models demonstrated RPD > 2.0 and low overfitting, validating the potential of the approach for rapid quantification of C and N. This study contributes to the optimization of sustainable agricultural practices, aligning with the demand for efficient and environmentally friendly analytical methods. The technique developed in this study enables faster decision-making for producers and consultants based on organic matter content, fertility indicators, and nutrient availability. |
| URI: | http://repositorio.utfpr.edu.br/jspui/handle/1/39098 |
| Aparece nas coleções: | PB - Engenharia de Computação |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| aprendizadomaquinasolos.pdf | 10,82 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons

