Modelos preditivos para a estimativa da produtividade da cultura da soja por meio do sensoriamento remoto proximal e aprendizado de máquina

Scheidt, Gabriel Geovane

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/39759

Título:	Modelos preditivos para a estimativa da produtividade da cultura da soja por meio do sensoriamento remoto proximal e aprendizado de máquina
Título(s) alternativo(s):	Predictive models for estimating soybean crop yield through proximal remote sensing and machine learning
Autor(es):	Scheidt, Gabriel Geovane
Orientador(es):	Carneiro, Franciele Morlin
Palavras-chave:	Agricultura - Transferência de tecnologia Soja Sensoriamento remoto Agriculture - Technology transfer Soybean Remote sensing
Data do documento:	27-Nov-2025
Editor:	Universidade Tecnológica Federal do Paraná
Câmpus:	Santa Helena
Citação:	SCHEIDT, Gabriel Geovane. Modelos preditivos para a estimativa da produtividade da cultura da soja por meio do sensoriamento remoto proximal e aprendizado de máquina. 2025. Trabalho de Conclusão de Curso (Bacharelado em Agronomia) - Universidade Tecnológica Federal do Paraná, Santa Helena, 2026.
Resumo:	A estimativa da produtividade de cultivos agrícolas ainda é, em grande parte, realizada de forma subjetiva, o que pode resultar em imprecisões e limitações na interpretação dos resultados obtidos. Diante desse cenário, evidencia-se a necessidade de adoção de metodologias mais precisas, sustentáveis e tecnicamente fundamentadas. Nesse contexto, o Sensoriamento Remoto (SR), aliado às técnicas de Inteligência Artificial (IA), destaca-se como uma abordagem promissora para a obtenção de estimativas mais acuradas e confiáveis, contribuindo para o avanço da Agricultura Digital e Agricultura de Precisão. Com base nesse pressuposto, o presente estudo teve como objetivo estimar a produtividade da soja por meio da integração entre o Sensoriamento Remoto Proximal (SRP) e algoritmos de aprendizado de máquina (Machine Learning – ML), considerando 20 cultivares cultivadas no estado do Paraná. As cultivares avaliadas foram: TMG 23303 XTD, TMG 23306 I2X, TMG 7362 IPRO, TMG 2461, TMG 24402 I2X, TMG 24403 I2X, TMG 24404 I2X, TMG 24405 I2X, TMG 24430 I2X, TMG 24406 I2X, TMG 2165 I2X, BMX Fúria IPRO, BMX Fibra IPRO, Neo 610 IPRO, BMX Lotus IPRO, DM 66i68 IPRO, P 96R10 IPRO, P 95Y95 IPRO, P 96Y90 e P 96R29 IPRO. O experimento foi conduzido na área experimental da Universidade Tecnológica Federal do Paraná (UTFPR), campus Santa Helena, localizada no município de Santa Helena, Estado do Paraná. O delineamento experimental adotado foi o inteiramente casualizado (DIC), em faixas contínuas, composto por 20 tratamentos e nove repetições. As variáveis avaliadas compreenderam características biofísicas das plantas (altura da planta, largura do dossel, produtividade e área de cobertura), bem como os índices de vegetação NDVI (Normalized Difference Vegetation Index) e NDRE (Normalized Difference Red Edge), obtidos por meio de Sensoriamento Remoto Proximal (SRP). Adicionalmente, foi determinada a produtividade da cultura, possibilitando a correlação entre os parâmetros espectrais e o desempenho agronômico das diferentes cultivares. O banco de dados foi dividido em duas etapas: treinamento (80%) e validação (20%). As variáveis de entrada (inputs) corresponderam às características biofísicas das plantas e aos índices de vegetação, enquanto a variável de saída (output) representou a produtividade da soja. Para a análise dos dados, foram empregados os algoritmos de ML Random Forest de Classificação, utilizado na seleção das variáveis mais relevantes, e Random Forest de Regressão, empregado no desenvolvimento e validação dos modelos preditivos. A performance dos modelos validados foi avaliada por meio de métricas de erro, Erro Percentual Absoluto Médio (MAPE) e Raiz do Erro Quadrático Médio (RMSE), e de precisão, representada pelo Coeficiente de Determinação (R²). Os resultados indicaram que os melhores desempenhos foram obtidos pelos modelos com todos os inputs combinados (87,41%), seguidos pelos cenários que consideraram o NDRE e as características biofísicas da planta (71,70%) e a combinação dos índices de vegetação com a largura do dossel (50,27%). Esses achados evidenciam o potencial do uso integrado de variáveis espectrais e biofísicas, em conjunto com técnicas de aprendizado de máquina, para aprimorar a acurácia das estimativas de produtividade da soja.
Abstract:	Estimating agricultural crop productivity remains subjective, mainly leading to inaccuracies and limitations in interpreting results. Given this scenario, there is a clear need to adopt more accurate, sustainable, and technically sound methodologies. In this context, Remote Sensing (RS) combined with Artificial Intelligence (AI) techniques stands out as a promising approach for obtaining more accurate and reliable estimates, Digital Agriculture and Precision Agriculture. Based on this assumption, the present study aimed to estimate soybean productivity by integrating Proximal Remote Sensing (PRS) and Machine Learning (ML) algorithms across 20 cultivars grown in Paraná. The cultivars evaluated were: TMG 23303 XTD, TMG 23306 I2X, TMG 7362 IPRO, TMG 2461, TMG 24402 I2X, TMG 24403 I2X, TMG 24404 I2X, TMG 24405 I2X, TMG 24430 I2X, TMG 24406 I2X, TMG 2165 I2X, BMX Fúria IPRO, BMX Fibra IPRO, Neo 610 IPRO, BMX Lotus IPRO, DM 66i68 IPRO, P 96R10 IPRO, P 95Y95 IPRO, P 96Y90, and P 96R29 IPRO. The experiment was conducted in the experimental area of the Federal Technological University of Paraná (UTFPR), Santa Helena campus, located in the municipality of Santa Helena, State of Paraná. The experimental design adopted was a completely randomized design (CRD) in continuous strips, with 20 treatments and nine replicates. The variables evaluated included biophysical plant characteristics (plant height, canopy width, productivity, and coverage area), as well as the NDVI (Normalized Difference Vegetation Index) and NDRE (Normalized Difference Red Edge) vegetation indices, obtained from Proximal Remote Sensing (PRS). Additionally, crop productivity was determined, enabling the correlation between spectral parameters and the agronomic performance of different cultivars. The database was divided into two stages: training (80%) and validation (20%). The input variables included biophysical plant characteristics and vegetation indices, while the output variable represented soybean productivity. For data analysis, ML Random Forest Classification algorithms were used to select the most relevant variables, and Random Forest Regression was used to develop and validate predictive models. The performance of the validated models was assessed using two error metrics: Mean Absolute Percentage Error (MAPE) and Root Mean Square Error (RMSE), along with an accuracy metric represented by the Coefficient of Determination (R²). The results showed that the best performance was achieved by models that included all inputs combined, with an accuracy of 87.41%. This was followed by scenarios that considered the Normalized Difference Red Edge (NDRE) and the plant's biophysical characteristics, which achieved an accuracy of 71.70%. The combination of vegetation indices with canopy width resulted in a lower accuracy of 50.27%. These findings emphasize the potential of integrating spectral and biophysical variables with machine learning techniques to enhance the accuracy of soybean yield estimates.
URI:	http://repositorio.utfpr.edu.br/jspui/handle/1/39759
Aparece nas coleções:	SH - Agronomia

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
modelospreditivosparaaestimativa.pdf		1,33 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons