Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/28585
Título: Análise de técnicas de agrupamentos para classificação de sementes de soja
Autor(es): Oliveira, Eduardo Rodrigo de
Orientador(es): Saito, Priscila Tiemi Maeda
Palavras-chave: Soja
Análise por agrupamento
Aprendizado do computador
Soybean
Cluster analysis
Machine learning
Data do documento: 1-Set-2020
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Cornelio Procopio
Citação: OLIVEIRA, Eduardo Rodrigo de. Análise de técnicas de agrupamentos para classificação de sementes de soja. 2020. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2020.
Resumo: Considerado o principal produto da agricultura brasileira, a soja é o quarto grão mais cultivado no mundo e sua produção tende a aumentar. Devido a este grande mercado, a garantia de qualidade do produto torna-se um fator indispensável para empresas que querem se manter competitivas. Maneiras de validar a qualidade e adquirir informações sobre o plantio são os testes de vigor, como o teste de tetrazólio que traz informações de danos ocasionados por umidade, percevejo ou dano mecânico. Entretanto, a verificação do tipo de dano e sua gravidade são realizadas, uma a uma e, visualmente por um analista, ou seja, além de um processo demorado é suscetível ao erro, visto que é um trabalho maçante e cansativo. Propostas envolvendo diferentes abordagens de aprendizado supervisionado, incluindo estratégias de aprendizado ativo, já foram utilizadas e trouxeram resultados significativos. Dessa forma, o objetivo deste trabalho é analisar o desempenho de técnicas não supervisionadas para a classificação de sementes de soja. Para tanto, foi realizada uma avaliação experimental extensiva, considerando (9) diferentes algoritmos de agrupamento (entre eles particionais, hierárquicos e baseados em densidade) aplicadas a (5) conjuntos de imagens de sementes de soja submetidas ao teste de tetrazólio, incluindo diferentes danos e/ou seus respectivos níveis. Para a descrição de tais imagens foram considerados (18) extratores de características tradicionais. Para validação foram consideradas (4) métricas (acurácia, FOWLKES, DAVIES e CALINSKI) e duas técnicas de redução de dimensionalidade (PCA e TSNE). A partir dos resultados obtidos, pode-se observar que o presente trabalho apresenta contribuições significativas, dado que possibilita identificar os descritores e algoritmos de agrupamento a serem utilizados como pré-processamento em outras abordagens de aprendizado, acelerando e melhorando o processo de classificação.
Abstract: Soy is the main product of Brazilian agriculture and the fourth most cultivated bean in the world. Since the cultivation of soy tends to increase and due to this large market, the guarantee of the product quality is an indispensable factor for enterprises to stay competitive. To acquire information and evaluate the quality of soy planting, industries perform vigor tests. The tetrazolium test, for example, provides information about moisture damage, bedbugs or mechanical damage. However, the verification of the damage reason and its severity are done by an analyst, one by one. Since this is a massive and exhausting work, it is susceptible to mistakes. Proposals involving different supervised learning approaches, including active learning strategies have already been used and brought significant results. Therefore, this paper analyzes the performance of non-supervised techniques for classifying soybeans. An extensive experimental evaluation was realized, considering (9) different clustering algorithms (partitional, hierarchical and density based) applied to (5) image datasets of soybeans seeds submitted to the tetrazolium test, including different damages and/or their levels. To describe those images, (18) extractors of traditional features were considered. (4) metrics (accuracy. FOWLKES, DAVIES, and CALINSKI) and two dimensionality reduction techniques (PCA and TSNE) were considered for validation. Results show that this paper presents important contributions, since it makes it possible to identify descriptors and clustering algorithms that shall be used as pre-processing in other learning processes, accelerating and improving the classification process.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/28585
Aparece nas coleções:CP - Engenharia da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
CP_DACOM_2020_1_15.pdf13,13 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.