Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/36191
Registro completo de metadados
Campo DCValorIdioma
dc.creatorPissaia, Guilherme Luiz-
dc.date.accessioned2025-03-21T21:48:07Z-
dc.date.available2025-03-21T21:48:07Z-
dc.date.issued2024-09-09-
dc.identifier.citationPISSAIA, Guilherme Luiz. Reconhecimento de objetos em imagens RGB-D visando estimativa da pose em tempo real. 2024. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) - Universidade Tecnológica Federal do Paraná, Dois Vizinhos, 2024.pt_BR
dc.identifier.urihttp://repositorio.utfpr.edu.br/jspui/handle/1/36191-
dc.description.abstractComputer Vision is a field of study in Artificial Intelligence that seeks to employ Machine Learning algorithms to provide applications with the ability to detect visual patterns, classify, and reconstruct objects in multiple dimensions. In this context, this work proposes a substantial improvement based on the conclusions of another study, previously developed. This improvement consists of adding a stage to the execution flow implemented in the original work, which will focus on the detection and classification of objects in two-dimensional scenes, thus seeking to improve the overall result and performance. For this purpose, YOLO, an object detection model, was used in its YOLOv4, YOLOv4-tiny, YOLOv7, and YOLOv7-tiny versions. Thus, it was possible to apply the proposed methodology and perform training and testing of the models using the RGB Scenes dataset. The results proved the effectiveness of YOLO with a mAP value of 99.84% in the best scenario. Furthermore, the processing speed achieved in frames per second was more than ten times higher than that originally achieved, reaching 330 FPS. This demonstrated that the initial hypothesis was correct, given the significant improvement in the performance of the detection task.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Tecnológica Federal do Paranápt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/pt_BR
dc.subjectVisão por computadorpt_BR
dc.subjectSistemas de reconhecimento de padrõespt_BR
dc.subjectAprendizado do computadorpt_BR
dc.subjectComputer visionpt_BR
dc.subjectPattern recognition systemspt_BR
dc.subjectMachine learningpt_BR
dc.titleReconhecimento de objetos em imagens RGB-D visando estimativa da pose em tempo realpt_BR
dc.title.alternativeObject recognition in RGB-D images aiming at real-time pose estimationpt_BR
dc.typebachelorThesispt_BR
dc.description.resumoA Visão Computacional é um campo de estudo da Inteligência Artificial que busca empregar algoritmos de Aprendizado de Máquina para proporcionar a aplicações a capacidade de detectar padrões visuais, classificar e reconstruir objetos em múltiplas dimensões. Nesse contexto, o presente trabalho propõe uma melhoria substancial com base nas conclusões de outro estudo, previamente desenvolvido. Essa melhoria consiste na adição de um estágio no fluxo de execução implementado no trabalho original, cujo foco estará na detecção e classificação de objetos em cenas bidimensionais, buscando, dessa forma, um aprimoramento no resultado e desempenho globais. Para tanto, foi utilizado o YOLO, um modelo de detecção de objetos, nas suas versões YOLOv4, YOLOv4-tiny, YOLOv7 e YOLOv7-tiny. Assim, foi possível aplicar a metodologia proposta e realizar os treinamentos e testes dos modelos utilizando o dataset RGB Scenes. Os resultados comprovaram a eficácia do YOLO com um valor de mAP de 99,84% no melhor cenário. Além disso, a velocidade de processamento atingida em quadros por segundo foi mais de dez vezes maior do que a alcançada originalmente, chegando a 330 FPS. Isso evidenciou que a hipótese inicial estava correta, diante da melhoria significativa no desempenho da tarefa de detecção.pt_BR
dc.degree.localDois Vizinhospt_BR
dc.publisher.localDois Vizinhospt_BR
dc.contributor.advisor1Marcon, Marlon-
dc.contributor.referee1Ortoncelli, André Roberto-
dc.contributor.referee2Will, Newton Carlos-
dc.contributor.referee3Marcon, Marlon-
dc.publisher.countryBrasilpt_BR
dc.publisher.programEngenharia de Softwarept_BR
dc.publisher.initialsUTFPRpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWAREpt_BR
Aparece nas coleções:DV - Engenharia de Software

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
reconhecimentoobjetosrgbdposetemporeal.pdf560,46 kBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons