Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/35306
Registro completo de metadados
Campo DCValorIdioma
dc.creatorRegis, Getúlio Coimbra-
dc.date.accessioned2024-10-31T21:48:17Z-
dc.date.available2024-10-31T21:48:17Z-
dc.date.issued2024-08-20-
dc.identifier.citationREGIS, Getúlio Coimbra. Um estudo empírico da comparação de técnicas de recomendação de tarefas e códigos fontes similares em projetos de software livre. 2024. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Universidade Tecnológica Federal do Paraná, Campo Mourão, 2024.pt_BR
dc.identifier.urihttp://repositorio.utfpr.edu.br/jspui/handle/1/35306-
dc.description.abstractManaging issues in open-source software projects is a challenging and costly task, as many developers are casual and/or novice. On one hand, maintainers need to ensure the quality of issue descriptions and their labels and create mechanisms for recommending and assigning issues. On the other hand, to successfully complete the issue, contributors need to understand it and locate the artifacts related to a given functionality or the defect to be fixed. The goal of this work was to conduct a comparative study of different models for recommending similar issues that could help developers with their contributions. For this we collected data on issues and pull requests from 35 open-source projects hosted on GitHub. We used the Term Frequency - Inverse Document Frequency (TF-IDF), Sentence BERT (SBERT), and Word2Vec techniques to recommend similar issues and source code to assist in the contributions of novice developers. We observed that the models based on the SBERT and TF-IDF techniques yielded better results in the recommendations generated compared to Word2Vec in the two evaluated scenarios (general issues and those marked as good for beginners). These models recommended issues where the code used in the solution was approximately 17% similar to the actual solution of the issue. We concluded that, based on the empirical results obtained, we hope to take the next steps in transferring the knowledge gained to software projects and developers, especially by supporting novice developers during their first contribution.pt_BR
dc.description.sponsorshipFundação Araucária de Apoio ao Desenvolvimento Científico e Tecnológico do Paranápt_BR
dc.description.sponsorshipFundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Tecnológica Federal do Paranápt_BR
dc.rightsopenAccesspt_BR
dc.rightsAttribution 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/*
dc.subjectSoftware livrept_BR
dc.subjectSoftware - Desenvolvimentopt_BR
dc.subjectProgramadores de computadorpt_BR
dc.subjectFree computer softwarept_BR
dc.subjectComputer software - Developmentpt_BR
dc.subjectComputer programmerspt_BR
dc.titleUm estudo empírico da comparação de técnicas de recomendação de tarefas e códigos fontes similares em projetos de software livrept_BR
dc.title.alternativeAn empirical study of the comparison of task recommendation techniques and similar source code in open source software projectspt_BR
dc.typebachelorThesispt_BR
dc.description.resumoGerenciar tarefas em projetos de software livre e uma atividade desafiadora e custosa, uma vez que muitos desenvolvedores são casuais e/ou novatos. Por um lado, os mantenedores precisam cuidar da qualidade das descrições das tarefas e seus rótulos, e criar mecanismos para recomendação e atribuição de tarefas. Por outro, para concluir com sucesso a tarefa, os contribuidores precisam compreendê-la e localizar os artefatos relacionados a uma dada funcionalidade ou ao defeito a ser corrigido. O objetivo deste trabalho consistiu na condução de um estudo comparativo de diferentes modelos de recomendação de tarefas similares que possam ajudar desenvolvedores na sua contribuição. Para isso coletamos dados de tarefas (issues) e requisições de mudanças (pull requests) de 35 projetos de software livre hospedados no GitHub. Usamos as técnicas Term Frequency - Inverse Document Frequency TF-IDF, Sentence BERT (SBERT) e Word2Vec para recomendar tarefas e código fonte similares de maneira a auxiliar a contribuição de desenvolvedores novatos. Observamos que os modelos baseados nas técnicas SBERT e TF-IDF tiveram melhor resultado nas recomendações geradas quando comparados com Word2Vec nos dois cenários avaliados (tarefas gerais do projeto e anotadas como boa para novatos). Estes modelos recomendaram tarefas cujo código usado na solução era aproximadamente 17% similar a solução real da tarefa. Concluímos que, a partir dos resultados empíricos obtidos, esperamos dar os próximos passos na transferência do conhecimento obtido para projetos de software e desenvolvedores, especialmente apoiando os desenvolvedores novatos durante sua primeira contribuição.pt_BR
dc.degree.localCampo Mourãopt_BR
dc.publisher.localCampo Mouraopt_BR
dc.contributor.advisor1Wiese, Igor Scaliante-
dc.contributor.referee1Wiese, Igor Scaliante-
dc.contributor.referee2Polato, Ivanilton-
dc.contributor.referee3Nakamura, Walter Takashi-
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentDepartamento Acadêmico de Computaçãopt_BR
dc.publisher.programCiência da Computaçãopt_BR
dc.publisher.initialsUTFPRpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
Aparece nas coleções:CM - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
estudotecnicasrecomendacaocodigos.pdf397,2 kBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons