Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/31688
Título: | Desenvolvimento de um método de clustering baseado em grafos de similaridade |
Título(s) alternativo(s): | Development of a clustering method based on similarity graphs |
Autor(es): | Adami, Thiago Henrique |
Orientador(es): | Pola, Ives Renê Venturini |
Palavras-chave: | Análise por agrupamento Grafos de ligação Cluster (Sistema de computador) Algorítmos computacionais Cluster analysis Bond graphs Cluster analysis - Computer programs Computer algorithms |
Data do documento: | 20-Jun-2023 |
Editor: | Universidade Tecnológica Federal do Paraná |
Câmpus: | Pato Branco |
Citação: | ADAMI, Thiago Henrique. Desenvolvimento de um método de clustering baseado em grafos de similaridade. 2023. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2023. |
Resumo: | O processo de clustering consiste em, a partir de um conjunto de dados, obter conjuntos que agrupem dados similares entre si. No entanto, nem todos os algoritmos de clustering se preocupam em reduzir ou eliminar a sobreposição entre os agrupamentos identificados. Dessa maneira, o presente trabalho apresenta um método de clustering baseado em grafos de similaridade extraídos de espaços métricos contendo vetores de características, com o objetivo de minimizar o fator de sobreposição entre clusters. O método de clustering desenvolvido é uma combinação das técnicas DBSCAN e consulta por abrangência (Rq), e introduz a consulta aos k-vizinhos mais próximos (kNNq) como o limite superior para a vizinhança retornada pela Rq. O fator de sobreposição é uma razão que considera o número de elementos que estão na vizinhança de mais de um cluster. Nas combinações de parâmetros de entrada utilizados e nos espaços de teste, o método de clustering apresentou resultados melhores que ou iguais aos obtidos pelo DBSCAN, tanto nos agrupamentos identificados como nos fatores de sobreposição calculados. |
Abstract: | The clustering process consists in, starting from a dataset, extracting clusters which contains similar data. On the other hand, not all the clustering methods aim to reduce or remove the overlap between identified clusters. Therefore, the present work proposes the development of a clustering method based on similarity graphs extracted from metric spaces containing feature vectors, which objective is to minimize the overlap between clusters. The proposed clustering method is a combination of DBSCAN and range query (Rq) techniques, and introduces the k-nearest neighbors query (kNNq) as an upper bound of the neighborhood observed by the Rq. The overlap factor is a ratio which considers the number of elements which are in the neighborhood of more than one cluster. Over the input parameter combinations and test spaces, the clustering method presented better or equivalent results to those obtained by DBSCAN, both on the identified clusters and on the evaluation metrics. |
URI: | http://repositorio.utfpr.edu.br/jspui/handle/1/31688 |
Aparece nas coleções: | PB - Engenharia de Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
metodoclusteringgrafosimilaridade.pdf | 841,11 kB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons