Desenvolvimento de um método de clustering baseado em grafos de similaridade

Adami, Thiago Henrique

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/31688

Título:	Desenvolvimento de um método de clustering baseado em grafos de similaridade
Título(s) alternativo(s):	Development of a clustering method based on similarity graphs
Autor(es):	Adami, Thiago Henrique
Orientador(es):	Pola, Ives Renê Venturini
Palavras-chave:	Análise por agrupamento Grafos de ligação Cluster (Sistema de computador) Algorítmos computacionais Cluster analysis Bond graphs Cluster analysis - Computer programs Computer algorithms
Data do documento:	20-Jun-2023
Editor:	Universidade Tecnológica Federal do Paraná
Câmpus:	Pato Branco
Citação:	ADAMI, Thiago Henrique. Desenvolvimento de um método de clustering baseado em grafos de similaridade. 2023. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2023.
Resumo:	O processo de clustering consiste em, a partir de um conjunto de dados, obter conjuntos que agrupem dados similares entre si. No entanto, nem todos os algoritmos de clustering se preocupam em reduzir ou eliminar a sobreposição entre os agrupamentos identificados. Dessa maneira, o presente trabalho apresenta um método de clustering baseado em grafos de similaridade extraídos de espaços métricos contendo vetores de características, com o objetivo de minimizar o fator de sobreposição entre clusters. O método de clustering desenvolvido é uma combinação das técnicas DBSCAN e consulta por abrangência (Rq), e introduz a consulta aos k-vizinhos mais próximos (kNNq) como o limite superior para a vizinhança retornada pela Rq. O fator de sobreposição é uma razão que considera o número de elementos que estão na vizinhança de mais de um cluster. Nas combinações de parâmetros de entrada utilizados e nos espaços de teste, o método de clustering apresentou resultados melhores que ou iguais aos obtidos pelo DBSCAN, tanto nos agrupamentos identificados como nos fatores de sobreposição calculados.
Abstract:	The clustering process consists in, starting from a dataset, extracting clusters which contains similar data. On the other hand, not all the clustering methods aim to reduce or remove the overlap between identified clusters. Therefore, the present work proposes the development of a clustering method based on similarity graphs extracted from metric spaces containing feature vectors, which objective is to minimize the overlap between clusters. The proposed clustering method is a combination of DBSCAN and range query (Rq) techniques, and introduces the k-nearest neighbors query (kNNq) as an upper bound of the neighborhood observed by the Rq. The overlap factor is a ratio which considers the number of elements which are in the neighborhood of more than one cluster. Over the input parameter combinations and test spaces, the clustering method presented better or equivalent results to those obtained by DBSCAN, both on the identified clusters and on the evaluation metrics.
URI:	http://repositorio.utfpr.edu.br/jspui/handle/1/31688
Aparece nas coleções:	PB - Engenharia de Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
metodoclusteringgrafosimilaridade.pdf		841,11 kB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons