Classificação do câncer de mama utilizando imagens de mamografia e técnicas de aprendizado de máquina

Zortea, Laryssa Rayane

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/39101

Título:	Classificação do câncer de mama utilizando imagens de mamografia e técnicas de aprendizado de máquina
Título(s) alternativo(s):	Breast cancer classification using mammography images and machine learning techniques
Autor(es):	Zortea, Laryssa Rayane
Orientador(es):	Oliva, Jefferson Tales
Palavras-chave:	Mamas - Câncer Mamografia Mamas - Exame Processamento de imagens Aprendizado do computador Tumores - Classificação Breast - Cancer Breast - Radiography Breast - Examination Image processing Machine learning Tumors - Classification
Data do documento:	24-Nov-2025
Editor:	Universidade Tecnológica Federal do Paraná
Câmpus:	Pato Branco
Citação:	ZORTEA, Laryssa Rayane. Classificação do câncer de mama utilizando imagens de mamografia e técnicas de aprendizado de máquina. 2025. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2025.
Resumo:	O câncer de mama representa o tipo de câncer mais incidente entre mulheres em todo o mundo, com cerca de 2,3 milhões de novos casos registrados em 2020. No mesmo ano, destacou-se também como a principal causa de morte por câncer na população feminina. No contexto nacional, o cenário não é diferente: o câncer de mama é o segundo mais frequente entre as mulheres, ficando atrás apenas dos casos de câncer de pele, evidenciando a necessidade de métodos eficazes para detecção e diagnóstico precoce. A mamografia é a principal ferramenta para diagnóstico, porém a análise manual de resultados é suscetível a erros e demanda tempo significativo. Esse contexto reforça a relevância de Sistemas de Diagnóstico Auxiliado por Computador (CAD), que contribuem para a redução de falsos negativos e permitindo que o diagnóstico seja realizado em estágios cada vez mais iniciais da doença. O presente trabalho objetiva propôr de um modelo para classificação de tumores mamários como benignos ou malignos, por meio do uso de técnicas de Processamento Digital de Imagens (PDI) e Aprendizado de Máquina (AM). CLAHE e a Transformada de Fourier foram avaliadas como estratégias de pré-processamento aplicadas ao conjunto de dados CBIS-DDSM, em combinação com três arquiteturas de classificação: uma CNN autoral treinada do zero e as redes pré-treinadas VGG16 e ResNet50. Os resultados indicaram que o pré-processamento teve maior impacto na CNN autoral, cujo valor de AUC apresentou uma melhora de 0,15 ao longo dos experimentos. Entre as redes pré-treinadas, a VGG16 apresentou o melhor desempenho final, alcançando um AUC de 0,707 no conjunto de testes, valor próximo ao desempenho médio de especialistas humanos relatado na literatura. Ainda assim, o comportamento progressivo observado na CNN autoral a destaca como uma alternativa mais leve e promissora. Com a inclusão de uma etapa adequada de segmentação e ajustes adicionais no processo de treinamento, essa arquitetura tem potencial para atingir resultados significativamente superiores.
Abstract:	Breast cancer is the most common type of cancer among women worldwide, with approximately 2.3 million new cases reported in 2020. In the same year, it also stood out as the leading cause of cancer-related death in the female population. The national scenario follows a similar pattern: breast cancer is the second most frequent cancer among women, surpassed only by skin cancer, highlighting the need for effective methods for early detection and diagnosis. Mammography is the primary diagnostic tool, however, manual interpretation of the images is prone to errors and requires considerable time. This context reinforces the relevance of Computer-Aided Diagnosis (CAD) systems, which help reduce false negatives and enable diagnoses to be made at increasingly earlier stages of the disease. This work aims to propose a model for classifying breast tumors as benign or malignant using Digital Image Processing (DIP) and Machine Learning (ML) techniques. CLAHE and the Fourier Transform were evaluated as preprocessing strategies applied to the CBIS-DDSM dataset, in combination with three classification architectures: a custom CNN trained from scratch and the pretrained VGG16 and ResNet50 networks. The results indicated that preprocessing had a greater impact on the custom CNN, whose AUC improved by 0.15 over the course of the experiments. Among the pretrained networks, VGG16 achieved the best final performance, reaching an AUC of 0.707 on the test set, a value close to the average performance of human specialists reported in the literature. Even so, the progressive behavior observed in the custom CNN highlights it as a lighter and promising alternative. With the inclusion of an appropriate segmentation step and further adjustments to the training process, this architecture has the potential to achieve significantly superior results.
URI:	http://repositorio.utfpr.edu.br/jspui/handle/1/39101
Aparece nas coleções:	PB - Engenharia de Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
classificacaolesoesmamarias.pdf		3,13 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons