Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/32649
Título: Emprego de Swin Transformer para classificar imagens radiográficas de tórax e diagnosticar COVID-19
Título(s) alternativo(s): Use of Swin Transformer to classify chest radiographic images and diagnose COVID-19
Autor(es): Ferraz, Aroldo
Orientador(es): Betini, Roberto Cesar
Palavras-chave: Imagens - Radiografia
Visão por computador
COVID-19 (Doença) - Diagnóstico
Aprendizado profundo (Aprendizado do computador)
Tomografia
Images - Radiography
Computer vision
COVID-19 (Disease) - Diagnosis
Deep learning (Machine learning)
Tomography
Data do documento: 7-Ago-2023
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Curitiba
Citação: FERRAZ, Aroldo. Emprego de Swin Transformer para classificar imagens radiográficas de tórax e diagnosticar covid-19. 2023. Dissertação (Mestrado em Computação Aplicada) - Universidade Tecnológica Federal do Paraná, Curitiba, 2023.
Resumo: Segundo dados da Organização Mundial da Saúde (WHO), a pandemia de COVID-19, desde o início de 2020, já infectou mais de 770,56 milhões de pessoas em todo o mundo. Dentre os infectados, mais de 6,95 milhões de pessoas perderam a vida. A COVID-19 é uma doença extremamente contagiosa, e pode incapacitar rapidamente os sistemas de saúde se os infectados não forem diagnosticados e as medidas de isolamento e tratamento do agravamento não forem tomadas em tempo hábil. O principal teste de triagem utilizado para diagnosticar a COVID-19 foi o Real Time Reverse Transcription-Polymerase Chain ReactionRT-PCR, que embora seja preciso e confiável, demora um tempo considerável para o diagnóstico definitivo. Desde o início da pandemia, vários pesquisadores demonstraram a viabilidade de empregar várias técnicas de Deep Learning (DL) baseadas em Redes Neurais Convolucionais (CNN), com as quais obtiveram desempenho promissor para diagnosticar a COVID-19 em radiografias e em tomografia computadorizada. No entanto, alguns autores defendem que os métodos DL existentes e baseados em CNN estão sendo desafiados por novas arquiteturas e modelos de DL. Motivados por isso, neste trabalho, propomos o uso de Swin Transformer (em vez de CNN) para triagem de COVID-19 usando as imagens de raio X de quatro datasets originais: COVID-QU-Ext Dataset, SARSCOV2-CT Dataset, HUST-19 e HCV-UFPR-COVID-19. Esses datasets foram mesclados em diferentes estratégias o que resultou em um total de 9 datasets distintos. Empregamos transfer learning para mitigar a questão da escassez de dados. Além disso, avaliamos se os modelos têm alto poder de generalização, em função das características aprendidas, possibilitando o treinamento em um dataset e o teste em outro, com o objetivo de avaliar se há perda significativas nos valores das métricas obtidas. Ao analisar os resultados acumulados dos experimentos em todos os datasets e estratégias, fica evidente que o Swin Transformer se destaca. Em termos de sensibilidade/recall, este apresentou um desempenho 107% e 80% superior ao ViT e CNN, respectivamente. No dataset HUST-19, o Swin Transformer alcançou a pontuação máxima (1 ou 100%) em todas as métricas e continuou apresentando desempenho notável nos outros datasets. Em comparação com o estado da arte, os resultados revelam uma performance promissora e altamente competitiva para o Swin Transformer. Além disso, foi realizado testes estatísticos que demonstraram, em vários casos, que há diferenças estatisticamente significativas nas métricas obtidas pelo Swin Transformer quando comparadas com o CNN e ViT.
Abstract: According to data from the World Health Organization (WHO), since the beginning of 2020, the COVID-19 pandemic has infected over 770.56 million people worldwide. Of those infected, more than 6.95 million individuals have lost their lives. COVID-19 is an extremely contagious disease and can swiftly overwhelm healthcare systems if infections are not diagnosed, and if isolation measures and treatment for deteriorating conditions are not promptly implemented. The primary screening test used to diagnose COVID-19 has been the Real Time Reverse Transcription-Polymerase Chain Reaction (RT-PCR). Although it is accurate and reliable, it takes a significant amount of time to deliver a definitive diagnosis. Since the onset of the pandemic, several researchers have demonstrated the feasibility of employing various Deep Learning (DL) techniques based on Convolutional Neural Networks (CNN), which have shown promising performance in diagnosing COVID-19 from X-rays and CT scans. However, some authors argue that existing DL methods, based on CNN, are being challenged by newer DL architectures and models. Motivated by this, in this study, we propose the use of the Swin Transformer (instead of CNN) for COVID-19 screening using X-ray images from four original datasets: COVID-QU-Ext Dataset, SARS-COV2-CT Dataset, HUST-19, and HCV-UFPR-COVID-19. These datasets were merged using different strategies, resulting in a total of 9 distinct datasets. We employed transfer learning to address the issue of data scarcity. Moreover, we assessed whether the models have a high generalization capability, based on the learned features, allowing training on one dataset, and testing on another, aiming to evaluate if there are significant losses in the metric values obtained. Upon analyzing the cumulative results from experiments across all datasets and strategies, the Swin Transformer stands out. In terms of sensitivity/recall, it performed 107% and 80% better than ViT and CNN, respectively. In the HUST-19 dataset, the Swin Transformer achieved the maximum score (1 or 100%) for all metrics and continued to show notable performance in other datasets. Compared to the state of the art, the results reveal a promising and highly competitive performance for the Swin Transformer. Additionally, statistical tests were conducted which showed, in several instances, that there are statistically significant differences in the metrics obtained by the Swin Transformer when compared to CNN and ViT.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/32649
Aparece nas coleções:CT - Programa de Pós-Graduação em Computação Aplicada

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
swintransformerimagensradiograficas.pdf5,86 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons