Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/30002
Título: Análise de interpretabilidade em modelo profundo para detecção de insuficiência respiratória: um estudo de caso para a COVID­-19
Título(s) alternativo(s): Interpretability analysis in deep model for detection of respiratory failure: a case study for COVID-19
Autor(es): Silva, Daniel Peixoto Pinto da
Orientador(es): Candido Junior, Arnaldo
Palavras-chave: Inteligência artificial
Redes neurais (Computação)
Aprendizado do computador
Artificial intelligence
Neural networks (Computer science)
Machine learning
Data do documento: 6-Dez-2021
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Medianeira
Citação: SILVA, Daniel Peixoto Pinto da. Análise de interpretabilidade em modelo profundo para detecção de insuficiência respiratória: um estudo de caso para a COVID­-19. 2021. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Medianeira, 2021.
Resumo: A COVID-19 é uma doença que afetou todo o mundo, sendo declarada uma pandemia pela Organização Mundia da Saúde. Todos os métodos criados para a detecção dessa doença são custosos e requerem que o paciente esteja em condições específicas pra que o diagnostico seja correto. Assim, neste trabalho analisou-se o estado da arte em detecção de insuficiência respiratória decorrente de COVID-19 por ANNs para verificar vieses e trazer explicações sobre o resultado da classificação dessa ANN. Para isso foi feito teste de ablação ao incluir novas informações como entrada ao modelo, utilizou¬se o algoritmo Grad-CAM para ressaltar qual partes do dado alimentado à ANN são mais importantes. Também, foram sintetizados áudios do produto entre um áudio original e o mapa de calor do Grad-CAM para permitir a análise sonora dos resultados. Além disso foi treinado uma PANN e também se treinou a SpiraNet com as técnicas Mixup e SpecAugment para tentar superar o estado da art. Os resultados do teste de ablação mostraram uma grande importância da frequência fundamental da voz e do espectrograma de mel. Já os áudios sintetizados mostraram que silabas tônicas e palavras prolongadas são importantes para a classificação de pacientes neste trabalho. O experimento com aumento de dados não obteve resultados significativos. E por fim, foi superado o estado da arte com a PANN treinada obtendo uma acurácia de 94,44%.
Abstract: COVID-19 is a disease that has affected the whole world, being declared a pandemic by the World Health Organization. All methods created to detect this disease are costly and human, which is available in specific conditions so that the diagnosis is correct. Thus, in this work, the state of the art in detecting respiratory failure due to COVID-19 by ANNs was analyzed to verify biases and provide explanations about the result of the classification of this ANN. For this, an ablation test was performed, including new information as input to the model, the Grad-CAM algorithm was used to highlight which parts of the data fed to the ANN are more important. Also, audios of the product between an original audio and the Grad-CAM heat map were synthesized to allow a sound analysis of the results. In addition, a PANN was trained and also Mixup and SpecAugment techniques were used on training of SpiraNet to overcome the state of art. The results of the ablation test showed a great importance of the fundamental frequency of the voice and the melspectrogram. The synthesized audios showed that stressed syllables and prolonged words are important for the classification of patients in this work. The data augmentation experiment did not obtain significant results. And finally, the state of the art was surpassed with the trained PANN obtaining an accuracy of 94,44%.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/30002
Aparece nas coleções:MD - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
analiseinterpretabilidademodeloprofundo.pdf4,02 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons