Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/33191
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.creator | Cordeiro Junior, Marcos | - |
dc.date.accessioned | 2024-01-16T17:02:24Z | - |
dc.date.available | 2024-01-16T17:02:24Z | - |
dc.date.issued | 2023-11-28 | - |
dc.identifier.citation | CORDEIRO JUNIOR, Marcos. Detecção de edições em áudios baseada na análise tempo-frequência e em redes neurais convolucionais. 2024. Dissertação (Mestrado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2023. | pt_BR |
dc.identifier.uri | http://repositorio.utfpr.edu.br/jspui/handle/1/33191 | - |
dc.description.abstract | Tampering detection is one of the most important topics in forensic analysis of digital audio. Splicing corresponds to the insertion of a segment of signal from a different audio into the original audio record and is included among the most common categories of tampering. Convolutional neural networks (CNNs) have demonstrated effectiveness in various audio processing tasks, which motivates research into different methods of obtaining input data. The spectrogram is a useful representation for visualizing the temporal evolution of the frequency spectrum of an audio, with different signal processing techniques available for its generation. In this study, the development of an automatic splicing detection model in digital audio using CNNs was carried out. The audio spectrogram, computed using different techniques such as Short-Time Fourier Transform (STFT) on a linear scale, STFT on a mel scale, and Constant Q Transform (CQT), was directly provided to the network as input data. A comparative study was conducted to evaluate the impact of the choice of time-frequency representation on the model’s performance in correctly classifying the original and edited audios. | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Universidade Tecnológica Federal do Paraná | pt_BR |
dc.rights | openAccess | pt_BR |
dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | pt_BR |
dc.subject | Editor de audio digital | pt_BR |
dc.subject | Som - Registro e reprodução - Técnicas digitais | pt_BR |
dc.subject | Processamento de sinais | pt_BR |
dc.subject | Aprendizado do computador | pt_BR |
dc.subject | Aprendizado profundo (Aprendizado do computador) | pt_BR |
dc.subject | Redes neurais (Computação) | pt_BR |
dc.subject | Digital audio editors | pt_BR |
dc.subject | Sound - Recording and reproducing - Digital techniques | pt_BR |
dc.subject | Signal processing | pt_BR |
dc.subject | Machine learning | pt_BR |
dc.subject | Deep learning (Machine learning) | pt_BR |
dc.subject | Neural networks (Computer science) | pt_BR |
dc.title | Detecção de edições em áudios baseada na análise tempo-frequência e em redes neurais convolucionais | pt_BR |
dc.title.alternative | Audio tampering detection based on time-frequency analysis and convolutional neural networks | pt_BR |
dc.type | masterThesis | pt_BR |
dc.description.resumo | A detecção de edições é um dos mais importantes tópicos na análise forense de áudios digitais. A interpolação (splicing), caracterizada pela inserção de um trecho de sinal proveniente de um áudio distinto no registro de áudio original, é incluída entre as categorias mais recorrentes de adulterações. As redes neurais convolucionais (CNNs) têm demonstrado eficácia em diversas tarefas de processamento de áudio, o que motiva a pesquisa por diferentes formas de obtenção dos dados de entrada. O espectrograma é uma representação útil para a visualização da evolução temporal do espectro de frequências de um áudio, sendo que diferentes técnicas de processamento de sinais podem ser utilizadas para a sua obtenção. No presente trabalho, foi realizado o desenvolvimento de um modelo de detecção automática de interpolação em áudios digitais com o uso de CNNs. O espectrograma dos áudios, calculado através de diferentes técnicas: transformada de Fourier de tempo curto (STFT) na escala linear, STFT na escala mel e transformada Q constante (CQT), foi diretamente fornecido à rede como dado de entrada. Um estudo comparativo foi conduzido avaliando o impacto da escolha da representação no domínio tempo-frequência no desempenho do modelo em classificar corretamente os áudios originais e editados. | pt_BR |
dc.degree.local | Curitiba | pt_BR |
dc.publisher.local | Curitiba | pt_BR |
dc.creator.ID | https://orcid.org/0009-0002-7653-8504 | pt_BR |
dc.creator.Lattes | http://lattes.cnpq.br/2059720140413118 | pt_BR |
dc.contributor.advisor1 | Pipa, Daniel Rodrigues | - |
dc.contributor.advisor1ID | https://orcid.org/0000-0002-9398-332X | pt_BR |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/5604517186200940 | pt_BR |
dc.contributor.referee1 | Lazzaretti, André Eugênio | - |
dc.contributor.referee1ID | https://orcid.org/0000-0003-1861-3369 | pt_BR |
dc.contributor.referee1Lattes | http://lattes.cnpq.br/7649611874688878 | pt_BR |
dc.contributor.referee2 | Pipa, Daniel Rodrigues | - |
dc.contributor.referee2ID | https://orcid.org/0000-0002-9398-332X | pt_BR |
dc.contributor.referee2Lattes | http://lattes.cnpq.br/5604517186200940 | pt_BR |
dc.contributor.referee3 | Biscainho, Luiz Wagner Pereira | - |
dc.contributor.referee3ID | https://orcid.org/0000-0003-2959-6963 | pt_BR |
dc.contributor.referee3Lattes | http://lattes.cnpq.br/1765239890846505 | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.program | Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial | pt_BR |
dc.publisher.initials | UTFPR | pt_BR |
dc.subject.cnpq | CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA | pt_BR |
dc.subject.capes | Engenharia Elétrica | pt_BR |
Aparece nas coleções: | CT - Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
deteccaoedicoesaudios.pdf | 8,74 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons