Detecção de edições em áudios baseada na análise tempo-frequência e em redes neurais convolucionais

Cordeiro Junior, Marcos

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/33191

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	Cordeiro Junior, Marcos	-
dc.date.accessioned	2024-01-16T17:02:24Z	-
dc.date.available	2024-01-16T17:02:24Z	-
dc.date.issued	2023-11-28	-
dc.identifier.citation	CORDEIRO JUNIOR, Marcos. Detecção de edições em áudios baseada na análise tempo-frequência e em redes neurais convolucionais. 2024. Dissertação (Mestrado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2023.	pt_BR
dc.identifier.uri	http://repositorio.utfpr.edu.br/jspui/handle/1/33191	-
dc.description.abstract	Tampering detection is one of the most important topics in forensic analysis of digital audio. Splicing corresponds to the insertion of a segment of signal from a different audio into the original audio record and is included among the most common categories of tampering. Convolutional neural networks (CNNs) have demonstrated effectiveness in various audio processing tasks, which motivates research into different methods of obtaining input data. The spectrogram is a useful representation for visualizing the temporal evolution of the frequency spectrum of an audio, with different signal processing techniques available for its generation. In this study, the development of an automatic splicing detection model in digital audio using CNNs was carried out. The audio spectrogram, computed using different techniques such as Short-Time Fourier Transform (STFT) on a linear scale, STFT on a mel scale, and Constant Q Transform (CQT), was directly provided to the network as input data. A comparative study was conducted to evaluate the impact of the choice of time-frequency representation on the model’s performance in correctly classifying the original and edited audios.	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Tecnológica Federal do Paraná	pt_BR
dc.rights	openAccess	pt_BR
dc.rights.uri	http://creativecommons.org/licenses/by/4.0/	pt_BR
dc.subject	Editor de audio digital	pt_BR
dc.subject	Som - Registro e reprodução - Técnicas digitais	pt_BR
dc.subject	Processamento de sinais	pt_BR
dc.subject	Aprendizado do computador	pt_BR
dc.subject	Aprendizado profundo (Aprendizado do computador)	pt_BR
dc.subject	Redes neurais (Computação)	pt_BR
dc.subject	Digital audio editors	pt_BR
dc.subject	Sound - Recording and reproducing - Digital techniques	pt_BR
dc.subject	Signal processing	pt_BR
dc.subject	Machine learning	pt_BR
dc.subject	Deep learning (Machine learning)	pt_BR
dc.subject	Neural networks (Computer science)	pt_BR
dc.title	Detecção de edições em áudios baseada na análise tempo-frequência e em redes neurais convolucionais	pt_BR
dc.title.alternative	Audio tampering detection based on time-frequency analysis and convolutional neural networks	pt_BR
dc.type	masterThesis	pt_BR
dc.description.resumo	A detecção de edições é um dos mais importantes tópicos na análise forense de áudios digitais. A interpolação (splicing), caracterizada pela inserção de um trecho de sinal proveniente de um áudio distinto no registro de áudio original, é incluída entre as categorias mais recorrentes de adulterações. As redes neurais convolucionais (CNNs) têm demonstrado eficácia em diversas tarefas de processamento de áudio, o que motiva a pesquisa por diferentes formas de obtenção dos dados de entrada. O espectrograma é uma representação útil para a visualização da evolução temporal do espectro de frequências de um áudio, sendo que diferentes técnicas de processamento de sinais podem ser utilizadas para a sua obtenção. No presente trabalho, foi realizado o desenvolvimento de um modelo de detecção automática de interpolação em áudios digitais com o uso de CNNs. O espectrograma dos áudios, calculado através de diferentes técnicas: transformada de Fourier de tempo curto (STFT) na escala linear, STFT na escala mel e transformada Q constante (CQT), foi diretamente fornecido à rede como dado de entrada. Um estudo comparativo foi conduzido avaliando o impacto da escolha da representação no domínio tempo-frequência no desempenho do modelo em classificar corretamente os áudios originais e editados.	pt_BR
dc.degree.local	Curitiba	pt_BR
dc.publisher.local	Curitiba	pt_BR
dc.creator.ID	https://orcid.org/0009-0002-7653-8504	pt_BR
dc.creator.Lattes	http://lattes.cnpq.br/2059720140413118	pt_BR
dc.contributor.advisor1	Pipa, Daniel Rodrigues	-
dc.contributor.advisor1ID	https://orcid.org/0000-0002-9398-332X	pt_BR
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/5604517186200940	pt_BR
dc.contributor.referee1	Lazzaretti, André Eugênio	-
dc.contributor.referee1ID	https://orcid.org/0000-0003-1861-3369	pt_BR
dc.contributor.referee1Lattes	http://lattes.cnpq.br/7649611874688878	pt_BR
dc.contributor.referee2	Pipa, Daniel Rodrigues	-
dc.contributor.referee2ID	https://orcid.org/0000-0002-9398-332X	pt_BR
dc.contributor.referee2Lattes	http://lattes.cnpq.br/5604517186200940	pt_BR
dc.contributor.referee3	Biscainho, Luiz Wagner Pereira	-
dc.contributor.referee3ID	https://orcid.org/0000-0003-2959-6963	pt_BR
dc.contributor.referee3Lattes	http://lattes.cnpq.br/1765239890846505	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.program	Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial	pt_BR
dc.publisher.initials	UTFPR	pt_BR
dc.subject.cnpq	CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA	pt_BR
dc.subject.capes	Engenharia Elétrica	pt_BR
Aparece nas coleções:	CT - Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
deteccaoedicoesaudios.pdf		8,74 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Recomendar este item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons