Medidas de duração de consoantes oclusivas como vestígios de fala em análise acústico-instrumental forense de amostras com e sem uso de disfarce

Carneiro, Denise de Oliveira

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/1878

Título:	Medidas de duração de consoantes oclusivas como vestígios de fala em análise acústico-instrumental forense de amostras com e sem uso de disfarce
Título(s) alternativo(s):	Stop consonants term measures as remains in forensic acoustic instrumental analysis of disguised and normal speech
Autor(es):	Carneiro, Denise de Oliveira
Orientador(es):	Faria, Rubens Alexandre de
Palavras-chave:	Criminalística Fonética forense Prova pericial Engenharia biomédica Forensic sciences Forensic phonetics Evidence, Expert Biomedical engineering
Data do documento:	24-Ago-2016
Editor:	Universidade Tecnológica Federal do Paraná
Câmpus:	Curitiba
Citação:	CARNEIRO, Denise de Oliveira. Medidas de duração de consoantes oclusivas como vestígios de fala em análise acústico-instrumental forense de amostras com e sem uso de disfarce. 2016. 92 f. Dissertação (Mestrado em Engenharia Biomédica) - Universidade Tecnológica Federal do Paraná, Curitiba, 2016.
Resumo:	A atribuição de autoria a falas provenientes de gravações ambientais e interceptações telefônicas de falas que provêm de crimes como tráfico de drogas, estelionato, sequestro, abuso sexual, pedofilia, e corrupção pode apresentar à perícia vários dificultadores para a obtenção de medidas acústicas. Um desses dificultadores pode ser o disfarce de voz. Com a possibilidade de ter suas vozes gravadas, o disfarce tem se tornado comum entre os perpetradores de crimes. Quando a voz é gravada, poderá servir como prova a partir do exame de comparação de locutor (ECL), que reúne metodologias para determinar se duas amostras de fala provêm do mesmo falante. O ECL é realizado por meio de análise perceptivo-auditiva, acústico-instrumental e de reconhecimento automático. Embora já tenham sido desenvolvidas tecnologias de verificação automática, as análises sem interferência humana não apresentam respaldo suficiente, seja pela má qualidade do sinal ou pela escassez de amostras de fala em banco de dados e, por isso, as pesquisas que ancorem as outras modalidades de análise são essenciais. A análise acústico-instrumental emprega ferramentas computacionais para avaliação quantitativa e qualitativa da fala e a engenharia biomédica possibilita o desenvolvimento de tecnologias para instrumentação da análise do sinal de fala. Em busca de um parâmetro acústico que seja robusto em análises de disfarce de voz, este trabalho utilizou medidas de duração de fases de segmentos, que têm sido pouco exploradas em ECL. As consoantes oclusivas não vozeadas do português brasileiro [p, t, k] são produzidas em três fases distintas: fase de oclusão, fase de soltura e transição formântica. As duas primeiras fases apresentam correlatos acústicos que se destacam na visualização do oscilograma: silêncio relativo e produção de ondas aperiódicas. Nesta pesquisa, foram analisadas instrumentalmente as falas de 20 sujeitos, 10 do sexo masculino e 10 do sexo feminino, com idades entre 25 e 55 anos, durante a leitura, com e sem o uso de disfarce, de um texto que simulava uma situação criminosa. Foram obtidas medidas dos tempos de oclusão e soltura das consoantes não vozeadas e constatou-se que o contexto fonológico posterior influencia o tempo de produção. Verificaram-se medidas diferentes entre a primeira e a segunda leitura com uso do disfarce, indicando que o falante apresentou dificuldade na manutenção do ajuste fonatório e que, embora tenham sido encontradas diferenças entre as medidas obtidas em fala com e sem disfarce, a correlação é forte entre as mesmas. O tempo de oclusão aparentou comportamento menos influenciável pelo uso do disfarce para as sílabas [pi, pu, te, tɛ], enquanto o tempo de soltura demonstrou maior suscetibilidade, exceto em [pi, te]. Os resultados permitem que alguns dos segmentos analisados sejam considerados vestígios de autoria dentro de um conjunto probatório.
Abstract:	Authorship attribution of speech, from environmental recordings and telephone interceptions, which can be evidence of crimes related to drug dealing, racketeering, kidnapping, sexual abuse, pedophilia, and corruption, may present difficulties to experts in obtaining acoustic measures. One of these difficulties may be the use of disguise. With the possibility of being recorded, voice disguise has become common among crime perpetrators. When a voice is recorded, it can be an evidence after speaker comparison examination (SCE), which adopts methodologies to determine whether two speech samples have been produced by the same speaker. SCE can be perceptual, acoustic-instrumental and through automatic recognition. Although automatic recognition technologies have already been developed, analyses without human interference do not have enough support, both for poor signal quality or for lack of speech samples. Therefore, research that is anchored in other analysis methods are essential. Acoustic-instrumental analyses use computational tools for quantitative and qualitative evaluation of speech, and biomedical engineering enables the development of technologies and instrumentation for speech signal analyses. In search of an acoustic parameter that is robust in disguise analyses, this research used segment phase measurements, which have been little explored in SCE. Brazilian Portuguese voiceless stops [p, t, k] are produced in three distinct phases: occlusion phase, release phase and formant transition. The first two phases have acoustic correlates that are visually distinct in the oscillogram: relative silence and aperiodic wave production. In this research, the speech of 20 subjects were instrumentally analyzed, 10 males and 10 females, aged between 25 and 55 years, while reading, with and without the use of disguise, a text that simulated a criminal situation. Occlusion and release duration of the voiceless stop consonants were measured and it was found that the phonological context influences the production time. Different measures were found between the first and the second reading with disguised voice, indicating that the speaker had difficulty in maintaining the phonation setting, and that, although there were differences between the measures in speech with and without disguise, the correlation between them was strong. Occlusion time appeared to be less influenced by the use of disguise for the syllables [pi, pu, te, tɛ], while the release time showed greater susceptibility, except for [pi, te]. The results allow that some of the segments analyzed be considered vestiges of authorship within a body of evidence.
URI:	http://repositorio.utfpr.edu.br/jspui/handle/1/1878
Aparece nas coleções:	CT - Programa de Pós-Graduação em Engenharia Biomédica

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
CT_PPGEB_M_Carneiro, Denise de Oliveira_2016.pdf		5,6 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas