Sintetização de rostos humanos por modelos probabilísticos de difusão

Schlogl, Ronaldo Gabriel Manzano

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/39226

Título:	Sintetização de rostos humanos por modelos probabilísticos de difusão
Título(s) alternativo(s):	Human face synthesizing via probabilistic diffusion models
Autor(es):	Schlogl, Ronaldo Gabriel Manzano
Orientador(es):	Jeronymo, Daniel Cavalcanti
Palavras-chave:	Difusão Aprendizado do computador Visão por computador Diffusion Machine learning Computer vision
Data do documento:	4-Jul-2025
Editor:	Universidade Tecnológica Federal do Paraná
Câmpus:	Toledo
Citação:	SCHLOGL, Ronaldo Gabriel Manzano. Sintetização de rostos humanos por modelos probabilísticos de difusão. 2025. Trabalho de Conclusão de Curso (Engenharia da Computação) - Universidade Tecnológica Federal do Paraná, Toledo, 2025.
Resumo:	A síntese de rostos humanos é uma área de pesquisa que busca gerar imagens realistas de faces por meio de técnicas computacionais. Este trabalho investiga o uso de modelos probabilísticos de difusão para essa finalidade, baseando-se em um processo iterativo que parte de uma imagem composta por ruído e a transforma gradualmente em uma representação visual coerente. Essa transformação é guiada por um mapeamento entre um espaço latente de baixa dimensão e o espaço de imagem, permitindo que o modelo aprenda a capturar a variabilidade e a complexidade das feições humanas a partir de dados reais. Durante o treinamento, foram geradas amostras visuais ao longo das épocas, possibilitando observar a evolução qualitativa do modelo. Inicialmente, as imagens apresentavam apenas ruído, mas com o avanço do aprendizado, surgiram contornos faciais cada vez mais definidos, culminando em rostos com alto grau de realismo. Esse comportamento evidencia a capacidade progressiva do modelo em reconstruir detalhes estruturais e faciais plausíveis. Os resultados obtidos demonstram que modelos de difusão são uma abordagem eficaz para a geração sintética de rostos humanos, destacando-se pela estabilidade no processo de treinamento e pela qualidade perceptiva das amostras. Como contribuição, este trabalho oferece uma análise visual do processo de geração, ilustrando a melhoria contínua das imagens ao longo do tempo e reforçando o potencial desses modelos em aplicações relacionadas à síntese de faces.
Abstract:	Human face synthesis is a research area that aims to generate realistic facial images through computational methods. This work explores the use of probabilistic diffusion models for this purpose, relying on an iterative process that starts from a noise-filled image and gradually transforms it into a coherent visual representation. This transformation is guided by a mapping from a low-dimensional latent space to the image space, enabling the model to learn and capture the variability and complexity of human facial features from real data. Throughout the training process, visual samples were generated at different stages, allowing for qualitative observation of the model’s progression. Initially, the generated images resembled pure noise; however, as training advanced, facial contours and details began to emerge, eventually resulting in faces with a high degree of realism. This progression highlights the model’s capacity to reconstruct structured and plausible facial features over time. The results demonstrate that diffusion models are an effective approach for synthetic face generation, showing both training stability and perceptual quality in the produced samples. As a contribution, this study offers a visual analysis of the generative process, illustrating the continuous improvement of image quality during training and reinforcing the potential of diffusion models in facial synthesis applications.
URI:	http://repositorio.utfpr.edu.br/jspui/handle/1/39226
Aparece nas coleções:	TD - Engenharia de Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
sintetizacaorostoshumanosprobabilisticos.pdf		7,97 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons