Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/39226| Título: | Sintetização de rostos humanos por modelos probabilísticos de difusão |
| Título(s) alternativo(s): | Human face synthesizing via probabilistic diffusion models |
| Autor(es): | Schlogl, Ronaldo Gabriel Manzano |
| Orientador(es): | Jeronymo, Daniel Cavalcanti |
| Palavras-chave: | Difusão Aprendizado do computador Visão por computador Diffusion Machine learning Computer vision |
| Data do documento: | 4-Jul-2025 |
| Editor: | Universidade Tecnológica Federal do Paraná |
| Câmpus: | Toledo |
| Citação: | SCHLOGL, Ronaldo Gabriel Manzano. Sintetização de rostos humanos por modelos probabilísticos de difusão. 2025. Trabalho de Conclusão de Curso (Engenharia da Computação) - Universidade Tecnológica Federal do Paraná, Toledo, 2025. |
| Resumo: | A síntese de rostos humanos é uma área de pesquisa que busca gerar imagens realistas de faces por meio de técnicas computacionais. Este trabalho investiga o uso de modelos probabilísticos de difusão para essa finalidade, baseando-se em um processo iterativo que parte de uma imagem composta por ruído e a transforma gradualmente em uma representação visual coerente. Essa transformação é guiada por um mapeamento entre um espaço latente de baixa dimensão e o espaço de imagem, permitindo que o modelo aprenda a capturar a variabilidade e a complexidade das feições humanas a partir de dados reais. Durante o treinamento, foram geradas amostras visuais ao longo das épocas, possibilitando observar a evolução qualitativa do modelo. Inicialmente, as imagens apresentavam apenas ruído, mas com o avanço do aprendizado, surgiram contornos faciais cada vez mais definidos, culminando em rostos com alto grau de realismo. Esse comportamento evidencia a capacidade progressiva do modelo em reconstruir detalhes estruturais e faciais plausíveis. Os resultados obtidos demonstram que modelos de difusão são uma abordagem eficaz para a geração sintética de rostos humanos, destacando-se pela estabilidade no processo de treinamento e pela qualidade perceptiva das amostras. Como contribuição, este trabalho oferece uma análise visual do processo de geração, ilustrando a melhoria contínua das imagens ao longo do tempo e reforçando o potencial desses modelos em aplicações relacionadas à síntese de faces. |
| Abstract: | Human face synthesis is a research area that aims to generate realistic facial images through computational methods. This work explores the use of probabilistic diffusion models for this purpose, relying on an iterative process that starts from a noise-filled image and gradually transforms it into a coherent visual representation. This transformation is guided by a mapping from a low-dimensional latent space to the image space, enabling the model to learn and capture the variability and complexity of human facial features from real data. Throughout the training process, visual samples were generated at different stages, allowing for qualitative observation of the model’s progression. Initially, the generated images resembled pure noise; however, as training advanced, facial contours and details began to emerge, eventually resulting in faces with a high degree of realism. This progression highlights the model’s capacity to reconstruct structured and plausible facial features over time. The results demonstrate that diffusion models are an effective approach for synthetic face generation, showing both training stability and perceptual quality in the produced samples. As a contribution, this study offers a visual analysis of the generative process, illustrating the continuous improvement of image quality during training and reinforcing the potential of diffusion models in facial synthesis applications. |
| URI: | http://repositorio.utfpr.edu.br/jspui/handle/1/39226 |
| Aparece nas coleções: | TD - Engenharia de Computação |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| sintetizacaorostoshumanosprobabilisticos.pdf | 7,97 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons

