Otimização do reconhecimento facial em ambiente hospitalar com redes pré-treinadas

Ribeiro, Ana Julia Fonseca

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/39042

Título:	Otimização do reconhecimento facial em ambiente hospitalar com redes pré-treinadas
Título(s) alternativo(s):	Optimization of facial recognition in hospital environments using pre-trained networks
Autor(es):	Ribeiro, Ana Julia Fonseca
Orientador(es):	Aires, Simone Bello Kaminski
Palavras-chave:	Reconhecimento facial (Computação) Hospitais Computadores - Controle de acesso Identificação biométrica Aprendizado do computador Redes neurais (Computação) Human face recognition (Computer science) Hospitals Computers - Acess control Biometric identification Machine learning Neural networks (Computer science)
Data do documento:	31-Out-2025
Editor:	Universidade Tecnológica Federal do Paraná
Câmpus:	Ponta Grossa
Citação:	RIBEIRO, Ana Julia Fonseca. Otimização do reconhecimento facial em ambiente hospitalar com redes pré-treinadas. 2025. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2025.
Resumo:	Reconhecimento Facial tem se consolidado como uma tecnologia robusta e essencial para o controle de acesso e identificação de indivíduos, sendo amplamente aplicada em contextos de segurança e autenticação. No entanto, fatores como variações de iluminação, expressões faciais e ângulos de captura ainda representam desafios relevantes à precisão dos modelos. Para lidar com essas limitações, esta pesquisa propõe uma metodologia baseada em Visão Computacional voltada ao reconhecimento facial em ambiente hospitalar, com o objetivo de validar a execução de atividades pelos profissionais. Inicialmente, a arquitetura MTCNN (Multi-task Cascaded Convolutional Networks) foi utilizada para detecção e alinhamento das faces nas imagens. Em seguida, o modelo FaceNet, acessado por meio da biblioteca DeepFace, foi empregado para a extração dos embeddings faciais, vetores de características que representam a identidade de cada indivíduo em um espaço de 128 dimensões. Esses embeddings, após normalização, serviram como entrada para a análise comparativa de dois classificadores projetados para lidar com dados vetoriais: uma Rede Neural Convolucional Unidimensional (CNN 1D) e um Perceptron Multicamadas (MLP).Os modelos foram treinados sobre um subconjunto do dataset LFW (Labeled Faces in the Wild), aplicando técnicas de regularização, Dropout, EarlyStopping, ReduceLROnPlateau e avaliação por métricas como acurácia, precisão, revocação, F1-score, FAR (False Acceptance Rate) e FRR (False Rejection Rate). O modelo FaceNet + MLP apresentou melhor desempenho geral, atingindo 94,32% de acurácia, 92,24% de balanced accuracy e F1-score de 92,38%, demonstrando elevada capacidade de generalização e baixa taxa de erro. Já o modelo FaceNet + CNN 1D obteve 80,53% de acurácia, com FAR e FRR iguais a 0,1947, indicando desempenho consistente, embora inferior ao MLP, especialmente em classes menos representadas. Apesar de não atingir os resultados de estado da arte reportados para o LFW completo (acima de 99%), os achados deste estudo comprovam a viabilidade da combinação entre FaceNet e classificadores leves, mostrando-se promissora para aplicações em ambientes hospitalares, onde a rastreabilidade e a validação de identidade são essenciais para a segurança e conformidade operacional.
Abstract:	Facial Recognition has established itself as a robust and essential technology for access control and individual identification, being widely applied in security and authentication contexts. However, factors such as variations in lighting, facial expressions, and capture angles still represent relevant challenges to model accuracy. To address these limitations, this research proposes a Computer Vision methodology focused on facial recognition in a hospital setting, with the goal of validating activity execution by healthcare professionals.Initially, the MTCNN (Multi-task Cascaded Convolutional Networks) architecture was utilized for face detection and alignment in the images. Subsequently, the FaceNet model, accessed through the DeepFace library, was employed to extract facial embeddings, which are compact feature vectors that represent the identity of each individual in a 128-dimensional space. These normalized embeddings served as input for the comparative analysis of two classifiers designed to handle vectorial data: a One-Dimensional Convolutional Neural Network (CNN 1D) and a Multi-Layer Perceptron (MLP).The models were trained on a subset of the LFW dataset (Labeled Faces in the Wild), applying regularization techniques, Dropout, EarlyStopping, ReduceLROnPlateau, and evaluation via metrics such as accuracy, precision, recall, F1-score, FAR (False Acceptance Rate), and FRR (False Rejection Rate). The FaceNet + MLP model demonstrated the best overall performance, achieving 94.32% accuracy, 92.24% balanced accuracy, and an F1-score of 92.38%, indicating a high capacity for generalization and a low error rate. In contrast, the FaceNet + CNN 1D model obtained 80.53% accuracy, with FAR and FRR both equal to 0.1947, showing consistent, yet inferior, performance compared to the MLP, especially in underrepresented classes.Despite not reaching the state-of-the-art results reported for the complete LFW (>99%), the findings of this study prove the viability of combining FaceNet with lightweight classifiers. This approach shows promise for applications in hospital environments, where traceability and identity validation are essential for safety and operational compliance.
URI:	http://repositorio.utfpr.edu.br/jspui/handle/1/39042
Aparece nas coleções:	PG - Ciência da Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
otimizacaoreconhecimentofacial.pdf		1,33 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons