Learning and transfer of feature extractors for automatic anomaly detection in surveillance videos

Gutoski, Matheus

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/3171

Título:	Learning and transfer of feature extractors for automatic anomaly detection in surveillance videos
Título(s) alternativo(s):	Aprendizagem e transferência de extratores de características para detecção automática de anomalias em vídeos de segurança
Autor(es):	Gutoski, Matheus
Orientador(es):	Lopes, Heitor Silvério
Palavras-chave:	Computadores - Medidas de segurança Aprendizado do computador Videovigilância Sistemas de reconhecimento de padrões Visão por computador Métodos de simulação Computer security Machine learning Video surveillance Pattern recognition systems Computer vision Simulation methods
Data do documento:	3-Abr-2018
Editor:	Universidade Tecnológica Federal do Paraná
Câmpus:	Curitiba
Citação:	GUTOSKI, Matheus. Learning and transfer of feature extractors for automatic anomaly detection in surveillance videos. 2018. 82 f. Dissertação (Mestrado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2018.
Resumo:	A vigilância automática de vı́deos de segurança está se tornando um tema de grande importância no mundo atual. A quantidade de câmeras de vigilância em locais públicos e privados supera amplamente o número de humanos disponı́veis para executar a tarefa de observação. Isto reduz a eficácia das câmeras, uma vez que as imagens de segurança geralmente são utilizadas após o ocorrido, em vez de permitir ações corretivas rápidas com base na detecção de eventos em tempo real. No entanto, a tarefa de conceber sistemas robustos de vigilância automática é bastante árdua. Este alto grau de dificuldade está associado ao problema da construção de modelos capazes de compreender a semântica humana. Os seres humanos têm a capacidade inata de observar um evento em andamento e julgar suas implicações, o que leva à tomada de decisões. Simular este entendimento em uma máquina, mesmo em um nı́vel simplificado, tornou-se um verdadeiro desafio na pesquisa recente. Visão Computacional, Aprendizagem de Máquina e Aprendizagem Profunda são áreas de estudo relacionadas à esta questão. Juntas, estas áreas alcançaram recentemente resultados impressionantes em uma ampla gama de tarefas relacionadas à visão, e fornecem métodos e ferramentas que podem ser usados para o problema de vigilância automática de vı́deos de segurança. Neste trabalho, o problema da vigilância automática é abordado a partir de uma perspectiva de detecção de anomalias. Para isto, um modelo de normalidade é aprendido a partir de vı́deos previamente rotulados como normais por observadores humanos. Este modelo é então usando para detectar anomalias. Para alcançar este objetivo, a tarefa é dividida em duas subtarefas principais: extração de caracterı́sticas e classificação. As contribuições deste trabalho estão principalmente relacionadas ao processo de extração de caracterı́sticas, onde foram propostos dois métodos baseados em Aprendizagem Profunda. O primeiro método baseia-se na transferência de conhecimento de uma tarefa completamente independente para a detecção de anomalias em vı́deos de segurança. A ideia é investigar a extensão da capacidade de generalização de um modelo, usando-o para executar uma tarefa completamente nova e inesperada. O segundo método é baseado em aprender um extrator de caracterı́sticas que extrai representações compactas dos vı́deos de segurança. Este método foi investigado sob a hipótese de que a criação de grupos compactos no espaço de caracterı́sticas pode levar a um maior desempenho de classificação. A classificação é realizada por Máquinas de Vetores Suporte de uma classe em ambos os métodos. Os resultados mostram que o primeiro método apresentou desempenho semelhante aos métodos considerados estado da arte, o que leva à conclusão de que a capacidade de generalização de alguns modelos de Aprendizagem Profunda pode ser estendida para diferentes tarefas. Os resultados usando o segundo método corroboraram com a hipótese de compacidade, onde um ganho no desempenho da classificação foi obtido após tornar as representações compactas. Em geral, é possı́vel concluir que ambos os métodos se mostram promissores para melhorar o processo de extração de caracterı́sticas e podem ser importantes contribuições para sistemas robustos de detecção automática de anomalias em vı́deos de segurança.
Abstract:	Automatic video surveillance is becoming a topic of great importance in the current world. Surveillance cameras in private and public spaces greatly outnumber the humans available for performing the observation task. This hinders the effectiveness of the cameras since the footage is often used much after the event has occurred, rather than allowing for quick corrective action based on real-time detection of events. However, the task of devising robust automatic surveillance systems is a rather difficult one. This high degree of difficulty is associated with the problem of building models able to understand human semantics. Humans have the innate ability to observe an ongoing event and judge its implications, which then leads to decision making. Simulating this understanding in a machine, even to the slightest degree, has become a real challenge in recent research. Computer Vision, Machine Learning, and Deep Learning are fields of study deeply connected to this issue. Together, these fields have recently achieved impressive results across a wide array of vision-related tasks, and provide methods and tools that can be used for the automatic video surveillance problem. In this work, the problem of automatic surveillance is approached from an anomaly detection perspective. It consists of learning a model of normality from videos previously labeled as normal by human observers and then using this model for detecting anomalies. To achieve this goal, the task is divided into two main subtasks: feature extraction and classification. The contributions of this work are mainly related to the feature extraction process, in which two methods based on Deep Learning were proposed. The first method is based on transferring knowledge from a completely unrelated task to video anomaly detection. The idea is to investigate the extent of the generalization capacity of a model, by using it for performing a completely new and unexpected task. The second method is based on learning a feature extractor that extracts compact feature representations from surveillance video datasets. This method was investigated under the hypothesis that creating compact clusters in the feature space may improve the classification performance. Classification is performed by One-Class Support Vector Machines in both methods. Results have shown that the first method had a performance similar to state-of-the-art methods, which leads to the conclusion that the generalization capacity of some Deep Learning models can be extended to different tasks. The results using the second method have corroborated to the compactness hypothesis, in which an increase in classification performance was obtained after introducing compactness. In general, it is possible to conclude that both methods show great promise for enhancing the feature extraction process, and can be valuable contributions towards robust automatic video anomaly detection systems.
URI:	http://repositorio.utfpr.edu.br/jspui/handle/1/3171
Aparece nas coleções:	CT - Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
CT_CPGEI_M_Gutoski, Matheus_2018.pdf		10,21 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas