Deep learning methods for detecting anomalies in videos: theoretical and methodological contributions

Ribeiro, Manassés

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/3172

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	Ribeiro, Manassés	-
dc.date.accessioned	2018-05-21T19:37:23Z	-
dc.date.available	2018-05-21T19:37:23Z	-
dc.date.issued	2018-03-05	-
dc.identifier.citation	RIBEIRO, Manassés. Deep learning methods for detecting anomalies in videos: theoretical and methodological contributions. 2018. 120 f. Tese (Doutorado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2018.	pt_BR
dc.identifier.uri	http://repositorio.utfpr.edu.br/jspui/handle/1/3172	-
dc.description.abstract	The anomaly detection in automated video surveillance is a recurrent topic in recent computer vision research. Deep Learning (DL) methods have achieved the state-of-the-art performance for pattern recognition in images and the Convolutional Autoencoder (CAE) is one of the most frequently used approach, which is capable of capturing the 2D structure of objects. In this work, anomaly detection refers to the problem of finding patterns in images and videos that do not belong to the expected normal concept. Aiming at classifying anomalies adequately, methods for learning relevant representations were verified. For this reason, both the capability of the model for learning automatically features and the effect of fusing hand-crafted features together with raw data were studied. Indeed, for real-world problems, the representation of the normal class is an important issue for detecting anomalies, in which one or more clusters can describe different aspects of normality. For classification purposes, these clusters must be as compact (dense) as possible. This thesis proposes the use of CAE as a data-driven approach in the context of anomaly detection problems. Methods for feature learning using as input both hand-crafted features and raw data were proposed, and how they affect the classification performance was investigated. This work also introduces a hybrid approach using DL and one-class support vector machine methods, named Convolutional Autoencoder with Compact Embedding (CAE-CE), for enhancing the compactness of normal clusters. Besides, a novel sensitivity-based stop criterion was proposed, and its suitability for anomaly detection problems was assessed. The proposed methods were evaluated using publicly available datasets and compared with the state-of-the-art approaches. Two novel benchmarks, designed for video anomaly detection in highways were introduced. CAE was shown to be promising as a data-driven approach for detecting anomalies in videos. Results suggest that the CAE can learn spatio-temporal features automatically, and the aggregation of hand-crafted features seems to be valuable for some datasets. Also, overall results suggest that the enhanced compactness introduced by the CAE-CE improved the classification performance for most cases, and the stop criterion based on the sensitivity is a novel approach that seems to be an interesting alternative. Videos were qualitatively analyzed at the visual level, indicating that features learned using both methods (CAE and CAE-CE) are closely correlated to the anomalous events occurring in the frames. In fact, there is much yet to be done towards a more general and formal definition of normality/abnormality, so as to support researchers to devise efficient computational methods to mimetize the semantic interpretation of visual scenes by humans.	pt_BR
dc.description.sponsorship	Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Tecnológica Federal do Paraná	pt_BR
dc.rights	openAccess	pt_BR
dc.subject	Aprendizado do computador	pt_BR
dc.subject	Redes neurais (Computação)	pt_BR
dc.subject	Códigos corretores de erros (Teoria da informação)	pt_BR
dc.subject	Convoluções (Matemática)	pt_BR
dc.subject	Processamento de imagens - Técnicas digitais	pt_BR
dc.subject	Sistemas de reconhecimento de padrões	pt_BR
dc.subject	Visão por computador	pt_BR
dc.subject	Métodos de simulação	pt_BR
dc.subject	Engenharia elétrica	pt_BR
dc.subject	Machine learning	pt_BR
dc.subject	Neural networks (Computer science)	pt_BR
dc.subject	Error-correcting codes (Information theory)	pt_BR
dc.subject	Convolutions (Mathematics)	pt_BR
dc.subject	Image processing - Digital techniques	pt_BR
dc.subject	Pattern recognition systems	pt_BR
dc.subject	Computer vision	pt_BR
dc.subject	Simulation methods	pt_BR
dc.subject	Electric engineering	pt_BR
dc.title	Deep learning methods for detecting anomalies in videos: theoretical and methodological contributions	pt_BR
dc.title.alternative	Métodos de deep learning para a detecção de anomalias em vídeos: contribuições teóricas e metodológicas	pt_BR
dc.type	doctoralThesis	pt_BR
dc.description.resumo	A detecção de anomalias em vídeos de vigilância é um tema de pesquisa recorrente em visão computacional. Os métodos de aprendizagem profunda têm alcançado o estado da arte para o reconhecimento de padrões em imagens e o Autocodificador Convolucional (ACC) é uma das abordagens mais utilizadas por sua capacidade em capturar as estruturas 2D dos objetos. Neste trabalho, a detecção de anomalias se refere ao problema de encontrar padrões em vídeos que não pertencem a um conceito normal esperado. Com o objetivo de classificar anomalias adequadamente, foram verificadas formas de aprender representações relevantes para essa tarefa. Por esse motivo, estudos tanto da capacidade do modelo em aprender características automaticamente quanto do efeito da fusão de características extraídas manualmente foram realizados. Para problemas de detecção de anomalias do mundo real, a representação da classe normal é uma questão importante, sendo que um ou mais agrupamentos podem descrever diferentes aspectos de normalidade. Para fins de classificação, esses agrupamentos devem ser tão compactos (densos) quanto possível. Esta tese propõe o uso do ACC como uma abordagem orientada a dados aplicada ao contexto de detecção de anomalias em vídeos. Foram propostos métodos para o aprendizado de características espaço-temporais, bem como foi introduzida uma abordagem híbrida chamada Autocodificador Convolucional com Incorporação Compacta (ACC-IC), cujo objetivo é melhorar a compactação dos agrupamentos normais. Além disso, foi proposto um novo critério de parada baseado na sensibilidade e sua adequação para problemas de detecção de anomalias foi verificada. Todos os métodos propostos foram avaliados em conjuntos de dados disponíveis publicamente e comparados com abordagens estado da arte. Além do mais, foram introduzidos dois novos conjuntos de dados projetados para detecção de anomalias em vídeos de vigilância em rodovias. O ACC se mostrou promissor na detecção de anomalias em vídeos. Resultados sugerem que o ACC pode aprender características espaço-temporais automaticamente e a agregação de características extraídas manualmente parece ser valiosa para alguns conjuntos de dados. A compactação introduzida pelo ACC-IC melhorou o desempenho de classificação para a maioria dos casos e o critério de parada baseado na sensibilidade é uma nova abordagem que parece ser uma alternativa interessante. Os vídeos foram analisados qualitativamente de maneira visual, indicando que as características aprendidas com os dois métodos (ACC e ACC-IC) estão intimamente correlacionadas com os eventos anormais que ocorrem em seus quadros. De fato, ainda há muito a ser feito para uma definição mais geral e formal de normalidade, de modo que se possa ajudar pesquisadores a desenvolver métodos computacionais eficientes para a interpretação dos vídeos.	pt_BR
dc.degree.local	Curitiba	pt_BR
dc.publisher.local	Curitiba	pt_BR
dc.creator.Lattes	http://lattes.cnpq.br/6475893755893056	pt_BR
dc.contributor.advisor1	Lopes, Heitor Silvério	-
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/4045818083957064	pt_BR
dc.contributor.advisor-co1	Lazzaretti, André Eugênio	-
dc.contributor.advisor-co1Lattes	http://lattes.cnpq.br/7649611874688878	pt_BR
dc.contributor.referee1	Lopes, Heitor Silvério	-
dc.contributor.referee2	Comunello, Eros	-
dc.contributor.referee3	Thomaz, Carlos Eduardo	-
dc.contributor.referee4	Oliveira, Luiz Eduardo Soares de	-
dc.contributor.referee5	Neto, Hugo Vieira	-
dc.publisher.country	Brasil	pt_BR
dc.publisher.program	Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial	pt_BR
dc.publisher.initials	UTFPR	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO	pt_BR
dc.subject.capes	Engenharia Elétrica	pt_BR
Aparece nas coleções:	CT - Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
CT_CPGEI_D_ Ribeiro, Manassés_2018.pdf		13,54 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Recomendar este item Visualizar estatísticas