Aprendizado auto-supervisionado para reconhecimento de cenas em imagens de abuso sexual infantil
Date
2022Author
Valois, Pedro Henrique Vaz
Avila, Sandra Eliza Fontes de
Santos, Jefersson Alex dos
Metadata
Show full item recordAbstract
O crime no século 21 é dividido em dois mundos. O mundo virtual se transformou em uma ameaça global para o bem-estar e a segurança das pessoas em várias nações do mundo. Os desafios que apresenta devem ser enfrentados com uma cooperação global unificada e devem contar mais do que nunca em ferramentas automatizadas, porém confiáveis, se quisermos combater a crescente dos crimes online. Mais de 10 milhões de denúncias de abuso sexual infantil são enviadas ao Centro Nacional para Crianças Desaparecidas & Exploradas todos os anos, com mais de 80% dessas de natureza primariamente virtual. Centros de investigação e instituições de acolhimento são, portanto, incapazes de processar e investigar manualmente todas as imagens com a precisão necessária. Diante disso, há a necessidade de ferramentas automatizadas confiáveis que possam trabalhar esse tipo de material com segurança e eficiência é primordial. Particularmente, o reconhecimento de cenas é a tarefa de entender os contextos do ambiente a partir de qualquer tipo de imagem. Essa tarefa é considerada útil para agrupar e classificar dados de abuso sem usar modelos treinados nela. A escassez e as limitações envolvidas no trabalho com imagens de abuso sexual infantil levam ao uso do aprendizado autossupervisionado, uma nova metodologia de aprendizado de máquina que aproveita dados não rotulados para produzir representações robustas capazes de ser mais facilmente transferidas para tarefas de destino. Esta dissertação de Mestrado desenvolveu modelos de aprendizado profundo autossupervisionados pré-treinados em dados focados em cenas com 71,6% de acurácia balanceada em nossa tarefa de classificação de cenas de ambientes internos e, em média, 2,2 pontos percentuais de desempenho melhor do que uma versão totalmente supervisionada. Cooperamos com especialistas da Polícia Federal para avaliar nosso modelo em material de abuso sexual infantil e encontramos 36,7% de acurácia balanceada na classificação de cenas, mostrando que há uma lacuna entre a maneira como os ambientes são representados no conjuntos mais populares de classificação de ambientes e em material sensível.
