skip to main content

Detecção de outliers baseada em caminhada determinística do turista

Rodrigues, Rafael Delalibera

Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto 2018-04-03

Acesso online. A biblioteca também possui exemplares impressos.

  • Título:
    Detecção de outliers baseada em caminhada determinística do turista
  • Autor: Rodrigues, Rafael Delalibera
  • Orientador: Liang, Zhao; Silva Filho, Antonio Carlos Roque da
  • Assuntos: Computação Bioinspirada; Descoberta De Conhecimento; Detecção De Outlier; Mineração De Dados; Reconhecimento De Padrões; Attractor; Critical Memory Size; Crossing-Attractor; Internal Outlier; Memory Size; Outlier; Tourist Walk
  • Notas: Dissertação (Mestrado)
  • Descrição: Detecção de outliers é uma tarefa fundamental para descoberta de conhecimento em mineração de dados. Cujo objetivo é identificar as amostras de dados que desviam acentuadamente dos padrões apresentados num conjunto de dados. Neste trabalho, apresentamos uma nova técnica de detecção de outliers baseada em caminhada determinística do turista. Especificamente um caminhante é iniciado para cada exemplar de dado, variando-se o tamanho da memória, assim, um exemplar recebe uma alta pontuação de outlier ao participar em poucos atratores, enquanto que receberá uma baixa pontuação no caso de participar numa grande quantidade de atratores. Os resultados experimentais em cenários artificiais e reais evidenciaram um bom desempenho do método proposto. Em comparação com os métodos clássicos, o método proposto apresenta as seguintes características salientes: 1) Identifica os outliers através da determinação de estruturas no espaço de dados ao invés de considerar apenas características físicas, como distância, similaridade e densidade. 2) É capaz de detectar outliers internos, situados em regiões entre dois ou mais agrupamentos. 3) Com a variação do valor de memória, os caminhantes conseguem extrair tanto características locais, quanto globais do conjunto de dados. 4) O método proposto é determinístico, não exigindo diversas execuções (em contraste às técnicas estocásticas). Além disso, neste trabalho caracterizamos, pela primeira vez, que as dinâmicas exibidas pela caminhada do turista podem gerar atratores complexos, com diversos cruzamentos. Sendo que estes podem revelar estruturas ainda mais detalhadas e consequentemente melhorar a detecção dos outliers.
  • DOI: 10.11606/D.59.2018.tde-14062018-223903
  • Editor: Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto
  • Data de criação/publicação: 2018-04-03
  • Formato: Adobe PDF
  • Idioma: Português

Buscando em bases de dados remotas. Favor aguardar.