Uma Análise Comparativa entre Algoritmos de Agrupamentos de Dados
Abstract
A mineração de dados pode ser definida como um conjunto de técnicas automáticas de exploração de grandes volumes de dados, cujo objetivo é permitir a descoberta de novos padrões e relações que não seriam facilmente detectadas pela visão humana. As diversas ferramentas computacionais de análise e processamento de dados permitem analisar grandes volumes de dados em questões de segundos, porém aplicações reais costumam ser bem mais complexas e possuir bases de dados bem mais desafiadoras do que as comumente apresentadas na literatura. Neste contexto, este trabalho tem como objetivo analisar e comparar algoritmos de agrupamento de dados usando as bases de dados da FCPS (Fundamental Clustering Problem Suite) e da ferramenta YADMT (Yet Another Data Mining Tool), que simulam diversas situações presentes em problemas reais. No presente estudo, observou-se que os algoritmos hierárquicos alcançaram uma boa eficácia nas métricas de validação de agrupamento de dados utilizadas.