O que é mineração de dados (Data Mining)?
Data Mining ou “mineração de dados”
Após a primeira parte da coleta e armazenamento dos dados, é o momento de olhar para o que foi coletado e definir o que irá ou não entrar na pesquisa e/ou na apresentação. O processo de obter os dados e “minerá-los” é comumente chamado de Data mining e seu sentido original refere-se à forma de coleta de grandes dados, que passam pela extração, armazenamento, análise e estatística.
Análise quantitativa
É durante o processo de Data Mining que ocorre a análise quantitativa. Este processo pode ser dividido em dois tipos. Um é a observação do “discret data”, com pequenas segmentações, cujo resultado é mais especializado; o outro tipo é “continuous data”, cuja análise é contínua e os dados analisados tornam-se informação acionável. É o momento de observar cada número, relevar a sua importância e começar, de fato, a analisar.
O Data Mining é fundamental pois atua no processo quantitativo que vai gerar conhecimento, a chamada análise quantitativa: interpretações e novos caminhos a partir de um aglomerado de números.
A partir daí os dados “saem para o mundo”. E é aí que entra a performance e o planejamento, o monitoramento e a mensuração; o entendimento da organização de grafos (social network analysis); regras e responsabilidades e, ao final, os relatórios de performance.
Por último, e talvez o maior desafio na produção da análise dos dados, está gerar a inteligência, ou o Business Intelligence. Ele é composto dos goals x objetivos.
Aplicação de Data Mining ou mineração de dados
Durante a aplicação de Data Mining, nem todos os dados coletados podem ganhar uma utilização, mas ainda assim fazem parte da pesquisa e são relevantes. Sua aplicação imediata não é o fator mais importante para deletar. Considerando que nem sempre os meios de obter as informações são baratos e muito menos rápidos, isso toma ainda mais importância. Durante a análise é comum que queiramos nos livrar de abas do Excel ou algum dado extra. Mas…
“Os dados armazenados são como as roupas em um armário; mesmo que não acessemos em dois anos, ainda não devemos jogá-los fora – e assim vale a pena lembrar durante formulação uma estratégia de dados”. (Mike Schiff)