Arquivo da categoria: Data Analysis

Data Strategy | Data Analysis

* Este artigo faz parte de uma série de conceitos sobre dados.

Depois de cuidar dos dados, o próximo passo estratégico é a chamada “data analysis”, que consiste, assim como o nome mesmo já diz, na análise dos dados. É por meio dela que vamos gerar informação, conhecimento e, por fim, a sabedoria, também chamada de insights. 

Esses conceitos parecem, à primeira vista, a mesma coisa. E é comum confundirmos. Mas, como diria a música…

“Information is not knowledge (informação não é conhecimento)
Knowledge is not wisdom (conhecimento não é sabedoria)
Wisdom is not truth (sabedoria não é a verdade)
Truth is not beauty (verdade não é beleza)
Beauty is not love (beleza não é amor)
Love is not music (amor não é música)
Music is THE BEST (música é o melhor)”

(Frank Zappa)

 Para melhorar um pouco, se formos dividir em etapas, encontramos a chamada Pirâmide do Conhecimento, cujo caminho que mostra como os dados viram informação. A pirâmide é representada pelo DIKW, Data-Information-Knowledge-Wisdow, baseado no modelo cartesiano (criado com base nos princípios do filósofo Descartes), que consiste em uma evolução de [d]ata (dados), [in]formation (informação), [k]nowledge (conhecimento) e [w]isdom (sabedoria). Esse modelo, hoje em dia, é utilizado para várias áreas, que incluem pesquisas em tecnologia da informação até o marketing:

Pirâmide do Conhecimento ou DIKW

Dados ➳ elementos

Sinais, símbolos, um aglomerado de números sem significados. É aquilo que foi coletado.

Exemplo: dados brutos em um arquivo de Excel, o formato, a data, a hora, o tempo da coleta.

 

Informação ➳ organização

Informações são os dados estruturados.

Exemplo: um Excel com dados tabulados, divididos por categorias de sentimento, tags do monitoramento e por rede social.

 

Conhecimento ➳ contexto

Surge quando a informação ganha uso e significado, é sintetizado e pode ser aprendido.

Exemplo: gráficos que dividem estas informações de sentimento e as tags por tipo, cor, formato… representam um crescimento ou queda e dividem-se entre barras, gráficos de pizza para mostrar a representatividade do assunto, etc.

 

Sabedoria ➳ insights

São os chamados “dados acionáveis”, integrados, organizados e explicados e, o mais importante, trazem um aprendizado válido para aplicação e são entendidos pelas pessoas que têm acesso a essas informações.

Exemplo: os dados de sentimento e as tags indicam que a marca está melhor do que no mês passado. Porém, quando comparada ao mercado, está abaixo do esperado pelos fornecedores por apresentar menor aprovação que a concorrência e receber menos citações do que o esperado.

 

Para um analista de métricas, business intelligence, monitoramento e afins, o caminho para transformar os dados em informação e, posteriormente criar ações embasadas, é fundamental. Mas isso também vale para profissionais que lidam com estatísticas, como pesquisadores. Para obter algum insight, é necessário ver a sua amostra, o que ela diz. E é interessante ir além, focando não apenas no positivo, mas também na queda e nas alterações ao longo do período. É assim que podemos identificar se algo está bom para o seu padrão (comparando com os próprios resultados) ou está ruim (olhando para fora, seja um outro segmento da pesquisa, um outro assunto ou o mercado).

A análise só produz insights verdadeiros quando possui base, podendo ser argumentada e comprovada. É ao que muitos se referem quando dizem que “números que não mentem”. Na verdade, os números justificam, não é? Mas eles também podem ocultar ou favorecer uma ideia, dependendo do seu objetivo final. Se os resultados não foram tão bons ou a análise não saiu tão boa de primeira, vale a pena ver de novo. E, principalmente, como já disse o Zappa, música é mesmo o que nos resta de melhor. É só tentar entrar no ritmo. 😉

Dados fora da caixa: menos pesquisas W.E.I.R.D., mais abrangência em Business Intelligence

 

A maior parte das pesquisas globais sobre economia, política e até de teorias comportamentais, seja no mundo acadêmico ou no mercado, são baseadas em dados coletados sobre pessoas padronizadas, que representam uma amostra muito limitada em relação à variedade de humanos que temos. Aonde estão os indianos, os negros, os orientais, os gays, as pessoas transexuais?

As pesquisas que só abordam determinada parcela da população são limitadas, globalmente publicadas e chamadas de “pesquisas W.E.I.R.D.”. Elas podem ser reduzidas ao clichê de “precisamos sair da caixa” das pesquisas.

W.E.I.R.D., em pesquisa, significa:

  • Western (ocidental);
  • Educated (educação superior);
  • Industrialized (industrializado/urbano);
  • Rich (rico).
  • Democratic (democrata).

No Brasil, podemos traçar vários perfis de “pesquisas WEIRD”. Um deles é:

  • Branco;
  • Heterossexual;
  • Ensino superior;
  • Vive em grandes metrópoles;
  • Rico: é das classes A e B;
  • Liberal (posicionamento político).

O desafio no Brasil passa por várias camadas, especialmente raciais e sociais. Se dermos um breve Google, o volume de pesquisas sobre quem está fora do padrão é absurdamente menor. Nesta minoria temos moradores da periferia, classe D,  transgêneros, bissexuais, mães solteiras, casais homoafetivos que adotaram crianças, retirantes nordestinos (ad infinitum).

O desafio das “9 dots” ou “thinking outside the box”
Hora do jogo

Ligue os pontos;
Use apenas quatro linhas retas;
Linhas devem ser conectadas (não dê o truque e tire a caneta do papel enquanto traça-as);
Você não pode refazer as linhas enquanto traça.

Para visualizar o resultado, clique aqui.

O resultado de ligar simples esferas é um paralelo matemático que podemos associar ao desafio ao pensar fora da caixa com as pesquisas, relatórios e soluções estratégicas. A “visão viciada” é comum, pois estamos ligamos mais ligados ao contexto do que já temos, às possibilidades concretas e aos pensamentos facilmente acessíveis.

As crianças costumam fazer o desafio das 9-dots com mais facilidade e rapidez do que os adultos. O “quebra a cabeça” é resolvido com menos “limitações de mundo”, menos conceitos pré-determinados. As crianças não possuem uma caixa clara ainda e usam a criatividade e experimentação. Em outras palavras, pensam sem limitação.

Christian Rudder a aplicação anti-W.E.I.R.D. no site OkCupid

Em seu livro “Dataclysm – Who We Are (When We Think No One’s Looking)”, o autor Christian Rudder aborda, em alguns momentos, as pesquisas W.E.I.R.D., apontando que elas limitam a nossa visão total do que está acontecendo. Rudder é co-fundador do site OkCupid, um dos sites de relacionamentos gratuitos mais populares do mundo, com mais de 3,5 milhões de usuários.

Por meio de gráficos e de explicações para comportamentos dos usuários, Rudder comprova que sair da amostra tradicional mostra novos cenários – que é o caso de sua pesquisa no site OkCupid. Ao analisar um dos maiores sites de relacionamento do mundo, ele procura ir além das “pessoas tradicionais” das pesquisas W.E.I.R.D. e investiga, também, asiáticos, negros e latinos.

Ao perguntar-se sobre o quê a equipe do OkCupid sabia sobre o comportamento e quais dados tinham da parcela de asiáticos, negros e latinos, ele concluiu:

“Não há muito que você pode fazer com o fato de que, estatisticamente, a banda menos negra na Terra é Belle & Sebastian, ou que o flash instantâneo em uma foto faz uma pessoa sentir-se sete anos mais velho, exceto para dizer, e talvez repetí-la em um jantar”.

(Christian Rudder, no livro “Dataclysm: Who we are”)

E foi explorando as possibilidades de vários tipos de pessoas que Hudder chegou em dados sobre a possibilidade de encontros entre pessoas de diferentes raças se conhecerem. O gráfico abaixo é feito junto ao DateHookUp, plataforma independente adquirida pelo OkCupid e que mostra uma base de usuários com preconceitos básicos na hora de conhecer o seu “crush” fora da internet:

  • Homens latinos e brancos são os que menos querem conhecer seus “dates” negros;
  • Mulheres latinas não costumam sair com homens asiáticos;
  • Mulheres brancas preferem sair com homens brancos;
  • Homens brancos preferem sair com mulheres brancas.

Fora da caixa

 

 

Ok. A expressão “fora da caixa” surgiu há mais de 20 anos e hoje em dia não podemos dizer que este mote é “fora da caixa”, pois já tornou-se clichê e… resumido, inclusive. Atualmente, é usada frequentemente no marketing e na publicidade. Mas qual, realmente, a sua aplicação? Quantas campanhas e pesquisas podemos listar que possuem dados sobre as pessoas fora do eixo W.E.I.R.D., mas que são atuantes na sociedade, mas nem sempre possuem visibilidade?

Pensar fora da caixa é olhar além do que foi coletado nas pesquisas e pensar no espaço “vazio” que ainda existe, para ir além dele e compor uma amostra completa. Para criar insights “fora da caixa” e aplicar de forma a criar Business Intelligence:

Abrangência da pesquisa:
– Quais pessoas esta pesquisa engloba?
– Quais soluções podem ser aplicadas?
– Qual as ideias/insights/conhecimentos que as soluções sugerem?

 

Menos dadinho, mais big data:
(Para pensar no cenário total, e não apenas no que salta aos olhos)

– Lato sensu, em latim, significa “sentido amplo”. Utilizada frequentemente para caracterizar determinada interpretação que deve ser abordada no sentido lato (abrangente);
– “Lato” sim. A abrangência das pesquisas é fundamental para sair que elas abordam Contido em si, dar o sentido de inclusão de muitos dados ou muitos fatos inerentes ao assunto.