Dataísmo

dados ♥ métricas ♥ monitoramento

Category: Big Data

Dados fora da caixa: menos pesquisas W.E.I.R.D., mais abrangência em Business Intelligence

2015-11-1_outsidethebox_cover

A maior parte das pesquisas globais sobre economia, política e até de teorias comportamentais, seja no mundo acadêmico ou no mercado, são baseadas em dados coletados sobre pessoas padronizadas, que representam uma amostra muito limitada em relação à variedade de humanos que temos. Onde estão os indianos, os negros, os orientais, os gays e até… transexuais?

As pesquisas que só abordam determinada parcela da população são limitadas, globalmente publicadas e… chamadas de “pesquisas W.E.I.R.D.”. Elas podem ser reduzidas ao clichê de “precisamos sair da caixa” das pesquisas.

W.E.I.R.D., em pesquisa, significa:

  • Western (ocidental);
  • Educated (educação superior);
  • Industrialized (industrializado/urbano);
  • Rich (rico).
  • Democratic (democrata).

No Brasil, podemos traçar vários perfis de “pesquisas WEIRD”. Um deles é:

  • Branco;
  • Heterossexual;
  • Ensino superior;
  • Vive em grandes metrópoles;
  • Rico: é das classes A e B;
  • Liberal (posicionamento político).

O desafio no Brasil passa por várias camadas, especialmente raciais e sociais. Se dermos um breve Google, o volume de pesquisas sobre quem está fora do padrão é absurdamente menor. Nesta minoria temos moradores da periferia, classe D,  transgêneros, bissexuais, mães solteiras, casais homoafetivos que adotaram crianças, retirantes nordestinos (ad infinitum).

O desafio das “9 dots” ou “thinking outside the box”
Hora do jogo

2015-11-12_outsidethebox_jogo

Ligue os pontos;
Use apenas quatro linhas retas;
Linhas devem ser conectadas (não dê o truque e tire a caneta do papel enquanto traça-as);
Você não pode refazer as linhas enquanto traça.

Para visualizar o resultado, clique aqui.

O resultado de ligar simples esferas é um paralelo matemático que podemos associar ao desafio ao pensar fora da caixa com as pesquisas, relatórios e soluções estratégicas. A “visão viciada” é comum, pois estamos ligamos mais ligados ao contexto do que já temos, às possibilidades concretas e aos pensamentos facilmente acessíveis.

As crianças costumam fazer o desafio das 9-dots com mais facilidade e rapidez do que os adultos. O “quebra a cabeça” é resolvido com menos “limitações de mundo”, menos conceitos pré-determinados. As crianças não possuem uma caixa clara ainda e usam a criatividade e experimentação. Em outras palavras, pensam sem limitação.

Christian Rudder a aplicação anti-W.E.I.R.D. no site OkCupid

2015-11-11_outsidethebox_gif1

Em seu livro “Dataclysm – Who We Are (When We Think No One’s Looking)”, o autor Christian Rudder aborda, em alguns momentos, as pesquisas W.E.I.R.D., apontando que elas limitam a nossa visão total do que está acontecendo. Rudder é co-fundador do site OkCupid, um dos sites de relacionamentos gratuitos mais populares do mundo, com mais de 3,5 milhões de usuários.

Por meio de gráficos e de explicações para comportamentos dos usuários, Rudder comprova que sair da amostra tradicional mostra novos cenários – que é o caso de sua pesquisa no site OkCupid. Ao analisar um dos maiores sites de relacionamento do mundo, ele procura ir além das “pessoas tradicionais” das pesquisas W.E.I.R.D. e investiga, também, asiáticos, negros e latinos.

Ao perguntar-se sobre o quê a equipe do OkCupid sabia sobre o comportamento e quais dados tinham da parcela de asiáticos, negros e latinos, ele concluiu:

“Não há muito que você pode fazer com o fato de que, estatisticamente, a banda menos negra na Terra é Belle & Sebastian, ou que o flash instantâneo em uma foto faz uma pessoa sentir-se sete anos mais velho, exceto para dizer, e talvez repetí-la em um jantar”.

(Christian Rudder, no livro “Dataclysm: Who we are”)

E foi explorando as possibilidades de vários tipos de pessoas que Hudder chegou em dados sobre a possibilidade de encontros entre pessoas de diferentes raças se conhecerem. O gráfico abaixo é feito junto ao DateHookUp, plataforma independente adquirida pelo OkCupid e que mostra uma base de usuários com preconceitos básicos na hora de conhecer o seu “crush” fora da internet:

2015-11-11_dataclysm_christianrudder_okcupid

  • Homens latinos e brancos são os que menos querem conhecer seus “dates” negros;
  • Mulheres latinas não costumam sair com homens asiáticos;
  • Mulheres brancas preferem sair com homens brancos;
  • Homens brancos preferem sair com mulheres brancas.

Fora da caixa

 

2015-11-11_outsidethebox_gif2

 

Ok. A expressão “fora da caixa” surgiu há mais de 20 anos e hoje em dia não podemos dizer que este mote é “fora da caixa”, pois já tornou-se clichê e… resumido, inclusive. Atualmente, é usada frequentemente no marketing e na publicidade. Mas qual, realmente, a sua aplicação? Quantas campanhas e pesquisas podemos listar que possuem dados sobre as pessoas fora do eixo W.E.I.R.D., mas que são atuantes na sociedade, mas nem sempre possuem visibilidade?

Pensar fora da caixa é olhar além do que foi coletado nas pesquisas e pensar no espaço “vazio” que ainda existe, para ir além dele e compor uma amostra completa. Para criar insights “fora da caixa” e aplicar de forma a criar Business Intelligence:

Abrangência da pesquisa:
– Quais pessoas esta pesquisa engloba?
– Quais soluções podem ser aplicadas?
– Qual as ideias/insights/conhecimentos que as soluções sugerem?

 

Menos dadinho, mais big data:
(Para pensar no cenário total, e não apenas no que salta aos olhos)

– Lato sensu, em latim, significa “sentido amplo”. Utilizada frequentemente para caracterizar determinada interpretação que deve ser abordada no sentido lato (abrangente);
– “Lato” sim. A abrangência das pesquisas é fundamental para sair que elas abordam Contido em si, dar o sentido de inclusão de muitos dados ou muitos fatos inerentes ao assunto.

 

* * *
Are you weird? Fale com o dataismo@gmail.com 😉

Potiguar, retirante e dataísta. Marketing Digital com foco em Business Intelligence, estratégia e monitoramento de mídias sociais.

Business Intelligence: ontologia, semântica e análise de dados

* Este artigo é a segunda publicação sobre ontologia e business intelligence aqui no Dataísmo. O primeiro artigo foi “Business Intelligence e ontologia: definições e apontamentos”, e este segundo fala de aplicações, modelo semântico e análise de dados. 😸

 

Aplicações ontológicas em business intelligence
(Ou como os dados podem ser ontológicos)

Em business intelligence, analisar dados consiste em processar o que está acontecendo. Quando falamos em ontologia, falamos em método e em todo o caminho para processar esses dados.

Já utilizada em linguagens de programação, a ontologia considera cada dado como parte ou objeto para a formação de uma estrutura, como se fosse um código criado por meio de indivíduos e classes.

Em business intelligence existem duas formas de lidar com os dados: a informacional e a estrutural. Se, por um lado, a estrutural foca na ferramenta, no modo informacional podemos analisar esses dados extraídos.

Ao ser aplicada para a web, a ontologia passa pelas definições de “semântica” ou “significado”:

semântica

substantivo feminino

  1. ling estudo sincrônico ou diacrônico da significação como parte dos sistemas das línguas naturais.
  2. ling num sistema linguístico, o componente do sentido das palavras e da interpretação das sentenças e dos enunciados.

 

Por significado, entende-se:

significado

substantivo masculino

  1. relação de reconhecimento, de apreço; valor, importância, significação, significância.
  2. m.q. SIGNIFICAÇÃO (‘representação mental’).

 

Depois de minerarmos os dados e começarmos a analisá-los, o próximo passo é a criação de KPIs (Key Performance Indicators, ou indicadores de desempenho).

 

KPIs e o significado dos dados

Para traçarmos os KPIs, podemos começar por perguntas que façam sentido para aquele projeto:

  • Quais métricas podemos analisar, ou o que pode ser medido?
  • Que ações podemos traçar a partir destes dados?
  • Estes dados respondem às minhas perguntas principais?
  • Estes dados são suficientes para a minha análise?
  • Qual a abordagem mais adequada para a minha análise?

O significado ontológico dos dados passa pela identificação do que é mais comum (padrões) e do que está entrando em evidência. Em outras palavras, seria a explicação de dados por meio de contexto e conhecimento:

Os conceitos e relacionamentos unidos são conhecidos como uma ontologia do modelo semântico que descreve conhecimento. Modelos semânticos permitem que os usuários façam perguntas da informação de uma forma natural e ajudar a identificar padrões e tendências desta informação e descobrir as relações entre peças diferentes de informações.

Dr. Mohammed Ahmed Turki AlSudairy na publicação Knowledge on demand approach using Business Intelligence and Ontology

 

Muito ainda precisa ser feito para desenvolvermos ferramentas cada vez mais inteligentes e que apresentem dados mais minerados, mas já é possível, hoje em dia, irmos direto para algumas etapas da análise de dados. É aí que entram a inteligência e os insights mais rápidos, acompanhando a velocidade das informações que produzimos ou observamos.

Potiguar, retirante e dataísta. Marketing Digital com foco em Business Intelligence, estratégia e monitoramento de mídias sociais.

Data Strategy | Data Analysis

* Este artigo é a terceira publicação de uma série de posts sobre dados aqui no dataismo. O primeiro foi sobre Meta Dados e o segundo sobre Data Mining. Acompanhe-nos para ver mais sobre mais assuntos relacionados, como o Data Sharing, nas próximas publicações. 😉

 

Depois de cuidar dos dados, o próximo passo estratégico é a chamada “data analysis”, que consiste, assim como o nome mesmo já diz, na análise dos dados. É por meio dela que vamos gerar informação, conhecimento e, por fim, a sabedoria, também chamada de insights. 

Esses conceitos parecem, à primeira vista, a mesma coisa. E é comum confundirmos. Mas, como diria a música…

“Information is not knowledge (informação não é conhecimento)
Knowledge is not wisdom (conhecimento não é sabedoria)
Wisdom is not truth (sabedoria não é a verdade)
Truth is not beauty (verdade não é beleza)
Beauty is not love (beleza não é amor)
Love is not music (amor não é música)
Music is THE BEST (música é o melhor)”

(Frank Zappa)

 

 Para melhorar um pouco, se formos dividir em etapas, encontramos a chamada Pirâmide do Conhecimento, cujo caminho que mostra como os dados viram informação. A pirâmide é representada pelo DIKW, Data-Information-Knowledge-Wisdow, baseado no modelo cartesiano (criado com base nos princípios do filósofo Descartes), que consiste em uma evolução de [d]ata (dados), [in]formation (informação), [k]nowledge (conhecimento) e [w]isdom (sabedoria). Esse modelo, hoje em dia, é utilizado para várias áreas, que incluem pesquisas em tecnologia da informação até o marketing:

Pirâmide do Conhecimento ou DIKW

Pirâmide do Conhecimento ou DIKW

Dados ➳ elementos

Sinais, símbolos, um aglomerado de números sem significados. É aquilo que foi coletado.

Exemplo: dados brutos em um arquivo de Excel, o formato, a data, a hora, o tempo da coleta.

 

Informação ➳ organização

Informações são os dados estruturados.

Exemplo: um Excel com dados tabulados, divididos por categorias de sentimento, tags do monitoramento e por rede social.

 

Conhecimento ➳ contexto

Surge quando a informação ganha uso e significado, é sintetizado e pode ser aprendido.

Exemplo: gráficos que dividem estas informações de sentimento e as tags por tipo, cor, formato… representam um crescimento ou queda e dividem-se entre barras, gráficos de pizza para mostrar a representatividade do assunto, etc.

 

Sabedoria ➳ insights

São os chamados “dados acionáveis”, integrados, organizados e explicados e, o mais importante, trazem um aprendizado válido para aplicação e são entendidos pelas pessoas que têm acesso a essas informações.

Exemplo: os dados de sentimento e as tags indicam que a marca está melhor do que no mês passado. Porém, quando comparada ao mercado, está abaixo do esperado pelos fornecedores por apresentar menor aprovação que a concorrência e receber menos citações do que o esperado.

 

Para um analista de métricas, business intelligence, monitoramento e afins, o caminho para transformar os dados em informação e, posteriormente criar ações embasadas, é fundamental. Mas isso também vale para profissionais que lidam com estatísticas, como pesquisadores. Para obter algum insight, é necessário ver a sua amostra, o que ela diz. E é interessante ir além, focando não apenas no positivo, mas também na queda e nas alterações ao longo do período. É assim que podemos identificar se algo está bom para o seu padrão (comparando com os próprios resultados) ou está ruim (olhando para fora, seja um outro segmento da pesquisa, um outro assunto ou o mercado).

A análise só produz insights verdadeiros quando possui base, podendo ser argumentada e comprovada. É ao que muitos se referem quando dizem que “números que não mentem”. Na verdade, os números justificam, não é? Mas eles também podem ocultar ou favorecer uma ideia, dependendo do seu objetivo final. Se os resultados não foram tão bons ou a análise não saiu tão boa de primeira, vale a pena ver de novo. E, principalmente, como já disse o Zappa, música é mesmo o que nos resta de melhor. É só tentar entrar no ritmo. 😉
* Continue de olho no dataismo para acompanhar os próximos passos de uma estratégia de dados: Data Sharing. Acompanhe o Twitter e o Facebook para receber novas publicações em primeira mão.

Potiguar, retirante e dataísta. Marketing Digital com foco em Business Intelligence, estratégia e monitoramento de mídias sociais.

© 2017 Dataísmo

Theme by Anders NorenUp ↑