Trecho do Livro: Numerati | Stephen Baker

Livros Numerati Stephen Baker BooksLivro: Numerati

Saiba onde encontrar este livro

Imagine-se num café, talvez o barulhento onde estou sentado neste momento. Uma mulher jovem na mesa à sua direita está teclando no laptop dela. Você vira a cabeça e olha para a tela. Ela navega na Internet. Você observa.

Passam-se horas. A garota lê um jornal na Internet. Você observa que ela lê três artigos sobre a China. Ela procura filmes para a noite de sexta-feira e assiste a um trailer do Kung Fu Panda. Acessa um anúncio que promete colocá-la em contato com antigos colegas de escola. Você permanece observando. A cada minuto decorrido, descobre mais sobre ela. Agora imagine se você conseguisse observar 150 milhões de pessoas navegando na Internet ao mesmo tempo. É mais ou menos o que Dave Morgan faz.

“Qual é a dos fãs de filmes de amor?”, Morgan pergunta, sentado comigo no seu escritório de Nova York, num entardecer de verão. O empresário da publicidade está cheio de detalhes sobre as nossas andanças online. Ele consegue identificar os padrões de nossas migrações, como se fôssemos andorinhas ou baleias-jubarte, enquanto perambulamos de um site ao outro. Recentemente ele se intrigou com as pessoas que acessam com freqüência um anúncio de aluguel de carros. Entre elas, o grupo maior havia visitado um obituário na Internet. Isso faz sentido, ele diz, tendo ao fundo o tamborilar da chuva nas janelas. “Alguém morre e você aluga um carro para chegar correndo ao funeral.” Mas é o segundo maior grupo que está deixando Morgan intrigado. Fãs de filmes de amor. Por algum motivo que Morgan não consegue discernir, muitos deles parecem atraídos por um banner da Alamo Rent a Car, uma empresa de aluguéis de automóveis.

Morgan, um homem jovial de 43 anos, tem os cabelos esticados para o lado, como se, quando criança, a mãe tivesse mergulhado um pente na água, penteado seus cabelos e eles permanecessem assim. Cresceu em Clearfield, uma cidadezinha no oeste da Pensilvânia, a pouca distância de carro de Punxsutawney. Todos os anos, no segundo dia de fevereiro, bem na metade entre o solstício de inverno e o equinócio de primavera, uma multidão naquela cidade se reúne em volta de um grande roedor enjaulado, ainda grogue da hibernação. Ela examina a reação do animal à própria sombra. De acordo com uma antiga lenda celta, esse dado individual informa se a primavera virá cedo ou esperará até o fim de março. Morgan afastou-se o máximo possível dessas previsões tradicionais. Em sua empresa em Nova York, a Tacoda, ele contrata estatísticos para rastrear nossas perambulações pela web e prever nossos próximos lances. Morgan foi um pioneiro da publicidade na Internet durante a “bolha ponto com”, abrindo uma agência chamada 24/7 Real Media. Depois do estouro da bolha, fundou outra empresa, a Tacoda, e passou naturalmente para o que viu como o próximo grande desafio: ajudar os anunciantes a localizar os internautas mais promissores para suas mensagens.

Todo o negócio da Tacoda se concentra em dados. A empresa firmou contratos com milhares de publicações na Internet, do New York Times à Business Week. Seus sites permitem que a Tacoda coloque uma pequena codificação, chamada cookie, nos nossos computadores. Isso permite à Tacoda acompanhar nosso percurso de um site para o próximo. A empresa concentra-se no nosso comportamento e não se dá ao trabalho de descobrir nossos nomes ou outros detalhes pessoais (isso poderia provocar uma reação dos defensores da privacidade). Mesmo assim a Tacoda consegue descobrir muita coisa. Digamos que você visite o Boston Globe e leia uma coluna sobre o Toyota Prius. Depois você consulta a seção de carros da AOL. As chances são grandes de que você esteja à procura de um carro. Assim, a certa altura de suas andanças pela web, a Tacoda o atinge com um anúncio de carro. Se você acessá-lo, a Tacoda é paga pelo anunciante – ao mesmo tempo em que recolhe mais um detalhe sobre você. A empresa coleta 20 bilhões dessas pistas comportamentais a cada dia.

Às vezes, a equipe de Morgan detecta grupos de internautas que parecem se mover em sincronismo. O desafio então é descobrir o que desencadeia seus movimentos. Uma vez esclarecido isso, os anunciantes podem prever as navegações das pessoas na Internet – e salpicar seus caminhos com os anúncios certos. Isso requer pesquisa. Vejamos a relação curiosa entre aficionados de filmes de amor e o anúncio da locadora de automóveis Alamo. Para desvendá-la, Morgan e seus colegas precisam mergulhar mais fundo nos dados. As pessoas que alugam carros estão vindo, em grande número, de algum tipo de filme de amor, talvez filmado num local exótico? Os membros desse grupo possuem outros sites favoritos em comum? As respostas residem nas seqüências de uns e zeros enviadas pelos nossos computadores. Talvez a estatística revele que o vínculo aparente entre fãs de filmes de amor e pessoas que alugam carros foi um simples acaso estatístico. Ou talvez a equipe de Morgan venha a descobrir uma tendência mais ampla, uma correlação entre amor e viagens, desejo s_xual e desejo de viajar. Isso poderia levar a todo tipo de sacadas publicitárias. Nos dois casos Morgan pode solicitar centenas de testes. Com cada um pode descobrir um pouco mais sobre nós e direcionar os anúncios com mais precisão a cada vez. Ele está substituindo a análise que antes dependia da intuição do anunciante por ciência. Somos as suas cobaias e nunca cessamos de trabalhar para ele.

Quando se trata de produzir dados, somos prolíficos. Os usuários de celulares, laptops e cartões de crédito, só pelo fato de viverem, engordam a cada dia os seus próprios dossiês digitais. Tomemos o meu caso. Enquanto escrevo nesta manhã de primavera, a Verizon, operadora do meu celular, consegue me localizar, com margem de erro de alguns metros, neste café em Nova Jersey. A Visa pode atestar que estou bem cafeinado, provavelmente para me recuperar dos efeitos do vinho português que comprei ontem às 20h19. Isso aconteceu em tempo de assistir a um jogo de basquete universitário pela TV, que, como a TiVo deve saber, desliguei após o primeiro tempo. Câmeras de segurança captam imagens minhas, com indicação da hora exata, perto de cada banco e loja de conveniência. E nem me falem de minhas navegações pela web. Essas já vêm sendo registradas por dezenas de editores e anunciantes da Internet mundo afora. Dave Morgan é mais um numa multidão grande e curiosa. Na segunda metade do século passado, para obter esse nível de informação, o governo da Alemanha oriental teve de aliciar dezenas de milhares de seus cidadãos como espiões. Atualmente espionamos a nós mesmos e enviamos atualizações eletrônicas a cada minuto.

Tudo começou com os chips de computador. Até a década de 1980, esses pedacinhos de silício, repletos de milhões de transistores microscópicos, ainda eram novidade. Mas foram ficando mais baratos e poderosos a cada ano, e agora os fabricantes os incluem em praticamente tudo que possa se beneficiar de um toque de inteligência. Eles acionam nossos telefones celulares, os controles de nossos carros, nossas câmeras digitais e, é claro, nossos computadores. Nas festas de fim de ano, os embrulhos que abrimos trazem mais chips às nossas vidas. Esses chips conseguem registrar cada instrução recebida e cada tarefa realizada. São anotadores meticulosos. Registram as minúcias de nossas vidas. Isoladamente, cada informação é quase inexpressiva. Mas quando esses bits são reunidos, seus padrões descrevem nossos gostos e sintomas, nossas rotinas no trabalho, os caminhos que percorremos no shopping center e supermercado. E esses fluxos de dados dão a volta ao mundo. Do seu telefone celular, envie um emoticon a um amigo. Aquele fragmento de seu comportamento, aquele gesto minúsculo, dispara instantaneamente, com bilhões de outros, por cabos de fibra óptica. Sobe para um satélite e desce até um parque de servidores em Cingapura antes que você tenha guardado o celular de volta no bolso. Com tantos bits voando por aí, o próprio ar que respiramos está fervilhando com partículas de informações.

Se alguém conseguisse coletar e organizar esses gestos eletrônicos dispersos, nossas vidas entrariam em foco. Isso criaria um mosaico cambiante e atualizado do comportamento humano. A perspectiva é suficiente para empolgar os profissionais de marketing. Uma vez que tenham acesso aos nossos dados, poderão decodificar nossos desejos, temores e necessidades. Poderão nos vender precisamente o que estamos querendo.

Mas a coisa soa mais simples do que realmente é. Oceanos de dados, dos e-mails e downloads às notas fiscais, criam imensas ondas caóticas. Num só mês, o Yahoo sozinho reúne 110 bilhões de dados individuais sobre seus clientes, segundo um estudo de 2008 de uma empresa de pesquisas. Cada pessoa que visita sites na rede de anunciantes do Yahoo deixa, em média, um rastro de 2.520 pistas. Você pode pensar que basta juntar esses detalhes para nossos perfis como consumidores, viajantes e trabalhadores surgirem num instante. Conseguir essa clareza, porém, leva tempo. Quando visito Prabhakar Raghaven, o chefe de pesquisas do Yahoo, fico sabendo que a maioria dos dados é lixo digital. Esse “ruído”, como ele o chama, consegue facilmente dominar os computadores do Yahoo. Se um dos cientistas de Raghaven der um comando impreciso quando estiver vasculhando os dados do Yahoo, os servidores da empresa poderão ficar perdidos em meio ao ruído durante dias a fio. Mas um ajuste certeiro nessas instruções pode acelerar a busca 30 mil vezes. Isso reduz um processo de 24 horas a cerca de três segundos. Sua conclusão é que pessoas com as habilidades certas conseguem extrair sentido do mar de dados quase abissal. Não é fácil, mas elas conseguem nos localizar ali.

As únicas pessoas que conseguem interpretar os dados que criamos são os grandes matemáticos, os cientistas da computação e os engenheiros. Eles sabem como transformar os dados de nossas vidas em símbolos. Por que isso é necessário? Imagine que você quisesse acompanhar tudo que comeu durante um ano. Se você for como eu era na quarta série, irá à papelaria e comprará um montão de fichas. Depois, a cada refeição, anotará os diferentes alimentos numa ficha nova. Bolo de carne. Espinafre. Pudim de tapioca. Cereais da Cheerios. Após alguns dias, sua pilha de fichas cresceu. O problema é que não há como contá-las ou analisá-las. Não passam de um bando de palavras. Claro que estas também são símbolos, cada um representando uma coisa ou um conceito. Mas são quase impossíveis de somar ou subtrair, ou de representar num gráfico ilustrando uma tendência. Juntando-se essas palavras, elas formam o que os especialistas chamam de “dados não-estruturados”. Este é o jargão da computação para “uma grande bagunça”. Uma abordagem melhor seria rotular todas as carnes com C, todas as verduras com V, todos os doces com D, e assim por diante. Uma vez que as palavras sejam reduzidas a símbolos, é possível dispô-las numa planilha e calcular, digamos, quantas vezes você comeu carne ou doce numa dada semana. Depois você pode traçar um gráfico associando sua dieta a mudanças no seu peso ou à quantidade de espinhas no seu rosto.
.

setaenquete Participe da enquete:
.
.

—–
+ Veja também:

.