i Cultura Genoma cultural
2081855.jpg

A humanidade explicada por 5 milhões de livros







Investigadores da U niversidade de Harvard criaram um método capaz de analisar o maior universo literário de sempre. Prometem um estudo profundo do legado cultural e já conseguiram identificar vítimas da repressão nazi.

A literatura produzida nos últimos dois séculos permite chegar a algumas conclusões: Freud é muito mais popular do que Galileu ou Darwin; cada vez nos esquecemos mais depressa do passado; a fama é cada vez mais rápida e mais curta; Deus não morreu mas precisa de um novo agente publicitário. Até agora era impossível ter estas certezas. Por uma simples questão de tempo. Mas um grupo de investigadores da Universidade de Harvard anunciou esta semana uma ferramenta que permite analisar o maior universo literário de todos os tempos: cerca de 4% dos livros alguma vez publicados.

O avanço promete uma revolução nas ciências sociais. Chamam-lhe "culturómica" e é um método de análise que permite investigar tendências culturais de forma quantitativa à escala mundial, com base no legado dos livros. A importância desta evolução explica-se em poucas linhas: ler uma amostra representativa da literatura publicada só no ano 2000, ao ritmo esgotante e improvável de 200 palavras por minuto e sem dormir ou comer, demoraria qualquer coisa como oito anos. Claro: nunca ninguém o fez. Agora imagine 500 mil milhões de palavras, 4% da literatura publicada em todo o mundo. Teria de dispor (ou alguém por si) de 4756 anos, 67 vidas à longevidade actual.

Uma equipa de investigadores sociais, apoiada pela Google, pela Encyclopaedia Britannica e pelo American Heritage Dictionary, concretizou a ambição de muitos cientistas sociais com uma ideia relativamente simples, pelo menos em 2010: um motor de busca, o Books Ngram Viewer, que permite o acesso a um corpus de 5 milhões de livros digitalizados, a maioria em língua inglesa.

"Viciante", alertam os investigadores em www.culturomics.org, a página lançada na internet para alojar a ferramenta. Em segundos, pode ver como é que o uso de determinada palavra foi oscilando ao longo dos anos, sinalizando o interesse que despertava à época junto dos escritores. É possível perceber, por exemplo, que a palavra "Portugal" despertou durante o século XX metade do interesse que despertava no século anterior. As últimas duas décadas do século passado revelaram uma ligeira recuperação, com um pico por volta de 1998. Se não é profissional destas matérias, pode divertir- -se com especulações. Uma dica: foi o ano da Expo em Lisboa.



Primeira Luz Ontem, no canto esquerdo do site, uma etiqueta assinalava "Dia 1, primeira luz", a expressão poética usada na astronomia para imortalizar a primeira imagem capturada por um teles-cópio. Uma metáfora para o objectivo de expandir horizontes: "Agora que uma fracção significativa dos livros mundiais foi digitalizada, é possível que uma análise computacional venha a revelar tendências ainda por descobrir na história, na cultura, na linguagem e no pensamento", resumiu Jon Orwant, engenheiro da Google Books, parceira do projecto.

Lieberman Aiden, co-autor do artigo na "Science", explicou ao i que, nesta fase, os resultados que se venham a retirar da ferramenta ainda não podem ser considerados universais: 72% dos livros analisados são em língua inglesa e o português, por exemplo, ficou fora da amostra. Mas o objectivo é crescer, com jornais, manuscritos e outros tipos de registo cultural. A dimensão fá-los pensar num verdadeiro genoma cultural: a cultura humana analisada pela disposição das palavras como o homem resulta do alfabeto dos genes.

esquecimento acelerado Entre as primeiras conclusões há umas mais universalizáveis do que outras. A equipa descobriu, por exemplo, que o léxico inglês recebe 8500 palavras novas por ano. Mas também há conclusões insólitas para os linguistas, mesmo que restritas aos anglo--saxónicos: 52% são uma espécie de "matéria negra", brincam os investigadores, pois não aparecem nos dicionários.

Há ainda considerações mais gerais sobre a memória colectiva. Numa análise às referências a anos anteriores, nas décadas que os sucederam, percebe-se, por exemplo, que o ano de 1880 demorou 32 anos a cair para metade das referências que tinha no período auge. Já a 1973 bastaram apenas dez anos para atingir semelhante queda. "A humanidade está a esquecer-se do passado cada vez mais depressa", concluem.

Outra análise permite perceber que a fama chega cada vez mais cedo e dura cada vez menos, embora existam padrões distintos consoante a ocupação dos famosos. Os actores são os primeiros a atingir a ribalta, aos 30 anos. Os escritores, regra geral, tornam-se famosos por volta dos 40. Os políticos já na casa dos 50, mas com duração maior. "A ciência é um caminho pobre para a fama", adiantam.

A maior surpresa para Lieberman Aiden foi, no entanto, o facto de o corpus ter permitido identificar vítimas de censura no período nazi. Descobriram que 9,8% dos indivíduos que habitavam a literatura alemã antes da ditadura de Hitler sofreram uma supressão evidente nas páginas dos livros durante os 13 anos de regime.

Comentários

Mensagens populares deste blogue