i Cultura Genoma cultural
A humanidade explicada por 5 milhões de livros
Investigadores da U niversidade de Harvard criaram um método capaz de analisar o maior universo literário de sempre. Prometem um estudo profundo do legado cultural e já conseguiram identificar vítimas da repressão nazi.
O avanço promete uma revolução nas ciências sociais. Chamam-lhe "culturómica" e é um método de análise que permite investigar tendências culturais de forma quantitativa à escala mundial, com base no legado dos livros. A importância desta evolução explica-se em poucas linhas: ler uma amostra representativa da literatura publicada só no ano 2000, ao ritmo esgotante e improvável de 200 palavras por minuto e sem dormir ou comer, demoraria qualquer coisa como oito anos. Claro: nunca ninguém o fez. Agora imagine 500 mil milhões de palavras, 4% da literatura publicada em todo o mundo. Teria de dispor (ou alguém por si) de 4756 anos, 67 vidas à longevidade actual.
Uma equipa de investigadores sociais, apoiada pela Google, pela Encyclopaedia Britannica e pelo American Heritage Dictionary, concretizou a ambição de muitos cientistas sociais com uma ideia relativamente simples, pelo menos em 2010: um motor de busca, o Books Ngram Viewer, que permite o acesso a um corpus de 5 milhões de livros digitalizados, a maioria em língua inglesa.
"Viciante", alertam os investigadores em www.culturomics.org, a página lançada na internet para alojar a ferramenta. Em segundos, pode ver como é que o uso de determinada palavra foi oscilando ao longo dos anos, sinalizando o interesse que despertava à época junto dos escritores. É possível perceber, por exemplo, que a palavra "Portugal" despertou durante o século XX metade do interesse que despertava no século anterior. As últimas duas décadas do século passado revelaram uma ligeira recuperação, com um pico por volta de 1998. Se não é profissional destas matérias, pode divertir- -se com especulações. Uma dica: foi o ano da Expo em Lisboa.
Primeira Luz Ontem, no canto esquerdo do site, uma etiqueta assinalava "Dia 1, primeira luz", a expressão poética usada na astronomia para imortalizar a primeira imagem capturada por um teles-cópio. Uma metáfora para o objectivo de expandir horizontes: "Agora que uma fracção significativa dos livros mundiais foi digitalizada, é possível que uma análise computacional venha a revelar tendências ainda por descobrir na história, na cultura, na linguagem e no pensamento", resumiu Jon Orwant, engenheiro da Google Books, parceira do projecto.
Lieberman Aiden, co-autor do artigo na "Science", explicou ao i que, nesta fase, os resultados que se venham a retirar da ferramenta ainda não podem ser considerados universais: 72% dos livros analisados são em língua inglesa e o português, por exemplo, ficou fora da amostra. Mas o objectivo é crescer, com jornais, manuscritos e outros tipos de registo cultural. A dimensão fá-los pensar num verdadeiro genoma cultural: a cultura humana analisada pela disposição das palavras como o homem resulta do alfabeto dos genes.
esquecimento acelerado Entre as primeiras conclusões há umas mais universalizáveis do que outras. A equipa descobriu, por exemplo, que o léxico inglês recebe 8500 palavras novas por ano. Mas também há conclusões insólitas para os linguistas, mesmo que restritas aos anglo--saxónicos: 52% são uma espécie de "matéria negra", brincam os investigadores, pois não aparecem nos dicionários.
Há ainda considerações mais gerais sobre a memória colectiva. Numa análise às referências a anos anteriores, nas décadas que os sucederam, percebe-se, por exemplo, que o ano de 1880 demorou 32 anos a cair para metade das referências que tinha no período auge. Já a 1973 bastaram apenas dez anos para atingir semelhante queda. "A humanidade está a esquecer-se do passado cada vez mais depressa", concluem.
Outra análise permite perceber que a fama chega cada vez mais cedo e dura cada vez menos, embora existam padrões distintos consoante a ocupação dos famosos. Os actores são os primeiros a atingir a ribalta, aos 30 anos. Os escritores, regra geral, tornam-se famosos por volta dos 40. Os políticos já na casa dos 50, mas com duração maior. "A ciência é um caminho pobre para a fama", adiantam.
A maior surpresa para Lieberman Aiden foi, no entanto, o facto de o corpus ter permitido identificar vítimas de censura no período nazi. Descobriram que 9,8% dos indivíduos que habitavam a literatura alemã antes da ditadura de Hitler sofreram uma supressão evidente nas páginas dos livros durante os 13 anos de regime.
Comentários