A maioria do conteúdo da internet é efêmero – e isso representa um grande desafio para os esforços de arquivá-lo. Em 2005, o estudante Alex Tew teve uma ideia de um milhão de dólares. O jovem de 20 anos estava pensando em como pagar um curso de negócios de três anos.
Tew já estava preocupado com o fato de que sua conta entraria ainda mais no negativo. Então, rabiscou em um papel: “Como se tornar um milionário”.
Vinte minutos depois, ele chegou ao que pensou ser a resposta. Tew criou um site chamado Million Dollar Homepage (Página de Um Milhão de Dólares, em tradução livre).
Era quase ridiculamente simples: no site, havia um milhão de pixels de espaço publicitário, disponíveis para serem comprados em blocos de 100 a US$ 1 por pixel. Depois de comprá-los, eles seriam do seu novo dono para sempre. Quando o milionésimo bloco fosse vendido, Tew seria um milionário. Pelo menos, esse era o plano.
A Million Dollar Homepage foi lançada em 26 de agosto de 2005, depois que Tew gastou 50 euros para registrar o domínio e configurar a hospedagem. Os anunciantes compraram pixels e forneceram um link, uma imagem minúscula e uma pequena quantidade de texto para quando o cursor pairasse sobre ela.
Depois de pouco mais de um mês, graças ao boca-a-boca e à crescente atenção da mídia, a página de Tew arrecadou mais de US$ 250 mil. Em janeiro de 2006, os últimos 1 mil pixels foram vendidos em leilão por US$ 38,1 mil. Tew realmente conseguiu o seu US$ 1 milhão.
O Million Dollar Homepage ainda está online, quase uma década e meia depois de ter sido criado.
Muitos dos clientes – que incluem o jornal britânico The Times, o serviço de viagens Cheapflights.com, o portal Yahoo! e a dupla de rock Tenacious D – tiveram 15 anos de publicidade com esse pagamento único. O site ainda tem milhares de visitantes todos os dias. Provavelmente, foi um investimento muito bom.
O Million Dollar Homepage agora está cheia de links para sites que não existem mais
Tew, que agora dirige o aplicativo de meditação Calm, tornou-se um milionário. Mas a página que ele criou também se tornou outra coisa: um museu vivo para os primórdios da internet.
Quatorze anos podem não parecer muito tempo, mas, na internet, é como uma era geológica.
Cerca de 40% dos links na página inicial do Million Dollar Homepage são de sites extintos. Muitos dos outros agora levam a páginas diferentes, após o endereço ter sido vendido para novos proprietários.
A decadência veloz – e invisível – da internet
O Million Dollar Homepage mostra que a decadência deste período inicial da internet é quase invisível.
No mundo analógico, o fechamento de, digamos, um jornal local é frequentemente divulgado. Mas sites morrem muitas vezes sem alarde, e o primeiro indício que você pode ter de que eles não estão mais lá é quando você clica em um link e se depara com uma página em branco.
Cerca de uma década atrás, passei dois anos trabalhando em um blog de rock e na seção de música do portal AOL, um grande pioneiro da internet agora pertencente à empresa norte-americana de telefonia Verizon.
Editei ou escrevi centenas de resenhas, notícias de música, entrevistas de artistas e listas. O Facebook e o Twitter já eram grandes fontes de audiência, e os smartphones nos conectavam à internet entre o escritório e nossa casa. Navegar havia se tornado uma atividade constante.
Você poderia razoavelmente supor que, se eu precisasse mostrar o meu trabalho desta época, bastaria fazer uma pesquisa no Google. Mas você estaria errado.
Em abril de 2013, o AOL fechou abruptamente todos os seus sites de música – e apagou o trabalho de dezenas de editores e centenas de colaboradores ao longo de muitos anos. Pouco resta, além de um punhado de artigos salvos pelo Internet Archive, uma fundação sem fins lucrativos sediada em San Francisco, criada no final dos anos 1990 pelo engenheiro de computação Brewster Kahle.
É a mais proeminente de um grupo de organizações ao redor do mundo que tenta resgatar alguns dos últimos vestígios da primeira década da presença da humanidade na internet antes que ela desapareça completamente.
Dame Wendy Hall, diretora executiva do Web Science Institute da Universidade de Southampton, na Inglaterra, é taxativa sobre a importância deste trabalho.
“Se não fosse por eles, não teríamos nada” do conteúdo inicial, diz. “Se Brewster Kahle não tivesse criado o Internet Archive e começado a salvar as coisas – sem esperar pela permissão de ninguém – nós teríamos perdido tudo.”
O portal AOL fechou seus sites de música em 2013, apagando anos de informações musicais.
Dame Wendy diz que os arquivos e as bibliotecas nacionais tinham experiência em preservar livros, jornais e periódicos, porque a impressão existe há muito tempo. “A Biblioteca Britânica tem uma cópia de todos os jornais locais publicados”, diz ela.
Mas a chegada da internet – e a rapidez com que se tornou uma forma massiva de comunicação e expressão – pode tê-los surpreendido.
As tentativas de arquivamento da internet têm, em muitas áreas, sido retomadas desde então. Esses sites são hoje um recurso tão vital quanto os jornais que os precederam?
O desafio de arquivar um universo digital em constante mutação
Um grande problema em tentar arquivar a internet é que ela nunca fica parada. A cada minuto – a cada segundo -, mais fotos, publicações, vídeos, notícias e comentários são adicionados.
Embora o custo do armazenamento digital tenha caído drasticamente, o arquivamento de todo esse material ainda custa dinheiro. “Quem vai pagar por isso?”, pergunta Dame Wendy. “Produzimos muito mais material do que costumávamos.”
No Reino Unido, o papel da conservação digital recaiu em parte para a Biblioteca Britânica, onde funciona o Web Archive UK, que tem arquivado sites com permissão desde 2004. O gerente de engajamento Jason Webber diz que o problema é muito maior do que a maioria das pessoas imagina.
“Não é apenas o material inicial. A maior parte da internet não está sendo armazenada”, diz ele. “O Web Archive começou com páginas de 1996. Isso é cinco anos depois que as primeiras foram criadas. Não há nada daquela época que tenha sido copiado.”
Até mesmo a primeira página da internet, criada em 1991, não existe mais. O exemplar que pode ser visto no World Wide Web Consortium é uma cópia feita um ano depois.
Para a maior parte dos primeiros cinco anos da rede, grande parte do material publicado na Grã-Bretanha tinha um endereço terminado em .ac.uk – uma designação para artigos escritos por acadêmicos.
Foi somente em 1996 que a internet começou a ter páginas mais gerais, à medida que os sites comerciais começaram a superar os acadêmicos.
A Biblioteca Britânica faz uma “busca por domínios” todos os anos – salvando tudo o que é publicado no Reino Unido.
“Nós tentamos e conseguimos coletar tudo, mas fazemos isso apenas uma vez por ano. Mas o limite para muitos desses sites é de 500 MB. Isso abrange muitos sites menores, mas se houver alguns vídeos lá, esse limite é alcançado rapidamente.”
“Acho que há um nível muito baixo de conscientização de que algo está faltando”, diz Webber. “O mundo digital é muito efêmero. Mas agora as pessoas estão se tornando mais conscientes do quanto podemos estar perdendo.”
Mas, diz Webber, as únicas coisas que as organizações podem registrar são aquelas publicamente visíveis. Há uma quantidade ainda maior de dados cultural ou historicamente importantes que está nos arquivos das pessoas, como seus discos rígidos. Mas poucos de nós estão mantendo cópias deles para a posteridade.
Arquivos sabiam da importância de ter cópias de jornais, mas demoraram a reagir ao aumento do material on-line
Consideramos o material que publicamos nas redes sociais como algo que sempre estará lá, a apenas um clique. Mas a recente perda de cerca de 12 anos de músicas e fotos da rede social pioneira MySpace – que já foi o site mais popular dos Estados Unidos – mostra que mesmo o material armazenado nos maiores sites pode não estar seguro.
E até os serviços do Google não estão imunes. O Google+, a tentativa do gigante das buscas de fazer uma rede social que rivalizasse com o Facebook, fechou em 2 de abril. Todos os seus usuários fizeram cópias das fotos e das memórias que compartilharam?
“Colocar suas fotos no Facebook não é arquivá-las, porque, um dia, o Facebook não existirá mais”, diz Webber.
Se você tiver alguma dúvida sobre a natureza temporária da rede, reserve alguns minutos para percorrer o Million Dollar Homepage. É o testemunho de quão rapidamente o nosso passado online está desaparecendo.
Existe outro lado desta perda de dados. Dame Wendy ressalta que não arquivar histórias de sites de notícias pode levar a uma visão seletiva da história – novos governos optam por não arquivar histórias os retratem de forma desfavorável, por exemplo.
“Assim que há uma mudança de governo ou reestruturação de poderes, sites se fecham”, diz Jane Winters, professora de humanidades digitais da Universidade de Londres, na Inglaterra. “Ou veja os sites de campanha eleitoral, que são feitos para serem temporários.”
Às vezes, os sites perdidos ecoam mudanças ainda mais sísmicas, como a mortes e o nascimento de nações. “Aconteceu com a Iugoslávia: .yu era o domínio para a Iugoslávia, e isso terminou quando ela entrou em colapso. Há um pesquisador que está tentando reconstruir o que havia antes da separação”, diz Winters. “Os aspectos políticos estão frequentemente ligados ao técnicos.”