Parte do arquivo da internet está desaparecendo para sempre; entenda
Hoje encontramos praticamente de tudo na internet. É possível procurar desde uma simples receita de bolo até informações valiosas sobre o passado da humanidade.
No entanto, como a produção humana de conteúdo está cada vez maior, é necessário mais e mais espaço para guardar todas estas informações. E é aí que temos esbarrado em um grande desafio. Parte destas informações estão sumindo para sempre.
Parte das páginas da web não existem mais
Segundo um estudo do Pew Research Center, um quarto de todas as páginas web que já existiram em algum momento entre 2013 e 2023 já não existem mais.
Quanto mais antigos são os arquivos, maiores os problemas.
A organização tentou acessar páginas existentes em 2013 e 38% delas não funcionam mais.
O mesmo também pode acontecer com páginas mais recentes.
Cerca de 8% dos conteúdos publicados em algum momento de 2023 desapareceram em outubro do mesmo ano.
Ainda segundo o trabalho, um em cada cinco websites governamentais contém pelo menos um link quebrado.
Além disso, mais da metade dos artigos da Wikipédia tem um link quebrado na sua seção de referências.
Isso significa que parte da história humana simplesmente desapareceu para sempre.
As informações são da BBC.
Leia mais
Google sem notícia? Buscador vai remover artigos da Europa
Nova rota de cabos submarinos liga Brasil aos Estados Unidos
Fórum descobre o autor da ‘música mais misteriosa da internet’
Acervo gigantesco busca guardar informações
É neste contexto que diversas organizações compostas na sua maioria por voluntários estão buscando uma forma de salvar esta enorme quantidade de dados. É o caso, por exemplo, do Internet Archive, uma organização sem fins lucrativos sediada em São Francisco, nos Estados Unidos.
Criada em 1996 como um projeto do pioneiro da internet Brewster Kahle, a organização criou o que pode ser o mais ambicioso projeto de arquivo digital já realizado. São 866 bilhões de páginas web, 44 milhões de livros, além de 10,6 milhões de vídeos com filmes e programas de televisão. Toda está coleção está guardada em diversos centros de dados espalhados pelo mundo.
O trabalho do Internet Archive também ajuda a recuperar alguns links quebrados. O projeto Wayback Machine usa robôs para rastrear cópias de websites e guardar este conteúdo.
O grande problema, no entanto, é que esta e diversas outras organizações estão enfrentando ameaças financeiras, dificuldades técnicas, ciberataques e batalhas jurídicas geradas por empresas que não aceitam que cópias da sua propriedade intelectual estejam disponíveis gratuitamente na internet. E sem o trabalho destas pessoas muitas informações simplesmente vão continuar desaparecendo para sempre.
O post Parte do arquivo da internet está desaparecendo para sempre; entenda apareceu primeiro em Olhar Digital.