Todos os dias, são publicadas em linha novas informações, desde artigos em blogues a projetos de investigação financiados pela UE. Mas a web é um meio efémero.
Por exemplo, em 2015, apenas sobreviviam 7 % dos sítios web de projetos associados ao 4.º Programa-Quadro (4.º PQ, 19941998).
Os sítios web sobre investigação e desenvolvimento contêm informações valiosas que não é possível encontrar em mais nenhum lado, nomeadamente:
- software usado em experiências
- conjuntos de dados de ensaio
- documentos não abrangidos pelos circuitos académicos e comerciais de publicação
- notícias
- material de divulgação
A desativação destes sítios web representa, assim, um empobrecimento do conhecimento humano.
Como evitar esta situação? A resposta é o arquivo na web.
Gerida pela Fundação para a Ciência e a Tecnologia de Portugal, a base Arquivo.pt conserva informações científicas e académicas, disponíveis em linha, facilitando a pesquisa relativa a antigos projetos de investigação e desenvolvimento.
A base deteta automaticamente sítios web de projetos de investigação e desenvolvimento e recolhe o seu conteúdo. A Arquivo.pt já salvou 52 milhões de ficheiros de projetos de investigação e desenvolvimento financiados desde o 4.º PQ, recolhidos junto de quase 54 000 sítios web, continuando a crescer.
Os conjuntos de dados para os 4.º, 5.º, 6.º e 7.º PQ já são acessíveis ao público, para que outras organizações que desejem preservar este património digital o possam melhorar reutilizar.