Elke dag verschijnt er online veel wetenschappelijke informatie, van blogposts tot volledige verslagen over door de EU gesubsideerde onderzoeksprojecten. Maar veel informatie op internet is maar een kort leven beschoren.
Zo was van alle websites over projecten in verband met het 4e kaderprogramma (KP4 van 1994 tot 1998) in 2015 nog maar 7% online.
Websites over onderzoek en ontwikkeling bevatten waardevolle informatie die vaak nergens anders te vinden is, zoals:
- bij experimenten gebruikte software
- onderzochte datasets
- niet bij een academische of commerciële uitgeverij verschenen documenten
- nieuwsberichten
- voorlichtingsmateriaal
Wanneer zulke websites offline worden gehaald, gaat er dus veel menselijke kennis verloren.
Hoe kunnen we dit voorkomen? Het antwoord is: door webarchivering.
Arquivo.pt, dat wordt beheerd door de Portugese stichting voor wetenschap en technologie, houdt wetenschappelijke en academische informatie online zodat iedereen onderzoeksprojecten uit het verleden kan terugvinden.
De website gaat zelf op zoek naar onderzoeksprojectwebsites en verzamelt de inhoud daarvan. Arquivo.pt heeft van bijna 54.000 websites al zo'n 52 miljoen bestanden verzameld over onderzoeksprojecten die de EU sinds KP4 heeft gesubsidieerd, en de verzameling groeit nog steeds.
Ondertussen zijn de datasets voor KP4, KP5, KP6 en KP7 voor iedereen toegankelijk, zodat ook andere organisaties dit digitaal erfgoed kunnen verbeteren en hergebruiken.