Każdego dnia w internecie można znaleźć nowe informacje – począwszy od wpisów na blogu, a skończywszy na informacjach na temat projektów badawczych finansowanych przez UE. Strony internetowe nie są jednak dostępne wiecznie.
Przykładowo tylko 7 proc. stron internetowych na temat projektów związanych z 4. programem ramowym (4PR, 1994–1998) było dostępnych w 2015 r.
Strony internetowe poświęcone badaniom i rozwojowi zawierają cenne informacje dotyczące różnych aspektów, których nie można znaleźć gdzie indziej, np.
- oprogramowania używanego w doświadczeniach
- zestawów danych testowych
- dokumentów spoza obiegów akademickich i handlowych
- aktualności
- materiałów do rozpowszechniania.
Dezaktywacja takich stron powoduje przepadanie cennych zasobów wiedzy.
Jak temu zapobiec? Rozwiązaniem jest archiwizowanie stron internetowych.
Archiwum Arquivo.pt, administrowane przez portugalską Fundację Nauki i Technologii, udostępnia online informacje naukowe i akademickie. Można w nim przeglądać projekty badawczo-rozwojowe realizowane w przeszłości.
Archiwum automatycznie identyfikuje strony internetowe poświęcone projektom badawczo-rozwojowym i gromadzi ich treść. W archiwum zapisano już 52 miliony plików dotyczących projektów badawczo-rozwojowych finansowanych od 1994 r., pochodzących z blisko 54 tys. stron. Archiwum stale rozrasta się.
Zbiory danych dotyczących 4PR, 5PR, 6PR i 7PR są obecnie publicznie dostępne, zatem organizacje zainteresowane ochroną tych zasobów cyfrowych mogą je przechowywać, poprawiać i ponownie wykorzystywać.