Archivácia WWW
Archivácia WWW (archivácia internetu, archivácia webu) je proces získavania a dlhodobého uchovávania častí obsahu WWW a údajov, ktoré boli zverejnené na internete a zabezpečenie ich sprístupňovania pre budúcich bádateľov, historikov a verejnosť.[1] Archivovanie sa obvykle vykonáva automaticky pomocou robotov.[2]. Najväčšou inštitúciou, ktorá sa archiváciou WWW zaoberá je Internet Archive, na Slovensku Univerzitná knižnica v Bratislave.[3]
Zber WWW
[upraviť | upraviť zdroj]Zbierajú sa obvykle všetky súčasti obsahu WWW, vrátane HTML, štýlov CSS, JavaScriptu, digitálnych obrázkov a multimediálnych súborov. Ukladajú sa tiež metadáta súvisiace s týmito objektami, ako sú informácie o tom, kedy bol objekt získaný, akého je typu, akou technológiou bol zozbieraný, aký je veľký atď.[4] Metadáta sú dôležité na určenie autenticity a pôvodnosti údajov.[5]
Najčastejšie sa WWW zbiera pomocou robotov, ktoré vidia stránky podobne ako používateľ. Používané roboty sú napríklad:
Referencie
[upraviť | upraviť zdroj]- ↑ Jinfang Niu, University of South Florida - An Overview of Web Archiving
- ↑ Julien Masanès, Bibliothèque Nationale de France - Towards continuous web archiving
- ↑ Androvič, A., Bizík, A., Katrincová, B., Lacková, I, Matúšková, J. - Digitálne pramene – národný projekt zberu a archivácie v roku 1. Knihovna Plus (online). Národní knihovna ČR. 2017, č. 1. ISSN 1801-5948.
- ↑ Developing Web Archiving Metadata Best Practices to Meet User Needs
- ↑ Best Practices for Web Archiving Metadata: Watch This Space!