Početkom 2002. godine stručni je tim Srca započeo s pripremama za prvo mjerenje hrvatskoga prostora weba. Poticaj za ovaj projekt došao je kroz suradnju Srca i Nacionalne i sveučilišne knjižnice (NSK) na projektu „Nacionalni informacijski sustav knjižnica Republike Hrvatske - NISKA”. U okviru II. faze ovoga projekta i zadatka pod nazivom „Izgradnja nacionalne digitalne knjižnice“ prepoznata je potreba za prikupljanjem informacija o veličini i sadržaju hrvatskoga web-prostora. Prikupljeni podaci predstavljali bi neophodni temelj za svaku daljnju, složeniju analizu mrežno dostupne elektroničke građe u hrvatskom prostoru weba. U siječnju 2002. godine NSK i Srce sklopili su ugovor kojim se priprema i provedba prvoga mjerenja hrvatskog weba povjerava Srcu. Mjerenjem se prije svega željelo ustanoviti:
Mjerenje je pokrenuto 29. 3. 2002. godine i trajalo je sve do 7. svibnja. U hodu su rješavani problemi: prije svega inventivni, ali i nestandardni načini korištenja weba i pratećih tehnologija, na koje je sustav za prikupljanje, nazvan MWP naletio. Izmjereni uzorak obuhvatio je 6.564 web-poslužitelja, a s uspjehom je obrađeno 4.667.920 resursa (objekata dostupnih webom). Veličina uzorka procijenjena je na preko 300 GB podataka na javno dostupnim web-stranicama u .hr vršnoj internetskoj domeni.
Znanje skupljeno provođenjem mjerenja weba omogućilo je timu Srca da, ponovno u
suradnji s NSK, pokrene i ostvari projekt Hrvatskog arhiva weba. Hrvatski
arhiv weba zbirka je sadržaja preuzetih s weba. Njegova je svrha preuzimanje i
trajno čuvanje publikacija s interneta kao dijela hrvatske kulturne baštine. HAW je
jedinstven arhiv u Hrvatskoj i svijetu. Nema drugog servisa koji bi jednakim
obuhvatom, sustavno arhivirao sadržaje s hrvatskog weba i nudio im pristup. Temelji
se na programskoj podršci koju je pod nazivom DAMP razvilo Srce. HAW je u produkciji
od 2004. godine. Od 2011. u okviru HAW-a se, pomoću programske podrške Heritrix,
provode redovita godišnja harvestiranja, odnosno prikupljanja javno dostupnih
sadržaja s hrvatskog web-prostora. Harvestiraju se aktivna web-sjedišta na
nacionalnoj internetskoj domeni .hr u pravilu krajem kalendarske godine.
Natrag