Sve informacije o Srcu i uslugama pronađite na javnom webu Srca.

  • 2002

MWP -> 2004. HAW


Početkom 2002. godine stručni je tim Srca započeo s pripremama za prvo mjerenje hrvatskoga prostora weba. Poticaj za ovaj projekt došao je kroz suradnju Srca i Nacionalne i sveučilišne knjižnice (NSK) na projektu „Nacionalni informacijski sustav knjižnica Republike Hrvatske - NISKA”. U okviru II. faze ovoga projekta i zadatka pod nazivom „Izgradnja nacionalne digitalne knjižnice“ prepoznata je potreba za prikupljanjem informacija o veličini i sadržaju hrvatskoga web-prostora. Prikupljeni podaci predstavljali bi neophodni temelj za svaku daljnju, složeniju analizu mrežno dostupne elektroničke građe u hrvatskom prostoru weba. U siječnju 2002. godine NSK i Srce sklopili su ugovor kojim se priprema i provedba prvoga mjerenja hrvatskog weba povjerava Srcu. Mjerenjem se prije svega željelo ustanoviti:

  • veličinu prostora weba,
  • korištene formate datoteka prema MIME standardu,
  • omjer teksta, slike, audio i video zapisa,
  • obim i sadržaj meta podataka.

Mjerenje je pokrenuto 29. 3. 2002. godine i trajalo je sve do 7. svibnja. U hodu su rješavani problemi: prije svega inventivni, ali i nestandardni načini korištenja weba i pratećih tehnologija, na koje je sustav za prikupljanje, nazvan MWP naletio. Izmjereni uzorak obuhvatio je 6.564 web-poslužitelja, a s uspjehom je obrađeno 4.667.920 resursa (objekata dostupnih webom). Veličina uzorka procijenjena je na preko 300 GB podataka na javno dostupnim web-stranicama u .hr vršnoj internetskoj domeni.

Znanje skupljeno provođenjem mjerenja weba omogućilo je timu Srca da, ponovno u suradnji s NSK, pokrene i ostvari projekt Hrvatskog arhiva weba. Hrvatski arhiv weba zbirka je sadržaja preuzetih s weba. Njegova je svrha preuzimanje i trajno čuvanje publikacija s interneta kao dijela hrvatske kulturne baštine. HAW je jedinstven arhiv u Hrvatskoj i svijetu. Nema drugog servisa koji bi jednakim obuhvatom, sustavno arhivirao sadržaje s hrvatskog weba i nudio im pristup. Temelji se na programskoj podršci koju je pod nazivom DAMP razvilo Srce. HAW je u produkciji od 2004. godine. Od 2011. u okviru HAW-a se, pomoću programske podrške Heritrix, provode redovita godišnja harvestiranja, odnosno prikupljanja javno dostupnih sadržaja s hrvatskog web-prostora. Harvestiraju se aktivna web-sjedišta na nacionalnoj internetskoj domeni .hr u pravilu krajem kalendarske godine.

Natrag

Pregled odabranih trenutaka