Questo spazio esiste a supporto delle azioni di monitoraggio, sviluppate nell’ambito del la campagna datiBeneComune, in cui più di 150 realtà diverse e circa 40.000 firmatari chiedono al Governo dati aperti e machine readable sull’emergenza COVID-19.
Molte delle informazioni pubbliche più interessanti e di valore sulla COVID-19 in Italia risiedono in ricchi PDF a pubblicazione periodica, per lo più presenti sul sito del Ministero della Salute e/o su quello dell’Istituto Superiore di Sanità.
Questo spazio esiste per superare la dispersione delle documentazioni e le criticità correlate.
Nei siti istituzionali infatti non esistono delle pagine “indice”, con raccolta ed archiviazione di tutti i documenti. Per volerli esaminare in modo organico si è costretti a fare ricerche web (tramite motori di ricerca o servizi di ricerca presenti nei siti). Per superare questo problema, qui abbiamo iniziato ad organizzare una repository.
Abbiamo attivato un meccanismo automatico per la creazione di una copia di archivio di questi file per tenerne traccia, perché tutta la documentazione ha un valore. Se le pagine istituzionali in cui sono pubblicati i documenti venissero spente o cancellate, non sarebbe più possibile accedere a questo patrimonio informativo.
Al momento (8 dicembre 2020) abbiamo creato questi elenchi di documenti:
Di ognuno dei file in questi elenchi viene fatta automaticamente copia su Internet Archive (il più importante archivio digitale dei contenuti web), tramite questo script.
Quindi ad esempio se il file http://www.salute.gov.it/imgs/C_17_notizie_5196_1_file.pdf dovesse non essere più presente sul sito del Ministero della Salute, sarà accessibile nella sua versione su IA:
https://web.archive.org/web/*/http://www.salute.gov.it/imgs/C_17_notizie_5196_1_file.pdf
Alcune note: