la mappatura delle informazioni del settore pubblico

Transcript

la mappatura delle informazioni del settore pubblico
LA MAPPATURA DELLE INFORMAZIONI DEL SETTORE PUBBLICO
L’informazione del settore pubblico
La definizione di informazione detenuta dal settore pubblico varia nei diversi Stati. Non esiste,
infatti, una terminologia universalmente riconosciuta e adottata per definire l’informazione pubblica
e i suoi sotto-insiemi1 , in quanto manca una definizione uniforme di settore pubblico. Nella
giurisprudenza e nei dibattiti sull’accesso all’informazione del settore pubblico si delineano tre
possibili approcci2:
• l’approccio funzionale, secondo il quale il settore pubblico comprende enti che hanno autorità o
compiti di pubblico servizio;
• l’approccio legalista-istituzionale, per cui hanno carattere di settore pubblico solo gli enti
esplicitamente elencati nelle leggi ad essi relative;
• l’approccio finanziario, secondo il quale il settore pubblico comprende tutti gli enti finanziati
principalmente da fondi pubblici (che non agiscono, quindi, secondo le normali regole del mercato).
In questo lavoro di mappatura l’informazione del settore pubblico è, latu sensu, ogni tipo di
informazione che è prodotta e/o raccolta da un’ istituzione pubblica nell’ambito delle attività che
fanno parte del suo mandato 3,. In altre parole consideriamo tutte le organizzazioni e i soggetti
(amministrazioni, enti, agenzie, società) le cui finalità istituzionali generano e presuppongono
l’acquisizione, la conservazione, l’elaborazione, la raccolta sistematica e la possibile diffusione di
informazioni che rivestono particolare interesse4. Naturalmente questo non esclude la possibilità che
vi siano dati raccolti “incidentalmente” dalle istituzioni e che questi dati possano rivestire una
qualche importanza e quindi essere inclusi nel nostro lavoro di mappatura.
1
Organisation for Economic Co-operation and Development (2006), Digital broadband content: public sector
information and content, pp. 1-82
2
Commissione Europea (1998), L’informazione del settore pubblico: una risorsa fondamentale per l’Europa. Libro
verde sull’informazione del settore pubblico nella società dell’informazione
3
Vedi nota 1
4
Dipartimento per le politiche comunitarie (1999), L’informazione del settore pubblico nella società dell’informazione.
La posizione del settore pubblico in Italia, pp.1-11.
In particolare la mappatura è stata condotta sui siti internet che detengono informazioni del settore
pubblico. Il processo di digitalizzazione di tali informazioni dovrebbe facilitarne l’accesso, ma
anche la possibilità di valorizzazione e di combinazione con dati provenienti da fonti diverse (alcuni
dati ut singuli hanno poca rilevanza, mentre diventano di maggiore interesse se combinati con altri
dati) . In questo modo dovrebbe essere possibile creare nuovi “pacchetti di informazioni” che
utilizzano i dati del settore pubblico come materia prima. La fruibilità collettiva e sociale di queste
informazioni può creare un valore aggiunto in vari ambiti:economico-produttivo, culturale,
scientifico, di ricerca, di concertazione pubblico-privato, di programmazione delle politiche
pubbliche, ecc.
Classificazione
La mappatura è stata fatta a partire dalla classificazione dell’Organizzazione per la Cooperazione e
lo Sviluppo Economico (OCSE) presente nel rapporto di ricerca “Digital Broad Content: Public
Sector Information and Content” pubblicato nel 2006 dal gruppo di lavoro sull’Economia
dell’Informazione.
La prima macro distinzione riguarda l’informazione del settore pubblico e il contenuto pubblico.
L’informazione è definibile come una grandezza flusso, che ha la caratteristica di essere dinamica e
continuamente generata dal settore pubblico per il funzionamento dello stesso e prontamente
utilizzabile per fini commerciali (ad esempio i dati meteorologici, le statistiche di business, i dati
demografici, ecc.). Il contenuto è invece definibile come una grandezza stock, che ha la
caratteristica di essere statica e detenuta dal settore pubblico piuttosto che direttamente generata da
esso. Inoltre il contenuto pubblico non è direttamente associato con il funzionamento del governo e
non è neppure necessariamente utilizzato per fini commerciali, ma piuttosto di istruzione e di
cultura (ad esempio gli archivi culturali, i beni artistici, ecc.).
Nella classificazione OCSE i dati pubblici sono divisi in:
•
informazioni geografiche;
•
informazioni meteorologiche e ambientali;
•
informazioni economiche e di business;
•
informazioni sociali;
•
traffico e trasporto;
•
turismo e tempo libero;
•
agricoltura, coltivazioni, foreste e pesca;
•
risorse naturali;
•
sistema legale;
•
informazioni scientifiche e sulla ricerca;
•
contenuti legati al mondo accademico;
•
contenuti politici;
•
contenuti culturali.
Ognuna delle categorie sopra menzionate è a sua volta suddivisa in sotto-categorie, per la cui
descrizione dettagliata rimandiamo alla tabella 1.
Tabella
1.
Classificazione
dati
della
pubblica
amministrazione
Descrizione analitica della tassonomia
La tassonomia dell’informazione detenuta dal settore pubblico è stata condotta su due livelli:
regionale (Piemonte) e nazionale (Italia).
Partendo dalla classificazione OCSE si sono mappati i principali siti internet che contengono
informazioni detenute dal settore pubblico.
In particolare le informazioni raccolte a livello regionale si riferiscono a:
•
nome dell’istituzione;
•
indirizzo web;
•
tipo di dati;
•
formato elettronico del dato (es. excel, word, pdf, ecc.)
•
periodicità del dato (mensile, trimestrale, semestrale, annuale, ecc.);
•
anni in cui i dati sono disponibili;
•
formato del dato (es. numerico, descrittivo, cartografico, ecc.);
•
estraibilità e riutilizzabilità del dato:
−
è possibile l’estrazione?;
−
è facile o difficile l’estrazione?;
−
si possono estrarre tutti i dati?;
−
i dati si posso riutilizzare o ci sono dei limiti tecnici/giuridici?
A livello regionale sono stati mappati quaranta siti internet.
Le informazioni raccolte a livello nazionale invece sono:
•
sito internet;
•
tipologia di dati;
•
nome dell’istituzione;
•
anni in cui i dati sono disponibili;
•
diritti di proprietà intellettuale sulle banche dati;
•
fonte del dato;
•
descrizione qualitativa del dato.
A livello nazionale sono stati mappati settanta siti internet.
Principali osservazioni
Dalla mappatura è emersa con chiarezza una generale tendenza alla mancanza di omogeneità che
riguarda sia l’accesso al dato sia il suo riutilizzo. Di seguito evidenziamo i casi più emblematici sia
a livello regionale sia a livello nazionale.
Accesso:
•
Difficoltà di accesso ad informazioni contenute in siti internet ove occorre seguire una
procedura di registrazione in cui si richiede all’utente una lunga serie di dati personali, come
un documento di identità e il codice fiscale (ad esempio sul sito di Sistema Piemonte
“http://www.sistemapiemonte.it” o su quello dell’archivio istituzionale dell’Università degli
Studi di Torino “http://aperto.unito.it”). Nel caso di Sistema Piemonte l’accesso ai dati è
possibile dopo essersi registrati ed aver spedito una richiesta via posta elettronica. A
registrazione avvenuta abbiamo provato due volte a fare una richiesta scritta che, a distanza
di tre mesi, non ha ricevuto alcuna risposta;
•
a differenza di quanto avviene in altri Paesi l’accesso al materiale didattico universitario è
precluso a chi non sia iscritto all’università
•
in alcuni siti (es. Sistema Piemonte) non è permesso scaricare dati se non si ha un particolare
browser, cosa che, di fatto, pone un limite di natura tecnologica, all’accesso;
•
esistono siti internet (ad es. AlmaLaurea e siti cartografici) per cui l’accesso al dato
pubblico è a pagamento;
Riutilizzo:
•
L’eterogeneità dei formati rende difficile la combinazione dei dati, che dovrebbe essere una
delle finalità della digitalizzazione per valorizzare i dati stessi e creare nuovi “pacchetti di
informazione” con un approccio più integrato. Molti dati sono in formato pdf (alcune volte
html) e questo ne rende difficile la rielaborazione, soprattutto quando si tratta di valori
numerici;
•
le condizioni per il riutilizzo sono spesso nebulose e talvolta addirittura assenti; la maggior
parte dei siti è coperto dal diritto d’autore e questo può incidere sull’effettivo riutilizzo,
sebbene questa esclusiva non copra i contenuti, bensì la forma espressiva.
Accesso e riutilizzo:
•
Mancanza di continuità nelle serie storiche e nei rapporti di ricerca, che spesso vengono fatti
(o pubblicati online) una tantum e non permettono di fare delle considerazioni approfondite
che potrebbero invece derivare dal confronto intertemporale.
Sviluppi del progetto di mappatura
Il lavoro di mappatura fin qui svolto, sebbene parziale e non finalizzato ad una tassonomia completa
dell’informazione pubblica on-line, è ora disponibile sul sito http://it.ckan.net, la versione italiana
del Comprehensive Knowledge Archive Network, dove potrà essere ampliato con il contributo di
tutti. CKAN è infatti un database che facilita la ricerca, la condivisione ed il riuso di contenuti e dati
aperti, combinando tra loro le caratteristiche di un catalogo, di un indice di pacchetti e di un wiki.
Il software ed il sito web di CKAN sono sviluppati e mantenuti dall'Open Knowledge Foundation, e
tutto il materiale disponibile su CKAN è aperto e può essere liberamente usato, riutilizzato e
redistribuito.
Bibliografia
Commissione Europea (1998), L’informazione del settore pubblico: una risorsa fondamentale per
l’Europa. Libro verde sull’informazione del settore pubblico nella società dell’informazione
Dipartimento per le politiche comunitarie (1999), L’informazione del settore pubblico nella società
dell’informazione. La posizione del settore pubblico in Italia, pp.1-11.
Organisation for Economic Co-operation and Development (2006), Digital broadband content:
public sector information and content, pp. 1-82