la mappatura delle informazioni del settore pubblico
Transcript
la mappatura delle informazioni del settore pubblico
LA MAPPATURA DELLE INFORMAZIONI DEL SETTORE PUBBLICO L’informazione del settore pubblico La definizione di informazione detenuta dal settore pubblico varia nei diversi Stati. Non esiste, infatti, una terminologia universalmente riconosciuta e adottata per definire l’informazione pubblica e i suoi sotto-insiemi1 , in quanto manca una definizione uniforme di settore pubblico. Nella giurisprudenza e nei dibattiti sull’accesso all’informazione del settore pubblico si delineano tre possibili approcci2: • l’approccio funzionale, secondo il quale il settore pubblico comprende enti che hanno autorità o compiti di pubblico servizio; • l’approccio legalista-istituzionale, per cui hanno carattere di settore pubblico solo gli enti esplicitamente elencati nelle leggi ad essi relative; • l’approccio finanziario, secondo il quale il settore pubblico comprende tutti gli enti finanziati principalmente da fondi pubblici (che non agiscono, quindi, secondo le normali regole del mercato). In questo lavoro di mappatura l’informazione del settore pubblico è, latu sensu, ogni tipo di informazione che è prodotta e/o raccolta da un’ istituzione pubblica nell’ambito delle attività che fanno parte del suo mandato 3,. In altre parole consideriamo tutte le organizzazioni e i soggetti (amministrazioni, enti, agenzie, società) le cui finalità istituzionali generano e presuppongono l’acquisizione, la conservazione, l’elaborazione, la raccolta sistematica e la possibile diffusione di informazioni che rivestono particolare interesse4. Naturalmente questo non esclude la possibilità che vi siano dati raccolti “incidentalmente” dalle istituzioni e che questi dati possano rivestire una qualche importanza e quindi essere inclusi nel nostro lavoro di mappatura. 1 Organisation for Economic Co-operation and Development (2006), Digital broadband content: public sector information and content, pp. 1-82 2 Commissione Europea (1998), L’informazione del settore pubblico: una risorsa fondamentale per l’Europa. Libro verde sull’informazione del settore pubblico nella società dell’informazione 3 Vedi nota 1 4 Dipartimento per le politiche comunitarie (1999), L’informazione del settore pubblico nella società dell’informazione. La posizione del settore pubblico in Italia, pp.1-11. In particolare la mappatura è stata condotta sui siti internet che detengono informazioni del settore pubblico. Il processo di digitalizzazione di tali informazioni dovrebbe facilitarne l’accesso, ma anche la possibilità di valorizzazione e di combinazione con dati provenienti da fonti diverse (alcuni dati ut singuli hanno poca rilevanza, mentre diventano di maggiore interesse se combinati con altri dati) . In questo modo dovrebbe essere possibile creare nuovi “pacchetti di informazioni” che utilizzano i dati del settore pubblico come materia prima. La fruibilità collettiva e sociale di queste informazioni può creare un valore aggiunto in vari ambiti:economico-produttivo, culturale, scientifico, di ricerca, di concertazione pubblico-privato, di programmazione delle politiche pubbliche, ecc. Classificazione La mappatura è stata fatta a partire dalla classificazione dell’Organizzazione per la Cooperazione e lo Sviluppo Economico (OCSE) presente nel rapporto di ricerca “Digital Broad Content: Public Sector Information and Content” pubblicato nel 2006 dal gruppo di lavoro sull’Economia dell’Informazione. La prima macro distinzione riguarda l’informazione del settore pubblico e il contenuto pubblico. L’informazione è definibile come una grandezza flusso, che ha la caratteristica di essere dinamica e continuamente generata dal settore pubblico per il funzionamento dello stesso e prontamente utilizzabile per fini commerciali (ad esempio i dati meteorologici, le statistiche di business, i dati demografici, ecc.). Il contenuto è invece definibile come una grandezza stock, che ha la caratteristica di essere statica e detenuta dal settore pubblico piuttosto che direttamente generata da esso. Inoltre il contenuto pubblico non è direttamente associato con il funzionamento del governo e non è neppure necessariamente utilizzato per fini commerciali, ma piuttosto di istruzione e di cultura (ad esempio gli archivi culturali, i beni artistici, ecc.). Nella classificazione OCSE i dati pubblici sono divisi in: • informazioni geografiche; • informazioni meteorologiche e ambientali; • informazioni economiche e di business; • informazioni sociali; • traffico e trasporto; • turismo e tempo libero; • agricoltura, coltivazioni, foreste e pesca; • risorse naturali; • sistema legale; • informazioni scientifiche e sulla ricerca; • contenuti legati al mondo accademico; • contenuti politici; • contenuti culturali. Ognuna delle categorie sopra menzionate è a sua volta suddivisa in sotto-categorie, per la cui descrizione dettagliata rimandiamo alla tabella 1. Tabella 1. Classificazione dati della pubblica amministrazione Descrizione analitica della tassonomia La tassonomia dell’informazione detenuta dal settore pubblico è stata condotta su due livelli: regionale (Piemonte) e nazionale (Italia). Partendo dalla classificazione OCSE si sono mappati i principali siti internet che contengono informazioni detenute dal settore pubblico. In particolare le informazioni raccolte a livello regionale si riferiscono a: • nome dell’istituzione; • indirizzo web; • tipo di dati; • formato elettronico del dato (es. excel, word, pdf, ecc.) • periodicità del dato (mensile, trimestrale, semestrale, annuale, ecc.); • anni in cui i dati sono disponibili; • formato del dato (es. numerico, descrittivo, cartografico, ecc.); • estraibilità e riutilizzabilità del dato: − è possibile l’estrazione?; − è facile o difficile l’estrazione?; − si possono estrarre tutti i dati?; − i dati si posso riutilizzare o ci sono dei limiti tecnici/giuridici? A livello regionale sono stati mappati quaranta siti internet. Le informazioni raccolte a livello nazionale invece sono: • sito internet; • tipologia di dati; • nome dell’istituzione; • anni in cui i dati sono disponibili; • diritti di proprietà intellettuale sulle banche dati; • fonte del dato; • descrizione qualitativa del dato. A livello nazionale sono stati mappati settanta siti internet. Principali osservazioni Dalla mappatura è emersa con chiarezza una generale tendenza alla mancanza di omogeneità che riguarda sia l’accesso al dato sia il suo riutilizzo. Di seguito evidenziamo i casi più emblematici sia a livello regionale sia a livello nazionale. Accesso: • Difficoltà di accesso ad informazioni contenute in siti internet ove occorre seguire una procedura di registrazione in cui si richiede all’utente una lunga serie di dati personali, come un documento di identità e il codice fiscale (ad esempio sul sito di Sistema Piemonte “http://www.sistemapiemonte.it” o su quello dell’archivio istituzionale dell’Università degli Studi di Torino “http://aperto.unito.it”). Nel caso di Sistema Piemonte l’accesso ai dati è possibile dopo essersi registrati ed aver spedito una richiesta via posta elettronica. A registrazione avvenuta abbiamo provato due volte a fare una richiesta scritta che, a distanza di tre mesi, non ha ricevuto alcuna risposta; • a differenza di quanto avviene in altri Paesi l’accesso al materiale didattico universitario è precluso a chi non sia iscritto all’università • in alcuni siti (es. Sistema Piemonte) non è permesso scaricare dati se non si ha un particolare browser, cosa che, di fatto, pone un limite di natura tecnologica, all’accesso; • esistono siti internet (ad es. AlmaLaurea e siti cartografici) per cui l’accesso al dato pubblico è a pagamento; Riutilizzo: • L’eterogeneità dei formati rende difficile la combinazione dei dati, che dovrebbe essere una delle finalità della digitalizzazione per valorizzare i dati stessi e creare nuovi “pacchetti di informazione” con un approccio più integrato. Molti dati sono in formato pdf (alcune volte html) e questo ne rende difficile la rielaborazione, soprattutto quando si tratta di valori numerici; • le condizioni per il riutilizzo sono spesso nebulose e talvolta addirittura assenti; la maggior parte dei siti è coperto dal diritto d’autore e questo può incidere sull’effettivo riutilizzo, sebbene questa esclusiva non copra i contenuti, bensì la forma espressiva. Accesso e riutilizzo: • Mancanza di continuità nelle serie storiche e nei rapporti di ricerca, che spesso vengono fatti (o pubblicati online) una tantum e non permettono di fare delle considerazioni approfondite che potrebbero invece derivare dal confronto intertemporale. Sviluppi del progetto di mappatura Il lavoro di mappatura fin qui svolto, sebbene parziale e non finalizzato ad una tassonomia completa dell’informazione pubblica on-line, è ora disponibile sul sito http://it.ckan.net, la versione italiana del Comprehensive Knowledge Archive Network, dove potrà essere ampliato con il contributo di tutti. CKAN è infatti un database che facilita la ricerca, la condivisione ed il riuso di contenuti e dati aperti, combinando tra loro le caratteristiche di un catalogo, di un indice di pacchetti e di un wiki. Il software ed il sito web di CKAN sono sviluppati e mantenuti dall'Open Knowledge Foundation, e tutto il materiale disponibile su CKAN è aperto e può essere liberamente usato, riutilizzato e redistribuito. Bibliografia Commissione Europea (1998), L’informazione del settore pubblico: una risorsa fondamentale per l’Europa. Libro verde sull’informazione del settore pubblico nella società dell’informazione Dipartimento per le politiche comunitarie (1999), L’informazione del settore pubblico nella società dell’informazione. La posizione del settore pubblico in Italia, pp.1-11. Organisation for Economic Co-operation and Development (2006), Digital broadband content: public sector information and content, pp. 1-82