Da qualche tempo si parla molto di Open Data ma il discorso molte volte si confonde tra "buzzword" e normative; ecco il filo d'arianna per non perdersi.

Open Data e Linked Data: cosa sono e come pubblicarli

Da qualche tempo si parla molto di Open Data ma il discorso molte volte si confonde tra "buzzword" e normative; ecco il filo d'arianna per non perdersi.

Il termine Open Data si riferisce all'idea che certi dati debbano essere diffusi in forma libera e senza restrizioni nel loro uso. Tale concetto è quindi parallelo a quelli più conosciuti di Open Source e Software Libero.

Ad estendere l'idea di Open Data ci ha pensato niente meno che Tim Berners-Lee introducendo, verso il 2009, il termine Linked Data e di conseguenza Linked Open Data.

Secondo Berners-Lee le informazioni non devono essere semplicemente accessibili, ma essere strutturate ed interconnesse tra di loro affinché possano essere processate automaticamente da un computer per essere veramente utili. Solo attraverso la strutturazione semantica e l'interconnessione i dati grezzi acquistano un maggior valore ed un reale significato.

Cosa pubblicare

Quali siano le informazioni da pubblicare dipende molto dall'organizzazione che le pubblica. Principalmente sono gli enti pubblici che si stanno interessando agli Open Data in seno a tematiche più ampie quali trasparenza ed e-government.

È infatti il settore pubblico ad avere a disposizione una mole considerevole di dati (appunto) pubblici che possono, e devono, essere resi disponibili liberamente; esistono già delle normative italiane che regolano quali dati siano da pubblicare obbligatoriamente. Si pensi, per esempio, alla pubblicazione delle informazioni riguardanti gli atti amministrativi e le informazioni rese pubbliche nella sezione amministrazione trasparente.

A partire dal 2003 a livello europeo sono state introdotte inoltre delle direttive per  la pubblicazione ed il riuso dei dati e informazioni del settore pubblico (vedi PSI Directive: European legislation on reuse of public sector information).

Come pubblicare i Linked Open Data

Il primo e fondamentale passo verso la pubblicazione dei dati, è di introdurre e pubblicare una Data policy basandosi sui principi fondamentali degli Open data. Secondo questi principi i dati dovranno essere:

  1. Completi: tutti i dati pubblici devono essere disponibili. Con dati pubblici si intendono tutti quei dati che non sono soggetti a particolari limitazioni per questioni di privacy o sicurezza
  2. Base/primari: i dati devono essere presi dalla fonte con la più alta granularità possibile, non devono essere aggregati o modificati in alcuna forma
  3. Tempestivi: i dati devono essere resi disponibili il più velocemente possibile per conservare il valore dei dati stessi.
  4. Accessibili: i dati devono essere accessibili dal maggior numero di utenti e per il maggior numero i scopi
  5. Leggibili da un computer: i dati devono essere strutturati affinché sia possibile processarli automaticamente
  6. Non discriminatori: I dati devono essere disponibili a chiunque senza necessità di registrazione
  7. Non proprietari: i dati devono essere disponibili in un formato aperto ovvero dove il controllo sul formato non sia asclusivo di una sola entità.
  8. Liberi da licenze: i dati non devono essere soggetti a particolari copyright, brevetti o marchi registrati. Sono consentite però licenze che garantiscano l'accesso ai dati (vedi più sotto)

fonte - https://public.resource.org/8_principles.html

Una volta abbracciati questi concetti possiamo valutare che livello di pubblicazione vogliamo raggiungere. I differenti livelli sono stati codificati da Tim Berners-Lee attraverso la seguente scala (vedi http://www.w3.org/DesignIssues/LinkedData.html):

   Disponibili sul web in un qualsiasi formato ma con una licenza open per essere open data
★★  Disponibili e strutturati in un formato leggibilie da un computer (per esempio in formato excel piuttoscto che l'immagine derivata dalla scansione di una tabella)
★★★ Oltre ai punti precedenti i dati sono disponibili in un formato non proprietario (per esempio CSV al posto di Excel)
★★★★ Oltre a tutti i punti precedenti vengono usati gli standard del W3C (RDF and SPARQL) per identificare i dati (aggiungere significato ai dati)
★★★★★ Oltre a tutti i punti precedenti i dati devono essere inoltre interconnessi con altri dati forniti differenti soggetti per fornire ai dati un contesto più ampio.

5 passi per gli open data

Licenze Open Data

Le licenze con cui pubblicare i propri Open Data sono molte e sicuramente sarebbe molto complesso analizzarle tutte. Di base è utile sapere che queste licenze mirano a garantire l'accessiblità delle informazioni ed il loro libero riuso.

Come per le licenze in ambito Software Libero esse sono una forma di copy-left ovvero assegnano ai dati un diritto di autore che al posto di restringere l'uso dei dati lo allargano e lo garantiscono.

Le licenze da applicare ai dati potrebbero anche non essere specifiche per gli Open Data, per esempio quelle Creative Commons ma è consigliato usare quelle più specifiche come la ODC (Open Data Commons - vedi: http://opendatacommons.org/licenses/).

In Italia il sito - http://www.dati.gov.it - ha pubblicato la licenza IODL (Italian Open Data License) che è la licenza sugerita per i dati degli organismi pubblici in Italia. (vedi http://www.dati.gov.it/content/italian-open-data-license-domande-e-risposte)

Conclusioni

La pubblicazione degli Open Data non dev'essere pensata come un progetto che ha un inizio ed una fine, bensì si deve intendere come un processo costante che, una volta iniziato, attraverso piccoli passi dovrà evolversi nel tempo.

Certo è che la pubblicazione dei dati ha dei costi piuttosto bassi che permettono a chiunque di raggiungere facilmente le prime tre stelle viste sopra (tali stelle sono quelle necessaria per allinarsi alla direttiva europea). Per farlo è sufficiente pubblicare i dati sul proprio sito web in un formato aperto ed associargli una licenza specifica per gli Open Data.

Il raggiungimento degli step successivi è comunque leggermente più complesso e necessita di una maggiore comprensione dei propri dati.

Nel mondo esistono inoltre applicazioni dedicate alla pubblicazione degli Open Data quali CKAN, Virtuoso ecc. che vedremo più avanti in un altro post.

Maggiori dettagli ed interessanti spunti li puoi trovare all'interno del Webinar proposto da Abstract e tenuto da Antonio De Marinis - Open Data e Open Source

Se vuoi approfondire le problematiche legate agli Open Data o hai bisogno di consigli per pubblicare i tuoi dati, contattaci, saremo lieti di affiancarti in questo interessante processo.

Share this on

Share |

On same topics

Commenti

comments powered by Disqus