Email Print Twitter Facebook Google LinkedIn
Blogger / Marketing / Open Data / Strategia

A cosa servono (davvero) i metadati ?

Data about data about data about data about data..
3 minuti di lettura

La notizia gira da qualche settimana, finalmente è online in beta il portale europeo degli opendata. C’è stato un cinguettare incessante sull’evento, ma poche revisioni, pochi commenti. E invece c’è da andar giù pesante perché quest’anno, forse, riusciremo a vedere la nascita di processi lettura/scrittura via API e EndPoint SPARQL tra i diversi datastore (dal livello europeo, a quello nazionale  fino a quello comunale). Questo permetterà un notevole risparmio di energie e tempo non solo in fase di pubblicazione e aggiornamento, ma anche in fase di verifica sull’interoperabilità dei dati prodotti.

Ne stavo parlando con @philarcher1, eGov consultat presso il W3C, che ha scritto una bellissima review del portale, dai dataset contenuti al livello di esposizione. Sia chiaro, qui nessuno vuole la gogna. D’altra parte è in beta e il lavoro da affrontare è considerevole. Però quando vedo scritto:

 

The SparQL endpoint can be used to query all dataset metadata available on the EC Open Data Portal.

  • European Commission Open Data Portal metadata vocabulary

This metadata vocabulary (using DCAT and DCT vocabularies) is provided as a worksheet specification and as an ontology. It is aligned in general terms to be compatible with ADMS

La prima cosa che mi viene in mente è <Benissimo, hanno utilizzato gli ADMS del progetto JoinUp di raccolta dei vocabolari nazionale per fornirci finalmente un datastore ben descritto>. E invece, query dopo query, ci si accorge che qualcosa non va e che i metadati non sembrano associati ai dati dell’RDF Datastore. Prendo uno a caso nella pagina principale, “Psychiatric care beds in hospitals”, che sembra esser descritto da un cospicuo numero di informazioni a contorno. Lancio quache query sui metadati del dataset per verificare che sia davvero così, ad esempio ricercandolo dall’ID o dall’URI o dalla data di modifica.

prefix dcterms: <http://purl.org/dc/terms/>
prefix xsd: <http://www.w3.org/2001/XMLSchema#>
select distinct ?s
where {
?s dcterms:identifier “tps00047″^^xsd:string
}

prefix dcterms: <http://purl.org/dc/terms/>
prefix xsd: <http://www.w3.org/2001/XMLSchema#>
select distinct ?s
where {
?s dcterms:Modified “2012-12-20″^^xsd:date
}

Un bel niente, pulito pulito. Facciamo un tentativo per Label, magari andiamo a vedere che mi tira giù per quanto riguarda l’Italia.

 

 

 

prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#>
select distinct ?s ?label
where {
?s rdfs:label ?label
FILTER (regex(?label, “Italy”))
}

..e finalmente qui i dati scorrono a fiumi (benedetto sia LOD2project). Ma Phil mi fa notare che, nel mentre, lui stava cercando dati sul progetto “NACE”. Trovati sì nella sezione dati, ma la sua pesca è andata meno bene nel datastore, che gli ha prontamente restituito i dati del progetto “paNACEa”. Morale della favola: avere i LOD non basta per raggiungere l’interoperabilità semantica. I dati sono un po’ come il cervello: ti rispondono se gli fai la giusta domanda. Ma per farlo serve un vocabolario condiviso e strutturato. (Dato) è sempre (Dato + metadato).

 

“The valuable undercurrents in the ocean of data that we are accumulating are invisible to the computationally-naked eye, so more and better technology will help. However, because the problem with big data is small patterns, ultimately, the game will be won by those who “know how to ask and answer questions” (Plato, Cratylus, 390c), and hence know which data may be useful and relevant, and so worth collecting and curating, in order to exploit their valuable patterns.”  (Luciano Floridi)

 

La sfida dei big data è una sfida epistemologica. Saremo all’altezza del compito o dobbiamo aspettare il prossimo Platone?

Email Print Twitter Facebook Google LinkedIn
Foto del profilo di Andrea Raimondi
Studente di Dottorato all'Università di Nottingham. Mi occupo di filosofia dell scienza e metafisica, almeno in dipartimento. Di notte, torno ad essere uno specialista opendata e un civic hacker. Progetto attività di ricerca e strumenti di innovazione sociale basati su dati governativi (aperti e non).

Cosa ne pensi?

Il tuo indirizzo email non verrà pubblicato. Campi richiesti *

Puoi usare questi HTML tags e attributi: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

Lost Password

Register