Web 2.0 – Modulo B Web 2.0 e Semantic Web
Transcript
Web 2.0 – Modulo B Web 2.0 e Semantic Web
Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 = ? + Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 Indice 1 Introduzione 2 Web 2.0 3 Semantic Web 4 Semantic Web e Web 2.0 Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 Web 2.0 e Semantic Web I Per quanto le applicazioni del Web 2.0 garantiscano agli utenti finali un ruolo di primo piano, fornendo gli strumenti per la pubblicazione e condivisione di contenuti e impiegando il Web come uno spazio “sociale”, abbiamo visto che molti problemi rimangono aperti Uno di questi – quello che probabilmente ha maggiori implicazioni – riguarda il fatto che gli ambienti attuali del Web 2.0 sono sostanzialmente “chiusi”: cioè, i contenuti prodotti dagli utenti finali, le loro reti di conoscenze, etc., sono accessibili solo attraverso uno specifico servizio, ma non dall’esterno Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 Web 2.0 e Semantic Web II Una delle conseguenze è la difficoltà di garantire interoperabilità tra servizi del Web 2.0: ciò significa che non è possibile avere una vista complessiva delle informazioni pubbliche relative a un utente Un’altra importante conseguenza è l’impossibilità di garantire agli utenti finali un’identità che persista indipendentemente dal servizio impiegato Non si tratta solo di semplificare agli utenti le procedure di autenticazione: analogamente all’interoperabilità, un’identità persistente garantisce l’accesso a tutte le informazioni pubbliche relative a un utente, e la loro accountability Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 Web 2.0 e Semantic Web III In aggiunta, attraverso di essa è possibile valutare in modo più accurato l’affidabilità di un utente, sia dal punto di vista globale (reputazione) che locale (trust) Come si è visto, questo aspetto è fondamentale per poter determinare quanto siano affidabili le informazioni generate e condivise attraverso la piattaforma del Web 2.0, identificando più facilmente comportamenti scorretti Finora queste problematiche sono state affrontate attraverso soluzioni ad hoc, che riguardano principalmente la pubblicazione di interfacce standard per l’accesso ai servizi, oppure strumenti per esportare/importare le informazioni archiviate da un servizio in un altro Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 Web 2.0 e Semantic Web IV Ciò che servirebbe è invece un framework standard di interscambio, che permetta l’aggregazione delle informazioni disponibili sui diversi servizi e per garantire l’identità persistente di un utente A tal scopo, il Semantic Web può essere uno dei candidati più adatti: non solo garantisce un formato standard per l’interscambio e la manipolazione dei dati (la famiglia XML), ma anche strumenti per il collegamento e l’aggregazione di sorgenti dati distribuite (RDF) e la loro analisi attraverso il ragionamento automatico (OWL) Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 Web 2.0 e Semantic Web V In aggiunta, l’architettura a layer del Semantic Web prevede anche meccanismi standardizzati per il calcolo del trust e strumenti crittografici che possono essere impiegati efficacemente per risolvere le problematiche di affidabilità e protezione delle informazioni nel Web 2.0 Infine il Semantic Web permette di supportare funzionalità, attualmente non disponibili nel Web 2.0, attraverso l’impiego di regole Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 Web 2.0 e Semantic Web VI Si è detto frequentemente che è necessario permettere agli utenti finali di esprimere politiche di protezione dei dati personali e delle risorse che vengono pubblicate e condivise Un’altra funzionalità fondamentale è però la possibilità di specificare preferenze, che possono essere impiegate per denotare quali informazioni sono affidabili secondo me (ad es., assegnando loro un peso diverso dipendentemente all’identità e/o alle caratteristiche degli autori di tali informazioni) La piattaforma del Web 2.0 fornisce, potenzialmente, tutte le informazioni necessarie per poter applicare politiche e preferenze, a patto, ovviamente, che queste siano accessibili attraverso un formato standard Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 Web 2.0 e Semantic Web VII Le regole, grazie alla loro flessibilità, sono esattamente la tecnologia che permette la specifica sia di politiche di protezione dei dati che preferenze Il RIF, quindi, fornendo un formato di interscambio per i linguaggi a regole esistenti, permetterebbe una codifica standard di regole che potrebbero essere facilmente utilizzate e applicate indipendentemente dal specifico servizio Web 2.0 Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 È possibile integrare Web 2.0 e Semantic Web? Ci sono due ordini di problemi: Il primo problema è che, attualmente, sono stati definiti linguaggi e protocolli solo per alcuni dei layer del Semantic Web Ad es., le specifiche del RIF sono ancora in stato di Working Draft, e ci vorrà del tempo prima che vengano adottate Il secondo problema è che, perché il Semantic Web possa funzionare, è necessario l’acquisizione di una quantità sufficientemente grande di dati Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 Il Web 2.0 come base di conoscenza I In realtà, il Web 2.0 offre una piattaforma ideale per l’acquisizione di informazioni Il fatto che sono gli utenti finali a creare e condividere informazioni attraverso le applicazione del Web 2.0 ha diversi vantaggi: Dato il numero elevato di utenti finali, le informazioni acquisite saranno quantitativamente proporzionali Saranno disponibili più informazioni sulle stesse risorse, espressione dei diversi punti di vista degli utenti finali – un aspetto che riflette la open world assumption adottata da RDF e dai layer che si basano su esso Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 Il Web 2.0 come base di conoscenza II Sarà possibile avere informazioni aggiornate sulle risorse: ciò garantisce l’allineamento tra risorse e metadati, in un contesto in cui il contenuto e/o le caratteristiche delle risorse variano frequentemente – e questo è un problema che ha finora limitato l’utilità e la diffusione dei metadati Il problema non è quindi come acquisire informazioni, ma come poterle rappresentare con le tecnologie del Semantic Web Da questo punto di vista possiamo classificare le informazioni disponibili attraverso la piattaforma Web 2.0 in due gruppi: 1 2 Dati strutturati, archiviati e gestiti da servizi centralizzati (ad es., dati personali e relazioni nelle reti sociali) Dati non strutturati pubblicati dai servizi del Web 2.0 (ad es., blog, immagini, testi, presentazioni, video, etc.) Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 Il Web 2.0 come base di conoscenza III I dati strutturati sono facilmente trasformabili nei formati di interscambio forniti dalle tecnologie del Semantic Web Per quanto riguarda i dati non strutturati, è invece difficile poterli rappresentare in modo da classificarli efficacemente Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 “Come il Semantic Web è usato” I Attualmente le tecnologie del Semantic Web sono utilizzate abbastanza ampiamente In particolare, l’XML è un linguaggio utilizzato per le applicazioni più svariate, e molti DBMS permettono di archiviare dati e/o esportarli in tale formato Anche l’RDF ha riscosso un buon successo, sebbene non sia paragonabile a quello dell’XML Attualmente esistono diverse applicazioni in grado i manipolare dai RDF, e ci sono anche esempi di DBMS basati su RDF (come Sesame: http://www.openrdf.org/) L’OWL ha invece una diffusione per ora piuttosto limitata Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 “Come il Semantic Web è usato” II È tuttavia significativo che abbiano riscosso un notevole successo proprio quelle tecnologie del Semantic Web che hanno un legame diretto con il Web 2.0 In particolare, possiamo citare FOAF, RDFa e i Microformat Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 FOAF (Friend of a Friend) I FOAF [Brickley and Miller, 2007] è, semplicemente, una ontologia OWL grazie alla quale è possible descrivere il profilo di un agente (una persona, un gruppo di persone, un’organizzazione) Dal momento in cui è stato pubblicata la sua prima versione, ha riscosso un sempre maggiore successo tra gli utenti finali, determinando la crescita esponenziale di profili FOAF disponibili sul Web [Ding et al., 2005] Ci sono due caratteristiche di FOAF che hanno contribuito a renderlo popolare Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 FOAF (Friend of a Friend) II In FOAF, la proprietà owl:seeAlso è utilizzata per collegare tra loro profili FOAF dello stesso utente: grazie a ciò, un crawler è in grado di ricostruire il profilo completo dell’utente, integrando tra loro profili distribuiti FOAF inoltre definisce una proprietà (che abbiamo spesso citato) foaf:knows, che si utilizza per denotare una relazione esistente tra utenti: ciò significa che è possibile costruire il grafo di una rete sociale basandosi esclusivamente su informazioni disponibili nei profili FOAF degli utenti Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 FOAF (Friend of a Friend) III Il successo di FOAF ha determinato la nascita di ulteriori iniziative per rendere tale tecnologia più flessibile Ad es., si è studiata la possibilità di applicare firme digitali a profili FOAF, sono state definite estensioni all’ontologia1 , e un numero sempre maggiore di applicazioni usa FOAF per rappresentare dati degli utenti (vd. D-FOAF), o come formato per importarli ed esportarli 1 Si veda, ad es., il vocabolario RELATIONSHIP [Davis and Jr., 2005] che definisce un insieme di sottoproprietà di foaf:knows per denotare il tipo di relazione esistente tra utenti. Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 Un esempio di profilo FOAF 1 2 3 4 5 6 7 8 9 10 11 < f o a f : P e r s o n r d f : I D ="me"> <f o a f : n a m e>Andr ea P e r e g o</ f o a f : n a m e> <f o a f : m b o x _ s h a 1 s u m>7 e 2 a 7 3 c d e b a 8 a 2 a 0 1 2 d b 7 5 . . . </ f o a f : m b o x _ s h a 1 s u m> <f o a f : h o m e p a g e r d f : r e s o u r c e =" h t t p : //www . di c om . u n i n s u b r i a . i t /~ a n d r e a . p e r e g o / " /> <f o a f : w o r k p l a c e H o m e P a g e r d f : r e s o u r c e =" h t t p : //www . di c om . u n i n s u b r i a . i t / daw sec / " /> <fo af :publ i cati on s r d f : r e s o u r c e =" h t t p : //www . i n f o r m a t i k . u n i − t r i e r . de /~ l e y / db / . . . " /> <f o a f : a c c o u n t P r o f i l e P a g e r d f : r e s o u r c e =" h t t p : //www . l i n k e d i n . com/ i n / a p e r e g o / " /> <f o a f : k n o w s r d f : r e s o u r c e =" h t t p : //www . di c om . u n i n s u b r i a . i t / daw sec / f o a f / b a r b a r a . . . " /> <f o a f : k n o w s r d f : r e s o u r c e =" h t t p : //www . di c om . u n i n s u b r i a . i t / daw sec / f o a f / e l e n a . . . " /> ... </ f o a f : P e r s o n> Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 RDFa, Microformat e GRDDL I Con FOAF siamo però ancora nell’ambito di dati strutturati, che adottano un formato non facile da usare a chi non conosca RDF RDFa (RDF - in - attributes) [Adida and Birbeck, 2008] e i Microformat (http://microformats.org/) sono tecnologie che permettono di annotare il codice (X)HTML, includendo enunciati RDF in una pagina Web attraverso l’uso di specifici attributi Tali enunciati possono essere estratti dalla pagina utilizzando GRDDL (Gleaning Resource Descriptions from Dialects of Languages) [Connolly, 2007], una tecnologia che, analogamente a XSLT, applica regole di trasformazione su un documento XML, ma con lo scopo di ottenere un grafo RDF Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 RDFa, Microformat e GRDDL II Il vantaggio di GRDDL è che non è necessario esplicitare quali regole di trasformazione applicare su un documento XML: tali regole sono invece associate al namespace che denota gli elementi/attributi usati per annotare un documento XML, e vengono applicate automaticamente Ciò significa anche che l’autore di un documento XML non deve occuparsi di specificare le regole di trasformazione, ma riutilizza quelle già associate a un dato namespace Ora, poiché la maggior parte dei dati non strutturati del Web 2.0 sono codificati in (X)HTML, queste tecnologie, se impiegate in modo appropriato dagli utenti finali, permetterebbero di classificare efficacemente anche tali informazioni Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 RDFa: un esempio Una annotazione RDFa: 1 2 3 4 5 < d i v t y p e o f=" f o a f : P e r s o n " x m l n s : f o a f=" h t t p : // x m l n s . com/ f o a f / 0 . 1 / "> <p p r o p e r t y=" f o a f : n a m e "> A l i c e B i r p e m s w i c k</ p> <p>E m a i l : <a r e l =" f o a f : m b o x " h r e f=" m a i l t o : a l i c e @ e x a m p l e . com">a l i c e @ e x a m p l e . com</ a></ p> <p>P h o n e : <a r e l =" f o a f : p h o n e " h r e f=" t e l : +1−617−555−7332">+1 6 1 7 . 5 5 5 . 7 3 3 2 </ a></ p> </ d i v> . . . e il grafo RDF (serializzato in XML) che si ottiene applicando la trasformata GRDDL: 1 2 3 4 5 < f o a f : P e r s o n> <f o a f : n a m e> A l i c e B i r p e m s w i c k</ f o a f : n a m e> <f o a f : m b o x r d f : r e s o u r c e =" m a i l t o : a l i c e @ e x a m p l e . com" /> < f o a f : p h o n e r d f : r e s o u r c e =" t e l : +1−617−555−7332" /> </ f o a f : P e r s o n> Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 Conclusioni I L’integrazione tra Web 2.0 e Semantic Web offre indiscutibili vantaggi Il Semantic Web permetterebbe di garantire nel Web 2.0 l’interoperabilità dei dati, e gli strumenti necessari per poterne valutare l’affidabilità D’altro canto, il Web 2.0 fornisce al Semantic Web la soluzione all’acquisizione dei dati, coinvolgendo direttamente in questo sforzo gli utenti finali Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 Conclusioni II Un ulteriore beneficio che il Web 2.0 potrebbe apportare al Semantic Web è l’incentivo a completare e/o estendere il framework a fronte di bisogni concreti In sostanza, l’integrazione tra Web 2.0 e Semantic Web costituirebbe il primo, effettivo passo verso quella dimensione sociale e partecipativa che, sin dagli inizi, è stata associata al Web Andrea Perego Corso Web 2.0 – Modulo B Introduzione Web 2.0 Semantic Web Semantic Web e Web 2.0 Riferimenti bibliografici I Adida, B. and Birbeck, M. (2008). RDFa primer: Bridging the human and data webs. W3C Working Group Note, W3C. http://www.w3.org/TR/xhtml-rdfa-primer/. Brickley, D. and Miller, L. (2007). FOAF vocabulary specification 0.91. Namespace Document. http://xmlns.com/foaf/spec/. Connolly, D. (2007). Gleaning resource descriptions from dialects of languages (GRDDL). W3C Recommendation, W3C. http://www.w3.org/TR/grddl/. Davis, I. and Jr., E. V. (2005). RELATIONSHIP: A vocabulary for describing relationships between people. Namespace Document. http://vocab.org/relationship/. Ding, L., Zhou, L., Finin, T. W., and Joshi, A. (2005). How the Semantic Web is being used: An analysis of FOAF documents. In HICSS-38 2005, page 113c. http://dx.doi.org/10.1109/HICSS.2005.299 . Andrea Perego Corso Web 2.0 – Modulo B