SEMANTIC WEB

Transcript

SEMANTIC WEB
Ing. Federico Chesani
SEMANTIC WEB
Outline
Outline
ƒ Introduzione a Semantic Web
à Caratterizzazione del World Wide Web odierno
à La proposta Semantic Web
à Architettura del Semantic Web
ƒ Informazione semantica (I): RDF e RDFS
ƒ Informazione semantica (II): OWL
ƒ Logiche, proof e trust
ƒ SW oggi: problemi e critiche
Il Web oggi (Web 1.0) …
ƒ I contenuti sono pubblicati su web per essere
“human-readable”
à Standard HTML concentrato su “come”
rappresentare i contenuti
à Nessun meccanismo per definire “cosa” si sta
rappresentando
à Alcuni tags (e.g. <title>) danno semantica
implicitamente ma …
‚ … il loro contenuto non è strutturato
‚ … il loro uso non è standardizzato
Il Web oggi (Web 1.0) …
Possiamo identificare il
titolo in base alla sua
presentazione (<h1>, <b>) …
… se domani il grafico
cambia il formato esterno
esterno, il
nostro programma non
funziona più!!!
<h1>
<!-- inizio TITOLO -->
<B>Finanziaria, il voto slitta a domani<br>
Al Senato va in scena l&#039;assurdo</B>
<!-- fine TITOLO -->
</h1>
Il Web oggi (Web 1.0) …
ƒ Le pagine contengono collegamenti (links) ad
altre pagine
à Nessuna informazione sul link …
‚ … cosa rappresenta
t un certo
t collegamento?
ll
t ?
‚ … cosa rappresenta la pagina/risorsa riferita da un
link?
Il Web oggi (Web 1.0) …
Actual Web = Layout + Routing
Problema: non è possibile ragionare in
modo automatico sui dati
Il Web oggi (Web 1.0) …
ƒ Web inteso come colossale archivio di dati,
interrogato ogni giorno da milioni di utenti
à L’accesso a tale archivio avviene tramite motori di
ricerca ed in base a keywords …
à … il successo di tale ricerca dipende da molti
fattori
‚ Bontà dell’algoritmo di ricerca
‚ Numero delle pagine indicizzate
‚ Contenuti/meta-contenuti delle pagine indicizzate
Il Web oggi (Web 1.0) …
ƒ Il web è universale
à Qualunque pagina può contenere collegamenti ad
altre pagine
à Approssimativamente,
Approssimativamente chiunque può pubblicare su
web riguardo qualunque argomento
‚ Decentralizzazione delle informazioni
‚ Inconsistenza delle informazioni
‚ Incompletezza delle informazioni
Semantic Web
Obiettivo: poter “utilizzare”/”ragionare su” la
enorme quantità di dati disponibili sul web in
maniera automatica
Come? Estendendo l’attuale web con
informazioni sul contenuto (informazioni
semantiche)
Proposto da Tim Berners-Lee nel 2001, in un articolo
pubblicato su Scientific American
Semantic Web
Principi che si vogliono salvaguardare:
ƒ Universalità del web
ƒ De-centralizzazione dell’informazione
ƒ Inconsistenza dell’informazione
à Inconsistenza dei contenuti
à Inconsistenza delle informazioni di routing (links)
ƒ Incompletezza dell’informazione
Aggiungere informazioni sul contenuto
Aggiungere informazioni sul contenuto non è
sufficiente
ƒ Tali informazioni devono essere opportunamente
strutturate (e.g., classificazione di Linneo per il mondo animale)
à Ontologie?
ƒ E’ necessario aggiungere anche regole di inferenza
(e.g., sillogismo aristotelico)
à Logica?
ƒ Applicando regole a dati si ottengono nuove
conoscenze
à Processo di prova (proof) con cui si dimostrano le
conclusioni
Proof e Trust
Le “proofs” usate per inferire nuove informazioni possono essere scambiate ed analizzate
per…
ƒ … giustificare
i tifi
i risultati
i lt ti ottenuti
tt
ti
ƒ … superare l’aspetto definitorio dell’IT
ƒ … ragionare ulteriormente sulla “fiducia”
riguardo i risultati ottenuti
à Le informazioni sul web sono (e saranno)
incoerenti, contradditorie ed incomplete
Standard
Assestati
Ricerca
Architettura del Semantic Web
SW – Applicazioni?
Qualche esempio …
ƒ Migliorare i sistemi di ricerca (e.g., Portale Vodafone)
ƒ Assistente remoto
ƒ Integrazione Database (ambito industriale)
ƒ Biblioteche ed archivi digitali (XMP Adobe)
ƒ Semantic Web Services
Identificazione dei concetti
ƒ In SW, i concetti vengono identificati tramite
URI (Uniform Resource Identifier)
à Gli URI sono per definizione un sistema di nomi
unici
à Ad
d ogni URI corrisponde
d uno ed
d un solo
l concetto…
à … però più URI possono definire lo stesso concetto!
à URI (non URL): non è necessario che vi corrisponda
un contenuto
Esempi di URI:
http://www.repubblica.it
[email protected]
ISBN 88-7750-483-8
Resource Description Framework
(RDF/RDFS)
ƒ Standard W3C
ƒ Linguaggio (XML based) per la rappresentazione
di conoscenza
ƒ Obiettivo:
Obietti o fornire uno
no strumento
str mento minimalista
ƒ Basato sul concetto di tripla:
< soggetto, predicato, oggetto >
< risorsa, attributo, valore >
ƒ Diverse rappresentazioni possibili (N3, Grafo,
RDF/XML)
RDF – Rappresentazione a grafo
ƒ Un nodo per il soggetto
ƒ Un nodo per l’oggetto
ƒ Un arco etichettato per il predicato
http://www.example.org/index.html has a
creator whose value is John Smith
RDF – Rappresentazioni
RDF – Rappresentazioni
<rdf:RDF
xmlns:rdf=http://www.w3.org/1999/02/22-rdf-syntax-ns#
xmlns:contact=http://www.w3.org/2000/10/swap/pim/contact#
>
<contact:Person
rdf:about="http://www.w3.org/People/EM/contact#me">
<contact:fullName>Eric Miller</contact:fullName>
<contact:mailbox rdf:resource="mailto:[email protected]"/>
<contact:personalTitle>Dr.</contact:personalTitle>
</contact:Person> Posso chiedere al computer la mailbox di Eric Miller, senza
</rdf:RDF>
sapere a priori se usa una casella di posta elettronica,
piuttosto che una casella postale fisica, o quant’altro…
… e se Eric Miller cambia mailbox, il risultato della mia
ricerca sarà sempre coerente!
RDF – Capacità espressive
Supporta:
ƒ tipizzazione tramite attributo type (che
assume come valore un URI)
ƒ soggetto/oggetto di una frase possono essere
anche contenitori (bag, sequence,
alternative)
ƒ meta-asserzioni, tramite reificazione delle
asserzioni (“Marco afferma che Federico è autore di
una certa pagina web”)
RDF Schema
ƒ RDF può essere inteso come descrizione di attributi di
risorse e dei valori assunti da tali attributi
ƒ RDFS permette di descrivere classi, proprietà e
relazioni con altre risorse (simile ad OO)
à type
à subClassOf
à subPropertyOf
à range
à domain
RDF e RDFS - Limiti
ƒ Limitato potere espressivo
ƒ Semantica non “ben definita”
ƒ Non permette ancora di effettuare inferenze
sulla conoscenza
ƒ Non risolve l’ambiguità di più URI che si
riferiscono ad uno stesso concetto
Soluzione proposta: Ontology Web Language
(OWL)
Modelli semantici
Modal Logic
First Order Logic
Description Logic
UML, OWL
RDF
RDFS
DB Schemas
XMLS
Thesaurus
XML
Modelli
concettuali
Teorie
Logiche
Tassonomie
Modelli semantici
ƒ Tassonomia: insieme di termini organizzati in
una gerarchia
à rappresenta il fatto che esistono delle relazioni fra
termini …
à … ma non permette di stabilire la natura di tali
relazioni
à tipicamente gerarchie di tipo padre/figlio
à la ricerca di un termine ha successo solo se si
conosce a priori “dove” cercare
Modelli semantici
ƒ Thesaurus: insieme di termini fra cui esistono
più relazioni
à oltre alla relazione padre/figlio (gerarchia), vi sono
ulteriori relazioni associative (e.g.
(e g sinonimia,
sinonimia
iperonimia, iponimia, olonimia, meronimia)
à risolvono problemi tipici del linguaggio naturale,
quali ambiguità e rindondanza
à Esempio: WordNet
Modelli semantici
ƒ Modello concettuale: è il modello di una
particolare area di conoscenza (dominio).
Definisce:
à Entità
E tità del
d l dominio
d i i
à Relazioni fra le entità (in forma di proprietà ed
attributi)
à Regole su classi, attributi e relazioni
à Regole di inferenza … Teorie Logiche!!!
Ontologie – una definizione
Una ontologia è una descrizione formale
esplicita di un dominio di interesse
ƒ Classi
ƒ Relazioni semantiche tra classi
ƒ Proprietà associate ad un concetto (eventuali
restrizioni)
ƒ Eventuale livello logico (assiomi, regole di
inferenza)
Ontologie – un esempio
Ontology Web Language (OWL)
ƒ Standard W3C
ƒ Si basa ed estende RDF/RDFS
ƒ Dotato di semantica formale (supporta
Description Logic)
ƒ Tre livelli di espressività/complessità
à OWL Lite (semplice, poco espressivo)
à OWL DL (complessità della description logic,
mediamente espressivo)
à OWL Full (altamente espressivo ed oltre FOL, non
decidibile)
OWL – caratteristiche
ƒ Classi: subClassOf, intersectionOf, unionOf,
complementOf, enumerationm equivalnece,
disjoint
ƒ Proprietà:
P
i tà symmetric,
t i transitive,
t
iti functional,
f ti
l
inverse Functional, range, domain,
subPropertyOf, inverseOf, equivalentProperty
ƒ sulle Istanze: sameIndividualAs,
differentFrom, allDifferent
Interesse per le ontologie
ƒ Una ontologia fornisce un
modello/strutturazione di un dominio
à Risolve ambiguità di termini
à Chiarifica/semplifica
Chi ifi /
lifi le
l peculiarità
li ità di un d
dominio
i i
à Come ricaduta, analisi approfondita di un
dominio/processo …
à … elevato valore in ambito industriale/business
Ontologie – problemi aperti
ƒ Equivalenza tra ontologie diverse
à Ontology matching problem
à
Una ditta vende un oggetto chiamato “golden”… una seconda ditta sta
cercando di comprare delle “mele…
ƒ Ragionamento/interazione sulla base di ontologie
differenti
à Ontology mediators
ƒ Estensione degli algoritmi di ricerca, con le
ontologie e metodi di ragionamento
Esempi di ontologie
ƒ Dublin Core, per documenti
ƒ WordNet, sistema lessicale
ƒ Gene Ontology, genomica
ƒ Protein Ontology, proteomica
ƒ SnoMed, campo medico (costo 1500$/anno)
Strumenti per definire ontologie:
ƒ Protégé http://protege.stanford.edu/
Standard
Assestati
E gli altri strati di SW?
Regole e logiche
ƒ Le Description Logics si stanno affermando
come logiche di riferimento per SW
à Si sviluppano a partire dagli anni ’80
à Tecnologia
T
l i assestata
t t
à Decidibili (la logica dei predicati è semi-decidibile)
à Hanno complessità computazionale accettabile
(O(P) )
à Sono basate sul concetto di ruolo (non hanno le
variabili)
Regole e logiche
ƒ Recentemente, un fortissimo interesse (industria
e ricerca) per le regole
ƒ Informazioni semantiche comprendono anche
regole che descrivono aspetti caratteristici di un
dominio
ƒ Problema aperto: ragionare sia sui dati semantici
che sulle regole
ƒ Rule Interchange Format: standard W3C
(tentativo) per la rappresentazione di regole
ƒ Applicazioni a Semantic Web Services, Business
Rules, e-Contracts,…
Proof e Trust ?
ƒ Prevalentemente argomento di ricerca
à Argumentation dialogues
à Proof exchange
à Trust
T
models
d l
à Veridicità delle informazioni
à Incompletezza delle informazioni
à Informazioni contraddittorie
Semantic Web – problemi?
ƒ Nonostante il paradigma SW sia in discussione
dal 2001 …
ƒ … nel web attuale tale architettura stenta ad
affermarsi
ff
i
à Molto discussa in ambito accademico
à Poco apprezzata in ambito industriale
‚ Solo recentemente, con i Semantic Web Services, è
(ri)sorto un notevole interesse nell’ambito business
ƒ In generale, “fatica” a percepirne i vantaggi
Semantic Web – problemi?
ƒ Adozione di RDF
à Aggiungere contenuto semantico è molto costoso
à Finché non si raggiunge una “massa critica” di informazioni
semantiche disponibili su web …
à … gli strumenti di SW appaiono essere “sterili”
sterili
à Recente proposta in W3C di Gleaning Resource Descriptions
from Dialects of Languages (GRDDL)
ƒ Ontologie
à Costo elevato nel produrre una ontologia ex-novo
à Una ontologia è “viva”, muta nel tempo
‚ Costo di manutenzione
‚ Costo di gestione (uso di temporal logic per gestire il versioning)
Semantic Web – critiche?
ƒ Praticamente irrealizzabile
à Problemi intrinseci quali ad esempio il “metacrap”
ƒ Quale uso dei dati?
à Problemi di censura
à Problemi di privacy
ƒ I dati semantici sono già disponibili su web, è
sufficiente estrapolarli opportunamente
à SW inteso come una duplicazione non necessaria
di ciò che esiste già
à GRDDL potrebbe essere usato anche a tale scopo
Conclusioni
ƒ Semantic Web: aggiunta di informazioni
semantiche sul contenuto delle risorse
presenti su web
ƒ Grandi
G di prospettive
tti sulla
ll carta
t …
à Fortissimo interesse nell’ambito della ricerca,
specie nel settore dell’intelligenza artificiale
ƒ … fatica ad affermarsi in realtà
à Grande interesse recentemente per i Semantic
Web Services
Qualche riferimento…
Sito ufficiale W3C:
ƒ http://www.w3.org/2001/sw/
Sito comunità
ƒ http://www.semanticweb.org/
ƒ http://www.websemantico.org/

Documenti analoghi

Rappresentazione della Conoscenza nel Semantic Web

Rappresentazione della Conoscenza nel Semantic Web Gli obiettivi di Tim Berners Berners--Lee Lee:: • Metainformazioni machine machine--processable processable;; • Interoperabilità sintattica (facilità di leggere i dati da applicazioni diverse); • I...

Dettagli

Strutturare la conoscenza: XML, RDF, Semantic Web

Strutturare la conoscenza: XML, RDF, Semantic Web per assegnare una semantica ai tag e supportare le transazioni sul Web, permettendo lo scambio di informazioni tra database diversi. Ulteriori e significativi vantaggi sono costituiti dalla possibi...

Dettagli

VIRTUOSO DB:CARATTERISTICHE

VIRTUOSO DB:CARATTERISTICHE significato lessicale della singola parola chiave come avveniva nella ricerca sintattica ma sul significato che assumono più concetti legati tra loro (ricerca semantica). A tal proposito verrà quin...

Dettagli