Descrivere i documenti: dalla ricerca per termine alla ricerca per

Transcript

Descrivere i documenti: dalla ricerca per termine alla ricerca per
Invited Papers
Descrivere i documenti:
dalla ricerca per termine
alla ricerca per significato.
Applicazione del Semantic
Web alle tecnologie
didattiche
Giorgio Poletti
Università di Ferrara - [email protected]
L’articolo si pone l’obiettivo di fare una riflessione, il più possibile organica,
sul rapporto che si è venuto a creare tra le applicazioni del Web semantico e
le tecnologie didattiche. La scelta di impostare secondo questa linea il lavoro
ha come origine la necessità, che pare fondamentale, di riflettere, a dieci anni
dalla nascita del “Semantic Web Initiative” come sia cambiata la metodologia
con cui le informazioni sono condivise in rete e se tali cambiamenti inducano
un reale valore aggiunto alle tecnologie didattiche facendo evolvere le relative
metodologie. Il documento con cui il gruppo del “Semantic Web Initiative”
intendeva definire il proprio lavoro dice che “l’obiettivo del Semantic Web
è il medesimo del Web: creare un supporto universale per lo scambio di
dati”; l’universalità di un supporto di scambio dei dati, ma ancor meglio
delle informazioni deve necessariamente basarsi su una logica descrittiva
che renda i contenuti “device independent”.
Solo una reale logica di catalogazione semantica dei documenti permetterà
for citations:
Poletti G. (2012), Descrivere i documenti: dalla ricerca per termine alla ricerca per significato,
Journal of e-Learning and Knowledge Society (Italian Edition), v.8, n.2, 13-21. ISSN: 1826-6223,
e-ISSN:1971-8829
|
Journal of e-Learning and Knowledge Society - IT
Vol. 8, n. 2, Maggio 2012 (pp. 13 - 21)
ISSN: 1826-6223 | eISSN: 1971-8829
| Invited Papers
- Vol. 8, n. 2, Maggio 2012
alle applicazioni del web semantico di supportare le metodologie legate alle tecnologie didattiche in
dialogo contino con le evoluzioni del web.
Lo scopo finale è vedere come la tecnologia didattica per trarre benefici dalle applicazioni del web
semantico debba fornire strumenti di comprensione e disambiguazione di concetti condivisi per giungere
a documenti che siano “machine readable” per dare risposte a domande che gli utenti non riescono a
formulare.
1 Semantica e Web: ritorno al futuro
Per affrontare il tema del web semantico e definirne quelle che possono
essere le applicazioni significative nel campo delle tecnologie informatiche,
credo sia necessario avere chiari i concetti che ultimamente si accumulano e
si associano alla rete.
Paradossalmente si potrebbe affermare che il Web Semantico nella sua stessa definizione trovi interpretazioni diverse, e che il significato delle parole,
oggetto della semantica, sia paradossalmente non condiviso.
Altro particolare di rilievo è che si parli di web semantico da pochi anni
quando la definizione è dello stesso Tim Berners-Lee; il concetto di Web era
ed è che il World Wide Web rappresenti un ambiente in cui i documenti siano
accompagnati da metadati e meta-informazioni che ne dichiarino il valore e il
contesto semantico.
Il Web, come è chiaramente mostrato dallo schema utilizzato dal suo creatore per proporlo nel 1989 al CERN (cfr. Fig. 1), è una mappa concettuale e l’interrogarci oggi su come le sue applicazioni possano essere un valore aggiunto
alle tecnologie didattiche significa soprattutto mettere nella giusta relazione la
metodologia con le tecnologie che ne hanno permesso la divulgazione.
Il Web nel tempo si è configurato sempre più come un artefatto tecnico
che non come uno strumento di modifica metodologica sia come strumento di
comunicazione che di formazione.
Lo stesso avvento del WEB 2.0 è spesso percepito più come un evoluzione
tecnologica piuttosto che la possibilità di dare una reale possibilità un utilizzo
significativo della struttura del web semantico, in particolare nell’ambito delle
tecnologie didattiche.
Il WEB 2.0, che viene associato all’editore americano Tim O’Reilly, va
visto come un ottimo insieme di software e applicazioni che permettano un
uso efficiente del web semantico.
Rispetto al WEB 2.0 è interessante citare le affermazioni a riguardo di
O’Reilly e Berners-Lee:
1. “Nuovo modo di intendere la Rete: pone al centro i contenuti, le informazioni, l’interazione” (O’Reilly)
14
Giorgio Poletti - Descrivere i documenti: dalla ricerca per termine alla ricerca per significato
2. “Nessun vero significato: ognuno in funzione delle tecnologie che vuole
proporre ne determina uno” (Berners-Lee)
Fig. 1 - Mappa concettuale della prima proposta di WEB, il sistema ipertestuale
“Mesh”, proposto da Tim Berners-Lee nel marzo 1989 al CERN. Da notare
l’appunto di Mike Sendall ‘Vague, but exciting’ (‘Vago, ma eccitante’)
(Immagine tratta da info.cern.ch/Proposal.html).
Per l’editore americano quindi il web 2.0 è un web radicalmente diverso,
mentre per l’inventore del web è più semplicemente un web 1.0 tecnologicamente evoluto.
Nella loro diversità, queste affermazioni indicano un paradigma che permette al web semantico, attraverso le applicazioni 2.0, di essere strumento attivo
delle tecnologie didattiche: è un web centrato sull’utente.
In questa analisi non è ugualmente marginale che la rappresentazione grafica
che O’Reilly utilizza per schematizzare il Web 2.0 in risposta alla domanda
15
| Invited Papers
- Vol. 8, n. 2, Maggio 2012
“cos’è il Web 2.0”; la risposta a questa domanda è una meme map (cfr. Fig.
2).
Fig. 2 - Meme Map del Web 2.0 postata da Tim O’Reilly su flickr
Il concetto di meme1 è definito come “un’idea, un comportamento o lo stile
che si diffonde da persona a persona all’interno di una cultura” (MerriamWebster Dictionary) ed è indubbiamente significativo nel contesto che si sta
esplorando.
La meme map è quindi una struttura grafica che rappresenta ”l’evoluzione
e la trasmissione di un meme nel tempo e nello spazio”2, una descrizione che
evidenza una naturale similitudine con i processi di apprendimento/insegnamento.
2 Dal Web Medium al Web Format
Il web è stato oggetto di una evoluzione che l’ha portato ad essere una
struttura logica, come era stata pensata ma evolvendo da medium a format.
Il concetto di meme trova origine nel libro del 1976 “Il gene Egoista”, del biologo inglese Richard Dawkins. In particolare il
termine è una contrazione della parola greca “mimema” che significa qualcosa di imitato. Il libro espone la teoria dell’evoluzione
vista dalla prospettiva del gene e non dell’individuo o della specie.
2
John Paull, Meme Maps: A Tool for Configuring Memes in Time and Space, in European Journal of Scientific Research - Vol.31
No.1 (2009), pp. 11-18.
1
16
Giorgio Poletti - Descrivere i documenti: dalla ricerca per termine alla ricerca per significato
L’utilizzo principale del web ai suoi inizi era più di semplice mezzo di trasporto
di dati, senza particolari influenze sulla strutturazione dei dati stessi e su un
loro trattamento semanticamente significativo.
L’introduzione del Web, così come è successo per tutte le applicazioni informatiche, non ha lasciato intatto l’ambito in cui era chiamato ad operare.
Se un intento iniziale era quello di usare il Web come una biblioteca universale dove tutto era reperibile, fu immediatamente evidente che era necessario
ideare una modalità di memorizzazione dei dati che andasse oltre al concetto
semplice di archivio.
Un ragionamento e un processo che non può che richiamare le modalità
con cui le persone apprendono, hanno bisogno non solo di “incamerare” dati
ma farlo in modo tale da assimilarne le connessioni e il significato di tali connessioni.
Il Web non poteva e non doveva rimanere un medium ma diventava un
format comunicativo, una modalità di strutturare dati per poterli recuperare
secondo logiche che potevano cambiare rispetto al contesto di utilizzo.
I dati dovevano diventare informazioni, cioè dovevano essere accompagnati
dalle relazioni che era possibile individuare tra loro.
Le informazioni dovevano poter divenire conoscenza, dovevano cioè portare
con se i legami che potevano collegarle e il significato di tali legami.
Nell’apprendimento questo è evidenziato dal fatto che spesso persone che
hanno lo stesso insieme di dati non riescono tutte in egual misura a ricavare
informazioni, cioè a collegare i dati.
Proseguendo in questo cammino anche persone che hanno ricavato uno
stesso insieme di informazioni hanno conoscenza diversa, cioè hanno trovato
relazioni diverse tra le informazioni ottenute e a volte assegnando loro significati diversi.
Quale allora un supporto fondamentale che il Web semantico, cioè un sistema semantico di memorizzazione e correlazione di documenti, può fornire
alle tecnologie didattiche?
Sicuramente elemento fondamentale per sfruttare le potenzialità del Web
semantico è imparare l’uso, da parte di coloro che intendono governare processi
di insegnamento/apprendimento, di linguaggi che permettono la descrizione
formale della relazione tra entità secondo la logica dei predicati.
Il reale utilizzo semantico del web nel contesto delle tecnologie didattiche è
proprio l’apprendere la descrizione delle informazioni secondo la logica delle
asserzioni con strutture semplici: soggetto, predicato e valore.
Una logica che ha il valore aggiunto di fare una meta riflessione sul nostre
conoscenze, perché per condividerle devono essere descritte in modo oggettivo,
come spiegare il processo della somma senza utilizzare esempi numerici.
La logica delle asserzioni ha standard che il web semantico utilizza come
17
| Invited Papers
- Vol. 8, n. 2, Maggio 2012
RDF (Resource Description Framework), linguaggio che permette di descrivere informazioni e collegare a ciascun elemento di essa singole risorse.
Permettere che le persone ottengano come risposta a link o interrogazioni
indicazioni di una risorsa non di un indirizzo.
Ad esempio (cfr Tabella 1) l’affermazione Roma è una città antica e ricca
di opere d’arte può essere descritta scomponendola in due asserzioni, ciascuna
delle quali descritta con le tra componenti soggetto, predicato e valore.
Lo studente che utilizza un supporto multimediale in rete e chiede di vedere
le risorse relativa alla fisica dei metalli non può essere realmente accontentato
nella sua ricerca se di fatto la rete ha una serie di indirizzi a cui reperire tali
informazioni.
Gli indirizzi possono cambiare, i documenti possono essere collocati ad
indirizzi diversi e nuovi indirizzi si aggiungono nel tempo, la struttura deve
essere in grado di riconoscere un documento per ciò che significa non per dove
si trova.
TABELLA 1
Asserzione 1
Soggetto
Predicato
Valore
Roma
è
una città antica
Asserzione 2
Soggetto
Predicato
Valore
Roma
è
ricca di opere d’arte
Il web semantico ha, probabilmente, in questa specificità uno dei punti
imprescindibili per cui le tecnologie didattiche non possono prescindere da
un suo utilizzo.
Di fatto non si deve modificare la forma dei contenuti ma semplicemente
descriverne i contenuti, le relazioni tra i contenuti in modo che non siano più
dipendenti dai devices che li mediano e che la loro ricostruzione logica sia
dipendente solo da regole non da interpretazioni.
Documenti “machine readable” che permettano al web semantico di giocare
un ruolo di DSS (Decision Support System) per le tecnologie didattiche sia
nella scelta dei materiali da erogare ad ogni singolo utente sia nel rispondere
in maniera adeguata alle richieste degli utenti leggendone le intenzioni.
3 Ricerche semantiche e data warehouse
Il web semantico e la ricerca scientifica per un suo sempre più ampio uti-
18
Giorgio Poletti - Descrivere i documenti: dalla ricerca per termine alla ricerca per significato
lizzo a supporto e fondamento delle tecnologie didattiche, passa sicuramente
per due strade principali:
• far diventare linguaggi di formalizzazione, come RDF o XML (eXtensible Markup Language) una competenza “didattica”;
• comprendere le tecniche e sviluppare tecniche di ricerca semantica, utilizzando ciò che la rete mette a disposizione.
La ricerca semantica, possibile solo su un web semantico, va inquadrata
all’interno di un approccio di intelligenza artificiale con l’obiettivo, che la
ricerca di andare oltre la ricerca per termine per circoscrivere le intenzioni di
chi esegue la ricerca stessa.
Se si inserisce in un motore di ricerca un termine, a maggior ragione se il
motore di ricerca è integrato in tecnologie didattiche, come ad esempio “Verdi”, non può essere la consultazione di un dizionari a dare risposte “soddisfacenti”.
Con la sua ricerca l’utente intendeva raccogliere informazioni sul compositore Giuseppe Verdi o su tematiche relative a “spazi verdi” o alle energie
sostenibili, energie verdi?
Una ricerca semantica quindi non si occupa di una ricerca testuale sui termini ma cerca di individuare le intenzioni di chi ricerca di dare un significato
alla ricerca.
La determinazione di tale significato è importante perché spesso l’utente
non sa esprimere tale significato in maniera formale, ci si può collegare a tutte
le logiche e ai sistemi che operano nei data warehouse; in particolare al livello
detto knowledge discovery, che si potrebbe descrivere come la capacità di dare
risposte a domande che non si riesco no a formulare.
Una ricerca semantica prova a dare risposte a domande che l’utente non
riesce a porre se non articolando parzialmente i suoi quesiti.
Lo scopo principale di un motore di ricerca semantica, vero presupposto
per un pieno sviluppo ed utilizzo di un web semantico, è la capacità di contestualizzazione delle ricerche attraverso la continua analisi e comparazione
della relazione tra termini.
Se i termini sono i dati, definirne le relazioni, esplicite ed implicite, significa
trarre informazioni; proseguendo definire le diverse relazioni che si definite e
definibili tra informazioni vuol dire rispondere alle ricerche fornendo conoscenza.
Questo è quello che si sta sviluppando con il progetto “Google knowledge
graph” da osservare e studiare in particolare per la sua filosofia di una ricerca
semantica.
La filosofia di questo progetto, ma probabilmente di un corretto approccio
al Web semantico è “[…] insegnare a un computer che nel mondo non ci sono
19
| Invited Papers
- Vol. 8, n. 2, Maggio 2012
solo numeri, stringhe e parole, ma “cose”. E che noi umani le parole e i numeri
le adoperiamo proprio per indicarle: «Per il nostro cervello è facile e naturale,
ma per un insieme di link, processori e programmi richiede un salto di qualità
straordinario. Corrispondente al passaggio prima dai dati all´informazione,
poi dall´informazione alla conoscenza”3.
Questo cammino ricco di possibilità, specie nel campo delle tecnologie
didattiche è già individuato, anche se con considerazioni di diverso tenore, da
Eli Pariser4 che nel suo libro The Filter Bubble: What The Internet Is Hiding
From You afferma “Google non è più uguale per tutti”.
In questo contesto è interessante da un lato evidenziare i pericoli di una rete,
come afferma Parisier, in grado di “fornire solo informazioni che ci fa piacere
leggere” e come “la personalizzazione può produrre una sorta di determinismo
dell’informazione” ma anche come siano presenti strumenti e algoritmi che
giustifichino gli sforzi per l’implementazione di un web semantico e un suo
utilizzo costruttivo nella didattica.
Il fatto che Google, ad esempio, utilizzi per le ricerche che effettuiamo 57
indici per determinare chi siamo e quali siti ci piacerebbe visitare è facilmente pensabile come un modo di sapere chi siamo e cosa ci serve realmente.
Si va quindi oltre il concetto di metadato, che pur diventa fondamentale per
una condivisione semanticamente definita di contenuti.
La dimensione che un web semantico, con una struttura e con descrittori
che permettono ricerche semantiche, permette di esplorare è quella che veda
l’utente diventare inter-attore.
Un web che permette alle tecnologie didattiche di avere un utente/studente
inter-attore.
Un soggetto interattivo e attore principale dell’interazione stessa in grado di
svilupparsi non attraverso scelte guidate da dizionari, da seppur ampi sempre
predeterminati, ma dal ruolo contestualizzato che l’utente “gioca”, in relazione
con altri utenti e altre risorse.
Conclusioni?
Il web semantico sembra non solo essere il futuro del web ma l’unica via
percorribile per sfruttare il reale valore aggiunto che questa “invenzione” ha
apportato al mondo della comunicazione.
Parallelamente in un era definita “dell’informazione” non si può disattendere
alla necessità di fornire gli strumenti perché questa informazione sia fruibile.
Le tecnologie didattiche in questa “catena” dell’informazione si occupano
Amit Singhal, riportato nell’articolo “Singhal, il cervello di Google: Così costruiremo il pc pensante.” Di Maurizio Bono, repubblica.it, 15 maggio 2012
4
Direttore esecutivo Upworthy, un sito virale (http://www.upworthy.com/) on-line dal marzo 2012
3
20
Giorgio Poletti - Descrivere i documenti: dalla ricerca per termine alla ricerca per significato
del segmento che permetta all’informazione di trasformarsi in conoscenza.
Il rapporto web semantico - tecnologie dell’informazione non è essenzialmente quello di fornire nuovi strumenti produttivi ma solidi strumenti organizzativi, strumenti in grado di evolversi ed adattarsi alla natura “fluida” dei
dati e delle relazioni sulla rete.
In fondo tecnologie didattiche e web hanno a che fare con due ambienti
strutturalmente paragonabili fatti di media e significati extra-mediali ed una
semantica che, in una delle sue accezioni più pura considera il rapporto tra
l’espressione e la realtà extralinguistica è una chiave di lettura previlegiata.
La via da percorrere, forse la più ricca di prospettive è quella che ci viene
indicata da una riflessione sintetizzata da un aforisma di Albert Einstein: “Molti
insegnanti sprecano il loro tempo facendo domande che mirano a scoprire ciò
che lo studente non sa mentre la vera arte dell’interrogare è quello di scoprire
ciò che lo studente sa, o è in grado di imparare”.
BIBLIOGRAFIA
Berners-Lee T. (2001), The Semantic Web, in «Scientific American», 2001.
Berners-Lee T. (2002), L’architettura del nuovo Web, Feltrinelli, Milano, 2002.
Pariser E. (2011), The Filter Bubble: What The Internet Is Hiding From You, Penguin
Press New York, 2011.
Paull J. (2009), Meme Maps: A Tool for Configuring Memes in Time and Space, in
European Journal of Scientific Research - Vol.31 No.1 (2009), pp. 11-18.
21