Descrivere i documenti: dalla ricerca per termine alla ricerca per
Transcript
Descrivere i documenti: dalla ricerca per termine alla ricerca per
Invited Papers Descrivere i documenti: dalla ricerca per termine alla ricerca per significato. Applicazione del Semantic Web alle tecnologie didattiche Giorgio Poletti Università di Ferrara - [email protected] L’articolo si pone l’obiettivo di fare una riflessione, il più possibile organica, sul rapporto che si è venuto a creare tra le applicazioni del Web semantico e le tecnologie didattiche. La scelta di impostare secondo questa linea il lavoro ha come origine la necessità, che pare fondamentale, di riflettere, a dieci anni dalla nascita del “Semantic Web Initiative” come sia cambiata la metodologia con cui le informazioni sono condivise in rete e se tali cambiamenti inducano un reale valore aggiunto alle tecnologie didattiche facendo evolvere le relative metodologie. Il documento con cui il gruppo del “Semantic Web Initiative” intendeva definire il proprio lavoro dice che “l’obiettivo del Semantic Web è il medesimo del Web: creare un supporto universale per lo scambio di dati”; l’universalità di un supporto di scambio dei dati, ma ancor meglio delle informazioni deve necessariamente basarsi su una logica descrittiva che renda i contenuti “device independent”. Solo una reale logica di catalogazione semantica dei documenti permetterà for citations: Poletti G. (2012), Descrivere i documenti: dalla ricerca per termine alla ricerca per significato, Journal of e-Learning and Knowledge Society (Italian Edition), v.8, n.2, 13-21. ISSN: 1826-6223, e-ISSN:1971-8829 | Journal of e-Learning and Knowledge Society - IT Vol. 8, n. 2, Maggio 2012 (pp. 13 - 21) ISSN: 1826-6223 | eISSN: 1971-8829 | Invited Papers - Vol. 8, n. 2, Maggio 2012 alle applicazioni del web semantico di supportare le metodologie legate alle tecnologie didattiche in dialogo contino con le evoluzioni del web. Lo scopo finale è vedere come la tecnologia didattica per trarre benefici dalle applicazioni del web semantico debba fornire strumenti di comprensione e disambiguazione di concetti condivisi per giungere a documenti che siano “machine readable” per dare risposte a domande che gli utenti non riescono a formulare. 1 Semantica e Web: ritorno al futuro Per affrontare il tema del web semantico e definirne quelle che possono essere le applicazioni significative nel campo delle tecnologie informatiche, credo sia necessario avere chiari i concetti che ultimamente si accumulano e si associano alla rete. Paradossalmente si potrebbe affermare che il Web Semantico nella sua stessa definizione trovi interpretazioni diverse, e che il significato delle parole, oggetto della semantica, sia paradossalmente non condiviso. Altro particolare di rilievo è che si parli di web semantico da pochi anni quando la definizione è dello stesso Tim Berners-Lee; il concetto di Web era ed è che il World Wide Web rappresenti un ambiente in cui i documenti siano accompagnati da metadati e meta-informazioni che ne dichiarino il valore e il contesto semantico. Il Web, come è chiaramente mostrato dallo schema utilizzato dal suo creatore per proporlo nel 1989 al CERN (cfr. Fig. 1), è una mappa concettuale e l’interrogarci oggi su come le sue applicazioni possano essere un valore aggiunto alle tecnologie didattiche significa soprattutto mettere nella giusta relazione la metodologia con le tecnologie che ne hanno permesso la divulgazione. Il Web nel tempo si è configurato sempre più come un artefatto tecnico che non come uno strumento di modifica metodologica sia come strumento di comunicazione che di formazione. Lo stesso avvento del WEB 2.0 è spesso percepito più come un evoluzione tecnologica piuttosto che la possibilità di dare una reale possibilità un utilizzo significativo della struttura del web semantico, in particolare nell’ambito delle tecnologie didattiche. Il WEB 2.0, che viene associato all’editore americano Tim O’Reilly, va visto come un ottimo insieme di software e applicazioni che permettano un uso efficiente del web semantico. Rispetto al WEB 2.0 è interessante citare le affermazioni a riguardo di O’Reilly e Berners-Lee: 1. “Nuovo modo di intendere la Rete: pone al centro i contenuti, le informazioni, l’interazione” (O’Reilly) 14 Giorgio Poletti - Descrivere i documenti: dalla ricerca per termine alla ricerca per significato 2. “Nessun vero significato: ognuno in funzione delle tecnologie che vuole proporre ne determina uno” (Berners-Lee) Fig. 1 - Mappa concettuale della prima proposta di WEB, il sistema ipertestuale “Mesh”, proposto da Tim Berners-Lee nel marzo 1989 al CERN. Da notare l’appunto di Mike Sendall ‘Vague, but exciting’ (‘Vago, ma eccitante’) (Immagine tratta da info.cern.ch/Proposal.html). Per l’editore americano quindi il web 2.0 è un web radicalmente diverso, mentre per l’inventore del web è più semplicemente un web 1.0 tecnologicamente evoluto. Nella loro diversità, queste affermazioni indicano un paradigma che permette al web semantico, attraverso le applicazioni 2.0, di essere strumento attivo delle tecnologie didattiche: è un web centrato sull’utente. In questa analisi non è ugualmente marginale che la rappresentazione grafica che O’Reilly utilizza per schematizzare il Web 2.0 in risposta alla domanda 15 | Invited Papers - Vol. 8, n. 2, Maggio 2012 “cos’è il Web 2.0”; la risposta a questa domanda è una meme map (cfr. Fig. 2). Fig. 2 - Meme Map del Web 2.0 postata da Tim O’Reilly su flickr Il concetto di meme1 è definito come “un’idea, un comportamento o lo stile che si diffonde da persona a persona all’interno di una cultura” (MerriamWebster Dictionary) ed è indubbiamente significativo nel contesto che si sta esplorando. La meme map è quindi una struttura grafica che rappresenta ”l’evoluzione e la trasmissione di un meme nel tempo e nello spazio”2, una descrizione che evidenza una naturale similitudine con i processi di apprendimento/insegnamento. 2 Dal Web Medium al Web Format Il web è stato oggetto di una evoluzione che l’ha portato ad essere una struttura logica, come era stata pensata ma evolvendo da medium a format. Il concetto di meme trova origine nel libro del 1976 “Il gene Egoista”, del biologo inglese Richard Dawkins. In particolare il termine è una contrazione della parola greca “mimema” che significa qualcosa di imitato. Il libro espone la teoria dell’evoluzione vista dalla prospettiva del gene e non dell’individuo o della specie. 2 John Paull, Meme Maps: A Tool for Configuring Memes in Time and Space, in European Journal of Scientific Research - Vol.31 No.1 (2009), pp. 11-18. 1 16 Giorgio Poletti - Descrivere i documenti: dalla ricerca per termine alla ricerca per significato L’utilizzo principale del web ai suoi inizi era più di semplice mezzo di trasporto di dati, senza particolari influenze sulla strutturazione dei dati stessi e su un loro trattamento semanticamente significativo. L’introduzione del Web, così come è successo per tutte le applicazioni informatiche, non ha lasciato intatto l’ambito in cui era chiamato ad operare. Se un intento iniziale era quello di usare il Web come una biblioteca universale dove tutto era reperibile, fu immediatamente evidente che era necessario ideare una modalità di memorizzazione dei dati che andasse oltre al concetto semplice di archivio. Un ragionamento e un processo che non può che richiamare le modalità con cui le persone apprendono, hanno bisogno non solo di “incamerare” dati ma farlo in modo tale da assimilarne le connessioni e il significato di tali connessioni. Il Web non poteva e non doveva rimanere un medium ma diventava un format comunicativo, una modalità di strutturare dati per poterli recuperare secondo logiche che potevano cambiare rispetto al contesto di utilizzo. I dati dovevano diventare informazioni, cioè dovevano essere accompagnati dalle relazioni che era possibile individuare tra loro. Le informazioni dovevano poter divenire conoscenza, dovevano cioè portare con se i legami che potevano collegarle e il significato di tali legami. Nell’apprendimento questo è evidenziato dal fatto che spesso persone che hanno lo stesso insieme di dati non riescono tutte in egual misura a ricavare informazioni, cioè a collegare i dati. Proseguendo in questo cammino anche persone che hanno ricavato uno stesso insieme di informazioni hanno conoscenza diversa, cioè hanno trovato relazioni diverse tra le informazioni ottenute e a volte assegnando loro significati diversi. Quale allora un supporto fondamentale che il Web semantico, cioè un sistema semantico di memorizzazione e correlazione di documenti, può fornire alle tecnologie didattiche? Sicuramente elemento fondamentale per sfruttare le potenzialità del Web semantico è imparare l’uso, da parte di coloro che intendono governare processi di insegnamento/apprendimento, di linguaggi che permettono la descrizione formale della relazione tra entità secondo la logica dei predicati. Il reale utilizzo semantico del web nel contesto delle tecnologie didattiche è proprio l’apprendere la descrizione delle informazioni secondo la logica delle asserzioni con strutture semplici: soggetto, predicato e valore. Una logica che ha il valore aggiunto di fare una meta riflessione sul nostre conoscenze, perché per condividerle devono essere descritte in modo oggettivo, come spiegare il processo della somma senza utilizzare esempi numerici. La logica delle asserzioni ha standard che il web semantico utilizza come 17 | Invited Papers - Vol. 8, n. 2, Maggio 2012 RDF (Resource Description Framework), linguaggio che permette di descrivere informazioni e collegare a ciascun elemento di essa singole risorse. Permettere che le persone ottengano come risposta a link o interrogazioni indicazioni di una risorsa non di un indirizzo. Ad esempio (cfr Tabella 1) l’affermazione Roma è una città antica e ricca di opere d’arte può essere descritta scomponendola in due asserzioni, ciascuna delle quali descritta con le tra componenti soggetto, predicato e valore. Lo studente che utilizza un supporto multimediale in rete e chiede di vedere le risorse relativa alla fisica dei metalli non può essere realmente accontentato nella sua ricerca se di fatto la rete ha una serie di indirizzi a cui reperire tali informazioni. Gli indirizzi possono cambiare, i documenti possono essere collocati ad indirizzi diversi e nuovi indirizzi si aggiungono nel tempo, la struttura deve essere in grado di riconoscere un documento per ciò che significa non per dove si trova. TABELLA 1 Asserzione 1 Soggetto Predicato Valore Roma è una città antica Asserzione 2 Soggetto Predicato Valore Roma è ricca di opere d’arte Il web semantico ha, probabilmente, in questa specificità uno dei punti imprescindibili per cui le tecnologie didattiche non possono prescindere da un suo utilizzo. Di fatto non si deve modificare la forma dei contenuti ma semplicemente descriverne i contenuti, le relazioni tra i contenuti in modo che non siano più dipendenti dai devices che li mediano e che la loro ricostruzione logica sia dipendente solo da regole non da interpretazioni. Documenti “machine readable” che permettano al web semantico di giocare un ruolo di DSS (Decision Support System) per le tecnologie didattiche sia nella scelta dei materiali da erogare ad ogni singolo utente sia nel rispondere in maniera adeguata alle richieste degli utenti leggendone le intenzioni. 3 Ricerche semantiche e data warehouse Il web semantico e la ricerca scientifica per un suo sempre più ampio uti- 18 Giorgio Poletti - Descrivere i documenti: dalla ricerca per termine alla ricerca per significato lizzo a supporto e fondamento delle tecnologie didattiche, passa sicuramente per due strade principali: • far diventare linguaggi di formalizzazione, come RDF o XML (eXtensible Markup Language) una competenza “didattica”; • comprendere le tecniche e sviluppare tecniche di ricerca semantica, utilizzando ciò che la rete mette a disposizione. La ricerca semantica, possibile solo su un web semantico, va inquadrata all’interno di un approccio di intelligenza artificiale con l’obiettivo, che la ricerca di andare oltre la ricerca per termine per circoscrivere le intenzioni di chi esegue la ricerca stessa. Se si inserisce in un motore di ricerca un termine, a maggior ragione se il motore di ricerca è integrato in tecnologie didattiche, come ad esempio “Verdi”, non può essere la consultazione di un dizionari a dare risposte “soddisfacenti”. Con la sua ricerca l’utente intendeva raccogliere informazioni sul compositore Giuseppe Verdi o su tematiche relative a “spazi verdi” o alle energie sostenibili, energie verdi? Una ricerca semantica quindi non si occupa di una ricerca testuale sui termini ma cerca di individuare le intenzioni di chi ricerca di dare un significato alla ricerca. La determinazione di tale significato è importante perché spesso l’utente non sa esprimere tale significato in maniera formale, ci si può collegare a tutte le logiche e ai sistemi che operano nei data warehouse; in particolare al livello detto knowledge discovery, che si potrebbe descrivere come la capacità di dare risposte a domande che non si riesco no a formulare. Una ricerca semantica prova a dare risposte a domande che l’utente non riesce a porre se non articolando parzialmente i suoi quesiti. Lo scopo principale di un motore di ricerca semantica, vero presupposto per un pieno sviluppo ed utilizzo di un web semantico, è la capacità di contestualizzazione delle ricerche attraverso la continua analisi e comparazione della relazione tra termini. Se i termini sono i dati, definirne le relazioni, esplicite ed implicite, significa trarre informazioni; proseguendo definire le diverse relazioni che si definite e definibili tra informazioni vuol dire rispondere alle ricerche fornendo conoscenza. Questo è quello che si sta sviluppando con il progetto “Google knowledge graph” da osservare e studiare in particolare per la sua filosofia di una ricerca semantica. La filosofia di questo progetto, ma probabilmente di un corretto approccio al Web semantico è “[…] insegnare a un computer che nel mondo non ci sono 19 | Invited Papers - Vol. 8, n. 2, Maggio 2012 solo numeri, stringhe e parole, ma “cose”. E che noi umani le parole e i numeri le adoperiamo proprio per indicarle: «Per il nostro cervello è facile e naturale, ma per un insieme di link, processori e programmi richiede un salto di qualità straordinario. Corrispondente al passaggio prima dai dati all´informazione, poi dall´informazione alla conoscenza”3. Questo cammino ricco di possibilità, specie nel campo delle tecnologie didattiche è già individuato, anche se con considerazioni di diverso tenore, da Eli Pariser4 che nel suo libro The Filter Bubble: What The Internet Is Hiding From You afferma “Google non è più uguale per tutti”. In questo contesto è interessante da un lato evidenziare i pericoli di una rete, come afferma Parisier, in grado di “fornire solo informazioni che ci fa piacere leggere” e come “la personalizzazione può produrre una sorta di determinismo dell’informazione” ma anche come siano presenti strumenti e algoritmi che giustifichino gli sforzi per l’implementazione di un web semantico e un suo utilizzo costruttivo nella didattica. Il fatto che Google, ad esempio, utilizzi per le ricerche che effettuiamo 57 indici per determinare chi siamo e quali siti ci piacerebbe visitare è facilmente pensabile come un modo di sapere chi siamo e cosa ci serve realmente. Si va quindi oltre il concetto di metadato, che pur diventa fondamentale per una condivisione semanticamente definita di contenuti. La dimensione che un web semantico, con una struttura e con descrittori che permettono ricerche semantiche, permette di esplorare è quella che veda l’utente diventare inter-attore. Un web che permette alle tecnologie didattiche di avere un utente/studente inter-attore. Un soggetto interattivo e attore principale dell’interazione stessa in grado di svilupparsi non attraverso scelte guidate da dizionari, da seppur ampi sempre predeterminati, ma dal ruolo contestualizzato che l’utente “gioca”, in relazione con altri utenti e altre risorse. Conclusioni? Il web semantico sembra non solo essere il futuro del web ma l’unica via percorribile per sfruttare il reale valore aggiunto che questa “invenzione” ha apportato al mondo della comunicazione. Parallelamente in un era definita “dell’informazione” non si può disattendere alla necessità di fornire gli strumenti perché questa informazione sia fruibile. Le tecnologie didattiche in questa “catena” dell’informazione si occupano Amit Singhal, riportato nell’articolo “Singhal, il cervello di Google: Così costruiremo il pc pensante.” Di Maurizio Bono, repubblica.it, 15 maggio 2012 4 Direttore esecutivo Upworthy, un sito virale (http://www.upworthy.com/) on-line dal marzo 2012 3 20 Giorgio Poletti - Descrivere i documenti: dalla ricerca per termine alla ricerca per significato del segmento che permetta all’informazione di trasformarsi in conoscenza. Il rapporto web semantico - tecnologie dell’informazione non è essenzialmente quello di fornire nuovi strumenti produttivi ma solidi strumenti organizzativi, strumenti in grado di evolversi ed adattarsi alla natura “fluida” dei dati e delle relazioni sulla rete. In fondo tecnologie didattiche e web hanno a che fare con due ambienti strutturalmente paragonabili fatti di media e significati extra-mediali ed una semantica che, in una delle sue accezioni più pura considera il rapporto tra l’espressione e la realtà extralinguistica è una chiave di lettura previlegiata. La via da percorrere, forse la più ricca di prospettive è quella che ci viene indicata da una riflessione sintetizzata da un aforisma di Albert Einstein: “Molti insegnanti sprecano il loro tempo facendo domande che mirano a scoprire ciò che lo studente non sa mentre la vera arte dell’interrogare è quello di scoprire ciò che lo studente sa, o è in grado di imparare”. BIBLIOGRAFIA Berners-Lee T. (2001), The Semantic Web, in «Scientific American», 2001. Berners-Lee T. (2002), L’architettura del nuovo Web, Feltrinelli, Milano, 2002. Pariser E. (2011), The Filter Bubble: What The Internet Is Hiding From You, Penguin Press New York, 2011. Paull J. (2009), Meme Maps: A Tool for Configuring Memes in Time and Space, in European Journal of Scientific Research - Vol.31 No.1 (2009), pp. 11-18. 21