Progetto COOPERARE - Gruppo UGC
Transcript
Progetto COOPERARE - Gruppo UGC
Progetto COOPERARE - Gruppo UGC - Sezione IMMAGINI / FLICKR Report di ricerca Novembre 2010 a cura di Tatiana Mazali L’ANALISI VISUALE COMPARATIVA TRA SITI WEB ISTITUZIONALI E FLICKR La ricerca in sintesi: - Campo della ricerca: beni culturali, in specifico 15 Musei più visitati in Italia, come da ricerca Touring 2007. TASSONOMIA dominio “Beni culturali italiani” Galleria dell’Accademia di Firenze Galleria degli Uffizi Museo Nazionale di Castel S. Angelo Galleria Borghese Museo di San Marco Musei Vaticani Palazzo Ducale di Venezia Museo Nazionale del Cinema Opera di Santa Croce Bioparco di Roma Acquario di Genova Scavi di Pompei Museo centrale del Risorgimento Musei Capitolini Museo delle Antichità Egizie - Dimensione di analisi: cultura partecipativa nelle piattaforme ugc, in specifico analisi dei contenuti prodotti e uplodati su FLICKR. - Domanda di ricerca: confronto tra contenuti fotografici prodotti grassroots versus contenuti iconici istituzionali. - Altri elementi indagati: sistemi di ricerca, organizzazione e analisi semiautomatica di immagini fotografiche. - Metodologia di ricerca: utilizzo di tecniche visive automatiche o automatizzabili per l'analisi del contenuto (utilizzo d’immagini modello e confronto secondo parametri quantificabili); analisi statistiche; analisi quanti-qualitativa di immagini fotografiche. Considerato il volume delle immagini fotografiche prodotte dagli utenti sulle piattaforme di sharing tipiche del web 2.0, e considerata la difficoltà di reperire manualmente un insieme significativo di item per la costituzione di un significativo campione di dati, si è optato per l’analisi di Flickr, uno degli ambienti web più utilizzati per lo sharing di materiale fotografico. E’ stato dunque realizzato un applicativo ad hoc in grado di automatizzare il processo di selezione da Flickr in modo coerente con il nostro ambito di ricerca (utilizzando come chiavi di ricerca il set di parole chiave corrispondenti alle denominazioni dei 15 casi di eccellenza che definiscono il nostro campo di ricerca). Scopo dell’applicativo e’ il confronto ‘visuale’ tra un corpus opportunamente scelto di fotografie di Flickr e pertanto rappresentanti il punto di vista dei visitatori delle Istituzioni prese in esame e un insieme di immagini estratte dai siti web ufficiali delle singole Istituzioni che definiscono quindi le modalita’ ed il linguaggio con cui esse si propongono ai potenziali visitatori. The Cooperare’s System Multimedia Taxonomy Il sistema sviluppato dal ricercatore informatico Antonio Penta dell’Università Federico II di Napoli, permette: • l’estrazione delle immagini secondo i criteri di rilevanza come individuati e messi a disposizione da Flickr, a partire dalla tassonomia di key words che definisce l’ambito della ricerca (i 15 nomi dei beni culturali presi in esame). Il sistema permette di recuperare non solo le immagini ma anche tutte le annotazioni ad esse collegate (es: titolo, descrizione, tag, autore quando è pubblico, etc…), • l’estrazione di caratteristiche visive locali basate sull’approccio delle visione attiva • l’estrazione di caratteristiche visive globali basati su forme, colori, tessiture e relazioni spaziali di riferimento • il salvataggio delle immagini in un database locale • il raggruppamento in cluster delle immagini mediante metriche di similitudine e ottimizzazione delle funzioni distanza definite su di esse • interrogazioni mediante tag di riferimento al database per l’analisi del campione dati • “Query by Example” ossia query basate su immagini campione. Le analisi che abbiamo effettuato in modo semiautomatico utilizzando tale sistema sono di tipo statistico, in particolare abbiamo misurato i gradi di somiglianza delle immagini fotografiche all’interno del campione (somiglianza all’interno di foto raggruppate sotto ciascun nodo della tassonomia; indice generale di somiglianza; coefficiente di deviazione), e ovviamente in modo speculare gradi di non somiglianza. La similitudine tra due immagini è stata calcolata in due modi differenti. 1. Durante la prima fase di ricerca abbiamo confrontato, attraverso una metrica pesata, quattro aspetti globali dell’immagine che ne sintetizzano le caratteristiche visive: color, shape, texture, spatial relation. Il confronto può essere pesato in modo tale da evidenziare di più alcune delle caratteristiche rispetto alle altre. 2. Durante la seconda fase della ricerca si è optato per un sistema di features locali. Questi punti sono localizzati a partire da un modello percettivo dell’occhio umano, definito in modo da avere risposte significative su quelle regioni di pixel dell’immagine che attirano maggiormente la visione umana. A partire da questi punti è possibile determinare anche un percorso che definisce una feature di carattere globale, che descrive il percorso compiuto dall’occhio umano attraverso questi punti. La dimensione della somiglianza visiva è stata da noi trattata da un punto di vista ‘quantitativo’, e dunque ‘automatizzabile’, poiché l’obiettivo era quello di sperimentare una metodologia per il confronto visivo che permettesse analisi su grandi quantità di dati. Certamente però sarà necessario in futuro cercare di integrare questo punto di vista con altre dimensioni che a nostro avviso sono pertinenti per questa dimensione. In sintesi riteniamo che la somiglianza non possa essere ridotta solo agli aspetti formali dell’immagine, e sia necessario invece un approccio interdisciplinare, prendendo in considerazione ad esempio gli aspetti legati alla percezione visiva individuale (come gli individui ‘vedono’, ‘guardano’, ‘riconoscono’ le immagini) e gli aspetti più legati all’elaborazione sociale (importanza del capitale sociale e culturale nella costruzione del significato legato ad un contenuto iconico, meccanismi di costruzione sociale del significato, etc…). STEPS di ricerca FASE 1 Durante la prima fase della ricerca le analisi hanno avuto come obiettivo e output l’individuazione di “ricorrenze” nella produzione di user generated contents all’interno della piattaforma di social network per lo sharing di materiale fotografico FLICKR. La nostra domanda di ricerca era la seguente: i contenuti ugc tendono ad essere prodotti in forma autonoma e individuale oppure si riscontrano dei modus ricorrenti che accomunano gli utenti? Somiglianza/differenza sono stati gli indici quantitativi di partenza per l’analisi degli user generated contents di Flickr.1 FASE 2 Durante la seconda fase della ricerca abbiamo concentrato le nostre analisi sul confronto tra i contenuti iconici (immagini fotografiche e grafiche) prodotte degli stakeholders delle Istituzioni culturali (quindi il mondo che nell’industria culturale è definito dalla figura dei “Produttori” istituzionali che si servono di “Produttori” professionali per la produzione mediale della propria immagine istituzionale) con i contenuti e le immagini prodotte dagli utenti di Flickr (i Prosumers o Outsiders) all’interno del medesimo dominio (i 15 beni culturali oggetto della nostra richiesta) e già analizzate durante la prima fase della ricerca. I primi risultati di questa seconda fase della ricerca hanno messo in discussione il modello di estrazione delle immagini e di analisi della somiglianza basata su features visive che avevamo utilizzato durante la prima fase. Si è dunque proceduto all’applicazione di un modello basato su features visive ottenuto dal modello della visione umana. Si sono dunque estratte le immagini dai siti web istituzionali dei beni culturali oggetto della nostra ricerca, e ad una ad una le si sono messe a confronto con i gruppi di immagini relative agli stessi beni culturali ma create dagli utenti di Flickr. RISULTATI di ricerca, in breve FASE 1 Le prime analisi condotte riguardano il grado di somiglianza interna alle immagini di Flickr raggruppate per i 15 beni culturali presi in considerazione dalla ricerca. Per ognuno dei 15 casi, sono state raccolte immagini fino ad un massimo di 500, ottenendo così un campione di 4188 fotografie. Per ogni Bene culturale sono state calcolate le media di somiglianza e i coefficienti di variazione. Sulla base di queste misurazioni sono emersi 3 grandi gruppi: il gruppo della ‘somiglianza’, il gruppo della ‘differenza’, il gruppo della ‘dispersione’. 1) Scavi di Pompei, Galleria Borghese e Palazzo Ducale di Venezia sono i Beni Culturali nei quali emerge la media di somiglianza tra le immagini più alta, con valori che vanno dallo 0,65 del Palazzo Ducale di Venezia allo 0,64 della Galleria Borghese allo 0,63 degli Scavi di Pompei. Questo gruppo di immagini sono anche caratterizzate da un coefficiente di variazione relativamente basso, a testimonianza di un relativo compattamento nei valori vicini alle medie sopra indicate. Infatti, a differenza di altri gruppi di immagini, qui abbiamo coefficienti di variazione pari circa al 23%. 1 Per l’interpretazione dei risultati in dettaglio si veda: T. Mazali (2009), “Flickr e la produzione di contenuti nel web 2.0, un caso di studio empirico”, in Sociologia della comunicazione, Milano: Franco Angeli, n. 40. 2) Museo Nazionale di Castel Sant’Angelo, Musei Vaticani, Galleria dell’Accademia di Firenze sono Beni Culturali le cui immagini prodotte dagli utenti di Flickr hanno medie di somiglianza più basse rispetto al gruppo precedente – da 0,59 a 0,60 – e coefficienti di variazione – da 23% a 25% – leggermente più alti a testimonianza di una leggera maggiore dispersione dei valori dal dato medio. Il caso più estremo è rappresentato dalle immagini dell’Acquario di Genova che si attestano su livelli di differenza massima, con la media di somiglianza più bassa di tutti i Beni Culturali presi in considerazione (media pari a 0,53). 3) Infine dai dati possiamo individuare un terzo gruppo di immagini, quelle del Museo Nazionale del Cinema, del Museo di San Marco e dei Musei Capitolini, caratterizzate dai più alti livelli di dispersione dalla media di somiglianza (che è di circa lo 0,62), con coefficienti di variazione che vanno dal 27% al 30%. FASE 2 Durante la seconda fase della ricerca si è proceduto a: - Rifare le estrazioni delle immagini da Flickr utilizzando un diverso glossario di key words (ad esempio in alcuni casi si è optato per non utilizzare il nome istituzionale bensì quello più popolare: “Uffizi” al posto di “Galleria degli Uffizi”, “Museo Egizio” al posto di “Museo delle Antichità Egizie”), e utilizzando un diverso sistema di calcolo della somiglianza (come sopra spiegato). Abbiamo estratto 200 immagini di Flickr per ciascun bene culturale. - Analizzare le homepage dei siti web istituzionali dei 15 beni culturali oggetto della ricerca e selezionare/scaricare, ove possibile, una immagine ‘modello’, icona, rappresentativa dell’identità web dell’Istituzione. Spesso si è optato per l’immagine posizionata nell’header del sito web, altre volte per l’immagine che campeggia in primo piano nell’home page. - Confrontare il livello di somiglianza delle immagini modello istituzionali con il campione delle fotografie scaricate da Flickr. Si riportano di seguito i risultati sui casi più emblematici, scelti partendo dai 3 gruppi emersi nella prima fase della ricerca. GRUPPO 1: SOMIGLIANZA ? Le immagini di Flickr del primo gruppo sono caratterizzate da alti livelli di somiglianza tra di loro. All’interno di questo gruppo abbiamo approfondito il caso della Galleria Borghese. L’immagine modello istituzionale che è stata utilizzata per il confronto con Flickr è la fotografia di Apollo e Dafne di Gian Lorenzo Bernini. Si tratta della prima immagine che compare nello galleria di foto che costituisce l’intestazione del sito web. Fig. 1: Immagine modello della Galleria Borghese: Apollo e Dafne di Gian Lorenzo Bernini Fig.2: Grafico di somiglianza relativo al confronto tra l’immagine modello istituzionale della Galleria Borghese e il campione di fotografie scaricate da Flickr con la parola chiave “galleria borghese”. (nota: Sull’asse x sono riportati i valori di somiglianza, da 1 – massima differenza – a 10 – massima uguaglianza. Sull’asse y il numero delle fotografie confrontate con l’immagine modello) Calcolando la media tra tutti i valori di somiglianza riscontrati confrontando l’immagine modello con ciascuna immagine di Flickr otteniamo il valore 4,7, tra i valori più alti riscontrati tra tutti i Beni culturali oggetto d’esame. Cosa ci dice questo valore? Ci dice che l’immagine modello che l’Istituzione utilizza in apertura del proprio sito web, non è rintracciabile in modo diffuso nelle fotografie prodotte dagli utenti, e che tutt’al più possiamo rintracciare somiglianze di colori e forme ma non una somiglianza di soggetto. Infatti ad uno sguardo qualitativo, le fotografie di Flickr hanno soprattutto come soggetto l’edificio della Galleria Borghese ripreso in esterno, soggetto che invece non è praticamente rintracciabile nelle immagini istituzionali del sito web ufficiale. GRUPPO 2: DIFFERENZA ? Le immagini di Flickr del secondo gruppo sono caratterizzate da livelli di somiglianza più bassa. Vediamo cosa accade se confrontiamo immagine istituzionale e immagini di Flickr. Due i casi presi in esame all’interno di questo gruppo: La Galleria dell’Accademia di Firenze e i Musei Vaticani. In entrambi i casi sono state scelte come immagini modello per il confronto le immagini riportate nell’header dei siti web ufficiali. Fig. 3: Immagine modello della Galleria dell’Accademia di Firenze: header del sito web ufficiale Fig.4: Grafico di somiglianza relativo al confronto tra l’immagine modello istituzionale della Galleria dell’Accademia di Firenze e il campione di fotografie scaricate da Flickr con la parola chiave “galleria dell’accademia”. (nota: Sull’asse x sono riportati i valori di somiglianza, da 1 – massima differenza – a 10 – massima uguaglianza. Sull’asse y il numero delle fotografie confrontate con l’immagine modello) Calcolando la media tra tutti i valori di somiglianza riscontrati confrontando l’immagine modello con ciascuna immagine di Flickr otteniamo il valore 3. Da questo dato saremmo portati a dire che l’immagine modello che l’Istituzione utilizza in apertura del proprio sito web non è praticamente rintracciabile nelle fotografie prodotte dagli utenti. Ma se andiamo a gettare uno sguardo qualitativo sulle fotografie di Flickr ritroviamo molte immagini che hanno come soggetto il David di Michelangelo, utilizzato appunto nell’immagine modello. Come spiegare questo risultato? Dobbiamo ammettere in questo caso che il sistema di riconoscimento automatico delle immagini appare debole nel riconoscere il ‘soggetto’ delle immagini quando questo non è posto in simili condizioni ‘formali’ (colore, posizione nello spazio). Passiamo ora al caso dei Musei Vaticani. Fig. 5: Immagine modello dei Musei Vaticani: header del sito web ufficiale Fig.6: Grafico di somiglianza relativo al confronto tra l’immagine modello istituzionale dei Musei Vaticani e il campione di fotografie scaricate da Flickr con la parola chiave “musei vaticani”. (nota: Sull’asse x sono riportati i valori di somiglianza, da 1 – massima differenza – a 10 – massima uguaglianza. Sull’asse y il numero delle fotografie confrontate con l’immagine modello) Calcolando la media di somiglianza otteniamo il valore 1,3, la più bassa media di somiglianza di tutti i Beni culturali oggetto della nostra analisi. Questo dato è confermato dallo sguardo qualitativo sul materiale fotografico di Flickr. Le immagini degli utenti, infatti, si concentrano soprattutto sulle scale elicoidali (quella originale di Giuseppe Momo del 1932 e la nuova scala elicoidale realizzata nel 1999) oltre che su immagini dal basso della Cappella Sistina. Dobbiamo precisare inoltre che l’immagine modello, il particolare tratto da Il Giudizio Universale di Michelangelo, non poteva comparire diffusamente tra le immagini di Flickr poiché è proibito fotografare la Cappella Sistina, ed anche se con il cellulare forse qualche scatto dal basso si riesce ad ottenere, certo non è possibile fotografare particolari degli affreschi. GRUPPO 3: DISPERSIONE ? Le immagini di Flickr del terzo gruppo sono caratterizzate da alti livelli di dispersione dalla media, a testimonianza di un andamento ‘individualistico’ nella produzione delle fotografie. Un caso emblematico all’interno di questo gruppo è quello del Museo Nazionale del Cinema di Torino, caratterizzato, probabilmente per la natura stessa dello specifico museale delle sue collezioni, da una grande eterogeneità e pluralità di immagini, fisse e in movimento. E proprio questa ‘connaturata’ eterogeneità delle immagini a nostro avviso si rispecchia nell’eterogeneità e singolarità della produzione di fotografie degli utenti di Flickr. Purtroppo non è stato possibile per il Museo del Cinema scegliere un’immagine istituzionale modello, sufficientemente rappresentativa, per effettuare il confronto con la produzione di Flickr. Il motivo è da rintracciarsi nelle caratteristiche del sito web ufficiale del Museo, dove le immagini sono sempre ‘animate’, mai fisse, e presentate in un continuum fluido in movimento, sia nell’header del sito, sia nelle sezioni dedicate come la sezione “Virtual Dreams”, una galleria di fotografie in movimento organizzate secondo il percorso di visita all’interno del museo. Situazione analoga è stata riscontrata per l’Acquario di Genova, il cui sito web ufficiale fa un utilizzo ‘grafico’ delle immagini, costruendo di fatto dei fondali animati in 2D che rendono impossibile selezionare una immagine modello rappresentativa dell’Acquario. Come per il Museo del Cinema anche per l’Acquario di Genova riteniamo che il dato di bassa somiglianza delle immagini all’interno di Flickr e la dispersione rispetto al valore medio di somiglianza sia da rintracciarsi nella grande eterogeneità delle ‘collezioni’. Oltre all’eterogeneità del materiale di partenza a nostro avviso c’è un ulteriore fattore che potrebbe spiegare questi risultati: la particolarità degli allestimenti. Il Museo del Cinema e l’Acquario di Genova condividono uno stesso mood di allestimento, orientato alla ‘navigazione’ e alla ‘scoperta’. Potremmo sintetizzare dicendo che sono degli allestimenti dove il percorso c’è ma non si vede, e dove il visitatore percorre degli ambienti e scopre scenografie (anche nel caso dell’Acquario) più che ‘oggetti in vetrina’. Non possiedono dunque delle immagini icone che prevalgono e guidano la visita e il visitatore può gettare il suo punto di vista sugli oggetti in modo relativamente libero, producendo fotografie che sono il frutto della suo modus nel percorrere gli spazi allestiti e scenografati. Restando sempre all’interno di questo terzo gruppo caratterizzato dalla ‘dispersione’, per effettuare il confronto tra Istituzione e produzione grassroot, abbiamo approfondito il caso dei Musei Capitolini. Fig. 7: Immagine modello dei Musei Capitolini: header del sito web ufficiale Fig.8: Grafico di somiglianza relativo al confronto tra l’immagine modello istituzionale dei Musei Capitolini e il campione di fotografie scaricate da Flickr con la parola chiave “musei capitolini”. (nota: Sull’asse x sono riportati i valori di somiglianza, da 1 – massima differenza – a 10 – massima uguaglianza. Sull’asse y il numero delle fotografie confrontate con l’immagine modello) Calcolando la media di somiglianza otteniamo il valore 2,2, ancora un valore di somiglianza molto basso. Questo dato è altresì confermato dallo sguardo qualitativo sul materiale fotografico di Flickr. Le immagini degli utenti, infatti, sono molto eterogenee, sia per soggetto che per ‘stile’ (inquadrature, colore, luce), e mai compare una fotografia che riprende il particolare dell’immagine che i Musei Capitolini utilizzano come propria immagine d’ingresso, presente sia sull’home page del sito sia sulla brochure cartacea istituzionale. Per completezza riportiamo di seguito le medie di somiglianza tra immagini istituzionali e fotografie di Flickr, per tutti i Beni Culturali di cui è stato possibile effettuare il confronto, ovvero di cui è stato possibile scegliere una immagine modello rappresentativa dell’Istituzione in esame. Bene Culturale Museo Egizio Galleria dell'Accademia Galleria Borghese Musei Capitolini Musei Vaticani Museo San Marco Galleria degli Uffizi Somiglianza media tra Istituzione e Flickr (range dei valori: 1 = massima differenza, 10 = massima somiglianza) 3,4 3 4,8 2,2 1,3 2 4,3 Da questo primo sguardo ai dati emerge una sostanziale e netta differenza tra il mondo delle immagini prodotte dagli utenti di Flickr e il mondo delle immagini scelte dalle Istituzioni museali come biglietto da visita della propria identità su web. Inoltre se nel mondo Flickr abbiamo rintracciato differenze in base al bene culturale preso in esame, proponendo 3 macro gruppi caratterizzati da ‘somiglianza’ delle immagini, ‘differenza’ e infine ‘dispersione’ delle fotografie, nell’effettuare il confronto tra Istituzione e mondo Flickr tutti i beni culturali presi in esame si allineano su una sostanziale ‘lontananza’ da quest’ultimo.