Progetto COOPERARE - Gruppo UGC

Transcript

Progetto COOPERARE - Gruppo UGC
Progetto COOPERARE - Gruppo UGC - Sezione IMMAGINI / FLICKR
Report di ricerca
Novembre 2010
a cura di Tatiana Mazali
L’ANALISI VISUALE COMPARATIVA TRA SITI WEB ISTITUZIONALI E FLICKR
La ricerca in sintesi:
- Campo della ricerca: beni culturali, in specifico 15 Musei più visitati in Italia, come da ricerca
Touring 2007.
TASSONOMIA dominio “Beni culturali italiani”
Galleria dell’Accademia di Firenze
Galleria degli Uffizi
Museo Nazionale di Castel S. Angelo
Galleria Borghese
Museo di San Marco
Musei Vaticani
Palazzo Ducale di Venezia
Museo Nazionale del Cinema
Opera di Santa Croce
Bioparco di Roma
Acquario di Genova
Scavi di Pompei
Museo centrale del Risorgimento
Musei Capitolini
Museo delle Antichità Egizie
- Dimensione di analisi: cultura partecipativa nelle piattaforme ugc, in specifico analisi dei contenuti
prodotti e uplodati su FLICKR.
- Domanda di ricerca: confronto tra contenuti fotografici prodotti grassroots versus contenuti iconici
istituzionali.
- Altri elementi indagati: sistemi di ricerca, organizzazione e analisi semiautomatica di immagini
fotografiche.
- Metodologia di ricerca: utilizzo di tecniche visive automatiche o automatizzabili per l'analisi del
contenuto (utilizzo d’immagini modello e confronto secondo parametri quantificabili); analisi
statistiche; analisi quanti-qualitativa di immagini fotografiche.
Considerato il volume delle immagini fotografiche prodotte dagli utenti sulle piattaforme di sharing
tipiche del web 2.0, e considerata la difficoltà di reperire manualmente un insieme significativo di
item per la costituzione di un significativo campione di dati, si è optato per l’analisi di Flickr, uno
degli ambienti web più utilizzati per lo sharing di materiale fotografico. E’ stato dunque realizzato
un applicativo ad hoc in grado di automatizzare il processo di selezione da Flickr in modo coerente
con il nostro ambito di ricerca (utilizzando come chiavi di ricerca il set di parole chiave
corrispondenti alle denominazioni dei 15 casi di eccellenza che definiscono il nostro campo di
ricerca). Scopo dell’applicativo e’ il confronto ‘visuale’ tra un corpus opportunamente scelto di
fotografie di Flickr e pertanto rappresentanti il punto di vista dei visitatori delle Istituzioni prese in
esame e un insieme di immagini estratte dai siti web ufficiali delle singole Istituzioni che
definiscono quindi le modalita’ ed il linguaggio con cui esse si propongono ai potenziali visitatori.
The Cooperare’s System Multimedia Taxonomy
Il sistema sviluppato dal ricercatore informatico Antonio Penta dell’Università Federico II di Napoli,
permette:
• l’estrazione delle immagini secondo i criteri di rilevanza come individuati e messi a
disposizione da Flickr, a partire dalla tassonomia di key words che definisce l’ambito della
ricerca (i 15 nomi dei beni culturali presi in esame). Il sistema permette di recuperare non
solo le immagini ma anche tutte le annotazioni ad esse collegate (es: titolo, descrizione,
tag, autore quando è pubblico, etc…),
• l’estrazione di caratteristiche visive locali basate sull’approccio delle visione attiva
• l’estrazione di caratteristiche visive globali basati su forme, colori, tessiture e
relazioni spaziali di riferimento
• il salvataggio delle immagini in un database locale
• il raggruppamento in cluster delle immagini mediante metriche di similitudine e
ottimizzazione delle funzioni distanza definite su di esse
• interrogazioni mediante tag di riferimento al database per l’analisi del campione dati
• “Query by Example” ossia query basate su immagini campione.
Le analisi che abbiamo effettuato in modo semiautomatico utilizzando tale sistema sono di tipo
statistico, in particolare abbiamo misurato i gradi di somiglianza delle immagini fotografiche
all’interno del campione (somiglianza all’interno di foto raggruppate sotto ciascun nodo della
tassonomia; indice generale di somiglianza; coefficiente di deviazione), e ovviamente in modo
speculare gradi di non somiglianza.
La similitudine tra due immagini è stata calcolata in due modi differenti.
1. Durante la prima fase di ricerca abbiamo confrontato, attraverso una metrica pesata, quattro
aspetti globali dell’immagine che ne sintetizzano le caratteristiche visive: color, shape, texture,
spatial relation. Il confronto può essere pesato in modo tale da evidenziare di più alcune delle
caratteristiche rispetto alle altre.
2. Durante la seconda fase della ricerca si è optato per un sistema di features locali. Questi punti
sono localizzati a partire da un modello percettivo dell’occhio umano, definito in modo da avere
risposte significative su quelle regioni di pixel dell’immagine che attirano maggiormente la
visione umana. A partire da questi punti è possibile determinare anche un percorso che
definisce una feature di carattere globale, che descrive il percorso compiuto dall’occhio umano
attraverso questi punti.
La dimensione della somiglianza visiva è stata da noi trattata da un punto di vista ‘quantitativo’, e
dunque ‘automatizzabile’, poiché l’obiettivo era quello di sperimentare una metodologia per il
confronto visivo che permettesse analisi su grandi quantità di dati. Certamente però sarà
necessario in futuro cercare di integrare questo punto di vista con altre dimensioni che a nostro
avviso sono pertinenti per questa dimensione. In sintesi riteniamo che la somiglianza non possa
essere ridotta solo agli aspetti formali dell’immagine, e sia necessario invece un approccio
interdisciplinare, prendendo in considerazione ad esempio gli aspetti legati alla percezione visiva
individuale (come gli individui ‘vedono’, ‘guardano’, ‘riconoscono’ le immagini) e gli aspetti più
legati all’elaborazione sociale (importanza del capitale sociale e culturale nella costruzione del
significato legato ad un contenuto iconico, meccanismi di costruzione sociale del significato,
etc…).
STEPS di ricerca
FASE 1
Durante la prima fase della ricerca le analisi hanno avuto come obiettivo e output l’individuazione
di “ricorrenze” nella produzione di user generated contents all’interno della piattaforma di social
network per lo sharing di materiale fotografico FLICKR. La nostra domanda di ricerca era la
seguente: i contenuti ugc tendono ad essere prodotti in forma autonoma e individuale oppure si
riscontrano dei modus ricorrenti che accomunano gli utenti?
Somiglianza/differenza sono stati gli indici quantitativi di partenza per l’analisi degli user generated
contents di Flickr.1
FASE 2
Durante la seconda fase della ricerca abbiamo concentrato le nostre analisi sul confronto tra i
contenuti iconici (immagini fotografiche e grafiche) prodotte degli stakeholders delle Istituzioni
culturali (quindi il mondo che nell’industria culturale è definito dalla figura dei “Produttori”
istituzionali che si servono di “Produttori” professionali per la produzione mediale della propria
immagine istituzionale) con i contenuti e le immagini prodotte dagli utenti di Flickr (i Prosumers o
Outsiders) all’interno del medesimo dominio (i 15 beni culturali oggetto della nostra richiesta) e già
analizzate durante la prima fase della ricerca.
I primi risultati di questa seconda fase della ricerca hanno messo in discussione il modello di
estrazione delle immagini e di analisi della somiglianza basata su features visive che avevamo
utilizzato durante la prima fase. Si è dunque proceduto all’applicazione di un modello basato su
features visive ottenuto dal modello della visione umana.
Si sono dunque estratte le immagini dai siti web istituzionali dei beni culturali oggetto della nostra
ricerca, e ad una ad una le si sono messe a confronto con i gruppi di immagini relative agli stessi
beni culturali ma create dagli utenti di Flickr.
RISULTATI di ricerca, in breve
FASE 1
Le prime analisi condotte riguardano il grado di somiglianza interna alle immagini di Flickr
raggruppate per i 15 beni culturali presi in considerazione dalla ricerca. Per ognuno dei 15 casi,
sono state raccolte immagini fino ad un massimo di 500, ottenendo così un campione di 4188
fotografie.
Per ogni Bene culturale sono state calcolate le media di somiglianza e i coefficienti di variazione.
Sulla base di queste misurazioni sono emersi 3 grandi gruppi: il gruppo della ‘somiglianza’, il
gruppo della ‘differenza’, il gruppo della ‘dispersione’.
1) Scavi di Pompei, Galleria Borghese e Palazzo Ducale di Venezia sono i Beni Culturali nei quali
emerge la media di somiglianza tra le immagini più alta, con valori che vanno dallo 0,65 del
Palazzo Ducale di Venezia allo 0,64 della Galleria Borghese allo 0,63 degli Scavi di Pompei.
Questo gruppo di immagini sono anche caratterizzate da un coefficiente di variazione
relativamente basso,
a testimonianza di un relativo compattamento nei valori vicini alle medie sopra indicate.
Infatti, a differenza di altri gruppi di immagini, qui abbiamo coefficienti di variazione pari circa al
23%.
1
Per l’interpretazione dei risultati in dettaglio si veda: T. Mazali (2009), “Flickr e la produzione di
contenuti nel web 2.0, un caso di studio empirico”, in Sociologia della comunicazione, Milano: Franco
Angeli, n. 40.
2) Museo Nazionale di Castel Sant’Angelo, Musei Vaticani, Galleria dell’Accademia di Firenze
sono Beni Culturali le cui immagini prodotte dagli utenti di Flickr hanno medie di somiglianza più
basse rispetto al gruppo precedente – da 0,59 a 0,60 – e coefficienti di variazione – da 23% a 25%
– leggermente più alti a testimonianza di una leggera maggiore dispersione dei valori dal dato
medio.
Il caso più estremo è rappresentato dalle immagini dell’Acquario di Genova che si attestano su
livelli di differenza massima, con la media di somiglianza più bassa di tutti i Beni Culturali presi in
considerazione (media pari a 0,53).
3) Infine dai dati possiamo individuare un terzo gruppo di immagini, quelle del Museo Nazionale
del Cinema, del Museo di San Marco e dei Musei Capitolini, caratterizzate dai più alti livelli di
dispersione dalla media di somiglianza (che è di circa lo 0,62), con coefficienti di variazione che
vanno dal 27% al 30%.
FASE 2
Durante la seconda fase della ricerca si è proceduto a:
- Rifare le estrazioni delle immagini da Flickr utilizzando un diverso glossario di key words
(ad esempio in alcuni casi si è optato per non utilizzare il nome istituzionale bensì quello
più popolare: “Uffizi” al posto di “Galleria degli Uffizi”, “Museo Egizio” al posto di “Museo
delle Antichità Egizie”), e utilizzando un diverso sistema di calcolo della somiglianza (come
sopra spiegato). Abbiamo estratto 200 immagini di Flickr per ciascun bene culturale.
- Analizzare le homepage dei siti web istituzionali dei 15 beni culturali oggetto della ricerca e
selezionare/scaricare, ove possibile, una immagine ‘modello’, icona, rappresentativa
dell’identità web dell’Istituzione. Spesso si è optato per l’immagine posizionata nell’header
del sito web, altre volte per l’immagine che campeggia in primo piano nell’home page.
- Confrontare il livello di somiglianza delle immagini modello istituzionali con il campione
delle fotografie scaricate da Flickr.
Si riportano di seguito i risultati sui casi più emblematici, scelti partendo dai 3 gruppi emersi nella
prima fase della ricerca.
GRUPPO 1: SOMIGLIANZA ?
Le immagini di Flickr del primo gruppo sono caratterizzate da alti livelli di somiglianza tra di loro.
All’interno di questo gruppo abbiamo approfondito il caso della Galleria Borghese.
L’immagine modello istituzionale che è stata utilizzata per il confronto con Flickr è la fotografia di
Apollo e Dafne di Gian Lorenzo Bernini. Si tratta della prima immagine che compare nello galleria
di foto che costituisce l’intestazione del sito web.
Fig. 1: Immagine modello della Galleria Borghese: Apollo e Dafne di Gian Lorenzo Bernini
Fig.2: Grafico di somiglianza relativo al confronto tra l’immagine modello istituzionale della Galleria Borghese
e il campione di fotografie scaricate da Flickr con la parola chiave “galleria borghese”.
(nota: Sull’asse x sono riportati i valori di somiglianza, da 1 – massima differenza – a 10 – massima uguaglianza.
Sull’asse y il numero delle fotografie confrontate con l’immagine modello)
Calcolando la media tra tutti i valori di somiglianza riscontrati confrontando l’immagine modello con
ciascuna immagine di Flickr otteniamo il valore 4,7, tra i valori più alti riscontrati tra tutti i Beni
culturali oggetto d’esame. Cosa ci dice questo valore? Ci dice che l’immagine modello che
l’Istituzione utilizza in apertura del proprio sito web, non è rintracciabile in modo diffuso nelle
fotografie prodotte dagli utenti, e che tutt’al più possiamo rintracciare somiglianze di colori e forme
ma non una somiglianza di soggetto.
Infatti ad uno sguardo qualitativo, le fotografie di Flickr hanno soprattutto come soggetto l’edificio
della Galleria Borghese ripreso in esterno, soggetto che invece non è praticamente rintracciabile
nelle immagini istituzionali del sito web ufficiale.
GRUPPO 2: DIFFERENZA ?
Le immagini di Flickr del secondo gruppo sono caratterizzate da livelli di somiglianza più bassa.
Vediamo cosa accade se confrontiamo immagine istituzionale e immagini di Flickr.
Due i casi presi in esame all’interno di questo gruppo: La Galleria dell’Accademia di Firenze e i
Musei Vaticani.
In entrambi i casi sono state scelte come immagini modello per il confronto le immagini riportate
nell’header dei siti web ufficiali.
Fig. 3: Immagine modello della Galleria dell’Accademia di Firenze: header del sito web ufficiale
Fig.4: Grafico di somiglianza relativo al confronto tra l’immagine modello istituzionale della Galleria
dell’Accademia di Firenze e il campione di fotografie scaricate da Flickr con la parola chiave “galleria
dell’accademia”.
(nota: Sull’asse x sono riportati i valori di somiglianza, da 1 – massima differenza – a 10 – massima uguaglianza.
Sull’asse y il numero delle fotografie confrontate con l’immagine modello)
Calcolando la media tra tutti i valori di somiglianza riscontrati confrontando l’immagine modello con
ciascuna immagine di Flickr otteniamo il valore 3. Da questo dato saremmo portati a dire che
l’immagine modello che l’Istituzione utilizza in apertura del proprio sito web non è praticamente
rintracciabile nelle fotografie prodotte dagli utenti. Ma se andiamo a gettare uno sguardo qualitativo
sulle fotografie di Flickr ritroviamo molte immagini che hanno come soggetto il David di
Michelangelo, utilizzato appunto nell’immagine modello. Come spiegare questo risultato?
Dobbiamo ammettere in questo caso che il sistema di riconoscimento automatico delle immagini
appare debole nel riconoscere il ‘soggetto’ delle immagini quando questo non è posto in simili
condizioni ‘formali’ (colore, posizione nello spazio).
Passiamo ora al caso dei Musei Vaticani.
Fig. 5: Immagine modello dei Musei Vaticani: header del sito web ufficiale
Fig.6: Grafico di somiglianza relativo al confronto tra l’immagine modello istituzionale dei Musei Vaticani e il
campione di fotografie scaricate da Flickr con la parola chiave “musei vaticani”.
(nota: Sull’asse x sono riportati i valori di somiglianza, da 1 – massima differenza – a 10 – massima uguaglianza.
Sull’asse y il numero delle fotografie confrontate con l’immagine modello)
Calcolando la media di somiglianza otteniamo il valore 1,3, la più bassa media di somiglianza di
tutti i Beni culturali oggetto della nostra analisi. Questo dato è confermato dallo sguardo qualitativo
sul materiale fotografico di Flickr. Le immagini degli utenti, infatti, si concentrano soprattutto sulle
scale elicoidali (quella originale di Giuseppe Momo del 1932 e la nuova scala elicoidale realizzata
nel 1999) oltre che su immagini dal basso della Cappella Sistina. Dobbiamo precisare inoltre che
l’immagine modello, il particolare tratto da Il Giudizio Universale di Michelangelo, non poteva
comparire diffusamente tra le immagini di Flickr poiché è proibito fotografare la Cappella Sistina,
ed anche se con il cellulare forse qualche scatto dal basso si riesce ad ottenere, certo non è
possibile fotografare particolari degli affreschi.
GRUPPO 3: DISPERSIONE ?
Le immagini di Flickr del terzo gruppo sono caratterizzate da alti livelli di dispersione dalla media, a
testimonianza di un andamento ‘individualistico’ nella produzione delle fotografie. Un caso
emblematico all’interno di questo gruppo è quello del Museo Nazionale del Cinema di Torino,
caratterizzato, probabilmente per la natura stessa dello specifico museale delle sue collezioni, da
una grande eterogeneità e pluralità di immagini, fisse e in movimento. E proprio questa
‘connaturata’ eterogeneità delle immagini a nostro avviso si rispecchia nell’eterogeneità e
singolarità della produzione di fotografie degli utenti di Flickr.
Purtroppo non è stato possibile per il Museo del Cinema scegliere un’immagine istituzionale
modello, sufficientemente rappresentativa, per effettuare il confronto con la produzione di Flickr. Il
motivo è da rintracciarsi nelle caratteristiche del sito web ufficiale del Museo, dove le immagini
sono sempre ‘animate’, mai fisse, e presentate in un continuum fluido in movimento, sia
nell’header del sito, sia nelle sezioni dedicate come la sezione “Virtual Dreams”, una galleria di
fotografie in movimento organizzate secondo il percorso di visita all’interno del museo.
Situazione analoga è stata riscontrata per l’Acquario di Genova, il cui sito web ufficiale fa un
utilizzo ‘grafico’ delle immagini, costruendo di fatto dei fondali animati in 2D che rendono
impossibile selezionare una immagine modello rappresentativa dell’Acquario. Come per il Museo
del Cinema anche per l’Acquario di Genova riteniamo che il dato di bassa somiglianza delle
immagini all’interno di Flickr e la dispersione rispetto al valore medio di somiglianza sia da
rintracciarsi nella grande eterogeneità delle ‘collezioni’.
Oltre all’eterogeneità del materiale di partenza a nostro avviso c’è un ulteriore fattore che potrebbe
spiegare questi risultati: la particolarità degli allestimenti. Il Museo del Cinema e l’Acquario di
Genova condividono uno stesso mood di allestimento, orientato alla ‘navigazione’ e alla ‘scoperta’.
Potremmo sintetizzare dicendo che sono degli allestimenti dove il percorso c’è ma non si vede, e
dove il visitatore percorre degli ambienti e scopre scenografie (anche nel caso dell’Acquario) più
che ‘oggetti in vetrina’. Non possiedono dunque delle immagini icone che prevalgono e guidano la
visita e il visitatore può gettare il suo punto di vista sugli oggetti in modo relativamente libero,
producendo fotografie che sono il frutto della suo modus nel percorrere gli spazi allestiti e
scenografati.
Restando sempre all’interno di questo terzo gruppo caratterizzato dalla ‘dispersione’, per effettuare
il confronto tra Istituzione e produzione grassroot, abbiamo approfondito il caso dei Musei
Capitolini.
Fig. 7: Immagine modello dei Musei Capitolini: header del sito web ufficiale
Fig.8: Grafico di somiglianza relativo al confronto tra l’immagine modello istituzionale dei Musei Capitolini e il
campione di fotografie scaricate da Flickr con la parola chiave “musei capitolini”.
(nota: Sull’asse x sono riportati i valori di somiglianza, da 1 – massima differenza – a 10 – massima uguaglianza.
Sull’asse y il numero delle fotografie confrontate con l’immagine modello)
Calcolando la media di somiglianza otteniamo il valore 2,2, ancora un valore di somiglianza molto
basso. Questo dato è altresì confermato dallo sguardo qualitativo sul materiale fotografico di Flickr.
Le immagini degli utenti, infatti, sono molto eterogenee, sia per soggetto che per ‘stile’
(inquadrature, colore, luce), e mai compare una fotografia che riprende il particolare dell’immagine
che i Musei Capitolini utilizzano come propria immagine d’ingresso, presente sia sull’home page
del sito sia sulla brochure cartacea istituzionale.
Per completezza riportiamo di seguito le medie di somiglianza tra immagini istituzionali e fotografie
di Flickr, per tutti i Beni Culturali di cui è stato possibile effettuare il confronto, ovvero di cui è stato
possibile scegliere una immagine modello rappresentativa dell’Istituzione in esame.
Bene Culturale
Museo Egizio
Galleria dell'Accademia
Galleria Borghese
Musei Capitolini
Musei Vaticani
Museo San Marco
Galleria degli Uffizi
Somiglianza media tra Istituzione e Flickr
(range dei valori: 1 = massima differenza, 10 =
massima somiglianza)
3,4
3
4,8
2,2
1,3
2
4,3
Da questo primo sguardo ai dati emerge una sostanziale e netta differenza tra il mondo delle
immagini prodotte dagli utenti di Flickr e il mondo delle immagini scelte dalle Istituzioni museali
come biglietto da visita della propria identità su web. Inoltre se nel mondo Flickr abbiamo
rintracciato differenze in base al bene culturale preso in esame, proponendo 3 macro gruppi
caratterizzati da ‘somiglianza’ delle immagini, ‘differenza’ e infine ‘dispersione’ delle fotografie,
nell’effettuare il confronto tra Istituzione e mondo Flickr tutti i beni culturali presi in esame si
allineano su una sostanziale ‘lontananza’ da quest’ultimo.