Analisi del contenuto ii quantitativa
Transcript
Analisi del contenuto ii quantitativa
+ Analisi del contenuto quantitativa i i Federica Castellini + LE TAPPE DEGLI INCONTRI + Road mapp degli g incontri - Federica Castellini Presentazione dell’analisi del contenuto QT e del software EVOC 1. 1. La teoria che sottende EVOC, le rappresentazioni sociali 2. Gli step dell’analisi 3. Scelta del tema da esplorare con le libere associazioni 4. Costruzione del questionario e del libro codice 5. Distribuzione di articoli di ricerche che hanno utilizzato TLab Il software f TLAB 2. 1. Definizione materiale raccolta dati EVOC 2. Discussione articoli su TLAB 3. Presentazione del software TLAB Analisi con EVOC ed esplorazione funzionalità TLAB 3. 4. 1. Consegna file dati raccolti e consegna riflessioni personali su ricerca e articoli 2. Analisi in gruppi delle libere associazioni con EVOC 3. Esplorazione in gruppo della demo di TLAB TLAB esercizi in laboratorio con il software + I COMPITI ☺ + I compiti Per la seconda lezione leggere i 4 articoli Per la terza lezione consegnare al docente un documento con le seguenti considerazioni Considerazioni generale sull’ANALISI DEL CONTENUTO QUANTITATIVA PRO e CONTRO Le differenze con l’analisi del contenuto qualitativa I vantaggi e gli svantaggi di un’integrazione dei due approcci Adesso che conoscete le funzionalità di T-Lab come vi piacerebbe utilizzarlo? In quale tipo di ricerca? Su quali temi? Con quali scopi? Perché? + 6 Sulla nostra ricerca Elencare tutte le domande alle quali vorreste trovare una risposta dai dati della nostra ricerca sull’omosessualità (cosa ti aspetti di trovare) Cosa avresti fatto di diverso? (domande/variabili etc..) Quali criticità hai notato? Quali sono i potenziali difetti di questo piccolo questionario? + Cos’è Cos è l’analisi l analisi del contenuto (AC)? Si tratta di una tecnica di analisi dei dati che ha lo scopo di ridurre la grande varietà di informazioni ‘qualitative’ presenti in un d documento testuale l in i un insieme i i più iù piccolo i l e interpretabile di informazioni Obiettivo: trovare i temi, i contenuti di un testo e le relazioni tra questi temi (e chi li produce) Ciò si realizza effettuando procedure di codifica che trasformano i dati grezzi attraverso operazioni di selezione e focalizzazione (Miles e Huberman, 1994) + Definizione Analisi del contenuto un insieme i i di metodi di orientati i i all controllo ll di d determinate i i ipotesi i su fatti f i di comunicazione (emittenti, messaggi, destinatari e loro relazioni) che a tale scopo utilizzano procedure di scomposizione analitica e di classificazione normalmente a destinazione statistica, classificazione, statistica di testi e altri insiemi simbolici (Rositi, 1988) L’analisi del contenuto è come un viaggio gg dalla parola p al numero e ritorno: Il dato grezzo è qualitativo, le tecniche di analisi possono essere quali o quantitative Le quantitative si distinguono per il trattamento numerico statistico e ‘in parte automatico’ del testo Tuttavia T i lla contestualizzazione, li i iinterpretazione i e restituzione i i d deii risultati i l i richiede di tornare al qualitativo approccio fenomenologico + Tappe fondamentali dell’AC dell AC quantitativa RICORDIAMOCI CHE PARLIAMO SEMPRE DI UN APPROCCIO DI RICERCA E QUINDI E’ IMPORTANTE DEFINIRE IL PROBLEMA CHE VOGLIAMO INDAGARE E LE IPOTESI Quale Qua e ca campione? p o e Qua Quali variabili? va ab Quali Qua ipotesi? potes Scelta del corpus di dati da analizzare quali criteri vengono utilizzati per l’acquisizione del materiale? (Definizione dell’unità di analisi) parola, significati di una parola, frase, elemento della narrazione (personaggi), paragrafo, intero documento PULIZIA del corpus di dati (FONDAMENTALE) Analisi dei dati O t t Output Interpretazione + Preparazione dei testi Selezione dei testi CORPUS PICCOLO: <15.000 occorrenze (totale forme presenti) MEDIO: circa 45.000 occorrenze GRANDE: >100.000 occorrenze “Lo Lo studio assume interesse quanto più ampia è ll’estensione estensione del corpus testuale e, di conseguenza, quanto più risulta utile una sua analisi in modalità automatica” (Bolasco, 1999) Curare organizzazione interna e trascrizione (molto più importante per la QT) Sensibilità verso alcune caratteristiche del testo particolarmente importanti per le nostre ipotesi IImportanza t del d l testo t t originario i i i (non ( ricostruzione i t i a posteriori, t i i ma parole trascritte fedelmente registrare interviste e focus group) Identificare dei SUBCORPUS + L’AC L AC QUANTITATIVA + Pensieri sull’analisi sull analisi quantitativa di un testo Ho chiesto a Lotaria se ha ggià letto alcuni miei libri che le avevo pprestato. Mi ha detto di no, perché qui non ha a disposizione un elaboratore elettronico. M’ha spiegato che un elaboratore debitamente programmato può leggere un romanzo in pochi minuti e registrare la lista di tutti i vocaboli contenuti nel testo, testo in ordine di frequenza. “Cos’è infatti la lettura d’un testo se non la registrazione di certe ricorrenze tematiche, di certe insistenze di forme e di significati?” (…) L’idea L idea che Lotaria legga i miei libri a questo modo mi crea dei problemi problemi. Adesso ogni parola che scrivo la vedo già centrifugata dal cervello elettronico, disposta nella graduatoria delle frequenze, vicino ad altre parole che non so quali possano essere… Italo Calvino, Se una notte d’inverno un viaggiatore + L’uso dei software per la codifica automatica I software oggi disponibili aiutano nel codificare contenuto di testi anche molto ampi Analisi del contenuto aiutata da computer è un tipo di analisi dei testi che si avvale di programmi a fini essenzialmente esplorativi I software aiutano nella codifica del materiale ((ad es.,, una volta definita l'unità di analisi, l'assegnazione di tale unità alle modalità della variabile viene realizzata da un software) ma non nell’interpretazione Alcuni software per l’analisi del contenuto: N-vivo o Nud.Ist per analisi tematica e categoriale (qualitativa) Alceste o T-lab per analisi quantitativa (lessicale e frequenziale) L’unità di analisi è tipicamente la parola (ma anche il lemma) in quanto unità minima di senso ottenibile dalla massima disgregazione dei testi Calcolo di concordanze, co-occorrenze, frasi tipiche Problema dell dell’ambiguità ambiguità della parola rende necessaria una verifica e un miglioramento delle attribuzioni categoriali effettuate dal software + Punti di forza dell dell’analisi analisi quantitativa testuale la potenzialità descrittivo descrittivo-esplorativa esplorativa rispetto a corpora testuali anche molto vasti (Amaturo, 1989); l ispezionabilità della base dei dati (Ricolfi, 1997) e quindi la l’ispezionabilità garanzia della ripetibilità e dell’intersoggettività dell’analisi l’esplicitazione necessaria delle fasi dell’analisi che contribuisce alla ricostruzione delle procedure e al loro controllo (Gobo (Gobo, 1998); l’integrazione e la connessione dei dati testuali con variabili categoriali associate ai documenti che incoraggiano strategie di triangolazione nel disegno della ricerca (Denzin, 1970). + Attenzione però…. però Il software di analisi non risolve i problemi di fondo dell dell’analisi analisi dei testi La q qualità delle e e analisi è nelle e e mani del e ricercatore ce c o e Le scelte del ricercatore sono fondamentali, specialmente in fase di ‘pulizia del testo’ Le tappe del processo del ricerca devono essere seguite e definite con cura per ottenere dati utili e significativi Le analisi sono solo raramente ‘automatiche’ “l’automazione e i supporti informatici devono aiutare il giudizio, non eliminarlo” (Rositi, 1988) + Articoli che utilizzano T-Lab Colucci F.P., Castellini F. (2006). I giovani verso il lavoro che cambia tra aspirazioni e realtà. In Ferrari L., Veglio O. (a cura di) Donne e uomini nel mercato del lavoro atipico. La dimensione psicologica e di genere del lavoro precario e flessibile, pp. 77-101. Milano: Franco Angeli. g Colombo M., Castellini F., Colombo C., (2008). Media e comunicazione politica: prospettive teoriche e metodologiche nell’analisi dei dibattiti elettorali, in Mazzara B.M., (a cura di ) I discorsi dei media e la psicologia sociale. Ambiti e strumenti di indagine, pp. 199-233. Montali L., Colombo M., Riva (2009). Teorie e pratiche nella gestione del dolore: una ricerca sulle rappresentazioni dei medici. Psicologia d ll Salute, della S l t 1, 1 33-56. 33 56 Villano P., Passini S., Morselli, D. (2010). Discorso e terrorismo: la rappresentazione degli arabi nella stampa italiana e internazionale dopo l’11 settembre 2001. Psicologia Sociale, 3, 443-462. + Che cos’è EVOC? Tra teoria e pratica + Che cos cos’è è EVOC? È un software, uno strumento di analisi dei dati testuali elaborato all’interno della Scuola di Aix en Provence ((di Abric,, Flament, Vergès); la scuola è di matrice psicosociale ed è interessata allo studio della struttura delle rappresentazioni t i i sociali i li e alle ll loro l trasformazioni + LA TEORIA Che cosa sono le rappresentazioni sociali? + Le rappresentazioni pp sociali ((RS)) • • • Sono il frutto dell’elaborazione dell elaborazione che un gruppo o una comunità fa di un oggetto (o di un gruppo sociale) in modo che i propri membri possano agire e comunicare in modo prevedibile/comprensibile in merito all all’oggetto oggetto Non sono “opinioni su…” o “atteggiamenti verso…” ma “teorie” teorie o “branche branche di conoscenza vere e proprie proprie” utili per organizzare la realtà Le rappresentazioni sono ‘sociali’: sociali : in quanto l’oggetto della RS deve essere socialmente rilevante in quanto socialmente condivise da un gruppo di soggetti e quindi… …possono influenzare il comportamento degli individui in quanto membri di g q gruppi pp + Il nucleo centrale della rappresentazione • • Le RS sono un sistema sociocognitivo organizzato intorno ad un NUCLEO CENTRALE Nella scuola di Aix en Provence si pone particolare attenzione alla STRUTTURA di una rappresentazione • • ovvero agli elementi che la compongono e come si organizzano Studiare una RS significa: g • • • Nucleo centrale studiare il suo nucleo centrale vedere come in sottogruppi diversi – che pure concordano sugli elementi del nucleo – possono cambiare gli elementi periferici Nel nucleo ci possono essere elementi ‘dormienti’: • • non attivati dal contesto non si possono esprimere (contro-normativi) zona muette + Il nucleo centrale della rappresentazione • • • …è l’elemento fondamentale della RS …è è costituito tit it da d un numero limitato li it t di elementi l ti …svolge 3 principali funzioni: funzioni 1. Funzione GENERATRICE • Crea e trasforma il significato delle altri componenti ti 2. Funzione ORGANIZZATRICE • D Determina i la l natura dei d i llegamii che h uniscono i tra loro gli elementi 3. Funzione STABILIZZATRICE • È l’elemento che più difficilmente si modifica ed è quello che le rende stabili e condivise + LA TEORIA Gli atteggiamenti e le rappresentazioni sociali + Gli atteggiamenti e le rappresentazioni sociali Sono due costrutti che rimandano all’articolazione tra livello individuale ((atteggiamenti) gg ) e sociale (RS) ( ) • Sono due costrutti che per essere misurati devono – in genere ricorrere a metodi e tecniche differenti • ATTEGGIAMENTI Posizioni/preferenze individuali rispetto Che cosa sono a delle scale di valore misurazioni q quantitative questionari Come li misuro scale likert, differenziali semantici… RAPPRESENTAZIONI SOCIALI rappresentazioni condivise misurazioni q qualitative e ‘sociali’ che favoriscano l’interazione tipo focus group ma… ma + Gli atteggiamenti e le rappresentazioni sociali • • • • • Le persone hanno atteggiamenti differenti verso un oggetto ma condividono di id una rappresentazione t i cognitiva iti dell’oggetto d ll’ tt L’atteggiamento è quindi un aspetto della RS La RS ‘tiene insieme’ i vari item di una scala di atteggiamento • In effetti anche le scale di atteggiamento gg implicitamente p sottendono l’idea di una RS dell’oggetto che viene esplorata e misurata ‘pezzo a pezzo’ nei diversi item della scala Il punto di vista individuale si àncora quindi ad un sistema di valori e significati sociali Studiare le RS ci consente di confermare le eventuali costanti dell’immagine condivisa di un oggetto e anche di rilevare nuovi aspetti tti + MA QUINDI COSA C’ENTRA C ENTRA EVOC? + • • • EVOC È un software che vuole ricostruire con un metodo più quantitativo (a partire dal dato qualitativo) le RS condivise da gruppi di soggetti Parte dal metodo delle associazioni libere, in p particolare sul concetto di EVOCazione gerarchizzata Si presenta ai soggetti una parola stimolo in un questionario o i un colloquio: in ll i • • • la parola stimolo è l’oggetto della RS vengono studiate le parole/i verbi/gli aggettivi che ad essa vengono associate I concetti chiave sui quali opera sono: • la FREQUENZA • il RANGO delle parole citate in libera associazione allo stimolo dato + EVOCazione gerarchizzata: 2 punti di vista Tecnica delle associazioni libere considera due indicatori di gerarchia: • • FREQUENZA DI PAROLA RANGO DI PAROLA Problemi dell’evocazione gerarchizzata: Per VERGES Le parole liberamente associate riproducono una gerarchia di importanza: le prime che vengono citate sono anche h lle più iù iimportantii Per ABRIC Il rango di comparsa non è necessariamente rango di importanza: bisogna chiedere al soggetto di gerarchizzare successivamente. Il compito prevede quindi due fasi: associazione libera + gerarchizzazione. gerarchizzazione + La struttura della rappresentazione RANGO F R E Q U E N Z A ALTO BASSO ALTA ZONA DEL NUCLEO CENTRALE (a) ( ) PRIMA PERIFERIA (b) BASSA ELEMENTI DI CONTRASTO (c) SECONDA PERIFERIA (d) (a): elementi frequenti e importanti (b): elementi periferici più importanti (c): elementi enunciati da pochi soggetti che li considerano molto importanti (d): elementi poco presenti e poco importanti + L’output L output principale di EVOC Nucleo centrale 1° e 2° periferia if i Elementi di contrasto + Quando uso EVOC? Ho un tema FOCUS che voglio esplorare partendo da quello che pensano le persone (un gruppo o più gruppi di persone) Ricorro quindi alle libere associazioni intorno ad un tema focus, l’indagine non è guidata ma spontanea Voglio che siano i soggetti a dirmi cosa pensano, no item già strutturati come le scale di atteggiamento Mi interessano i t le l PAROLE associate i t all tema t FOCUS indagato i d t - più iù che i contesti in cui vengono usate Voglio ricostruire il mondo di significati intorno ad un oggetto Voglio ricostruire la rappresentazione sociale di uno o più gruppi di soggetti in merito all’oggetto all oggetto indagato Voglio ricorrere ad uno strumento agile: un questionario con eventualmente delle domande aperte p Posso esplorare e confermare i temi emergenti dall’analisi di domande aperte + Il questionario (es.) (es ) Elenca negli spazi sottostanti le prime 3/5 parole che ti vengono in mente quando pensi alla parola: ENERGIA NUCLEARE Attenzione! Nella domanda di consegna è necessario specificare bene se chiediamo ‘parole’ oppure verbi, aggettivi, sensazioni Importanza dell’ordine di gerarchia (se vogliamo possiamo chiedere ai soggetti di riordinarle secondo l’importanza) Possiamo anche aggiungere una domanda aperta dove i soggetti possono esprimere e spiegare apertamente il proprio punto di vista (dare uno spazio limitato per evitare temi ma anche per non scoraggiare rispetto alle nostre aspettative) Scegliere quali sono le variabili socioanagrafiche che ci possono interessare per far emergere e studiare eventuali differenze nelle RS + Il corpus • • Preparare un file excel.csv (con separatori di elenco); Le prime colonne sono le variabili illustrative numeriche • • • • • ATTENZIONE! EVOC non considera le parole con 1 o 2 lettere e quindi elimina le preposizioni Per unire più parole bisogna usare trattino “-” o slash es. ‘benben retribuito’ o ‘ben/retribuito’ Inserire ’99’ nei casi mancanti ma solo nelle variabili illustrative NON nelle associazioni • La prima colonna è l’identificativo numerico Le colonne seguenti: variabili illustrative che si intendono analizzare Dopo le variabili illustrative c’è una colonna per ogni associazione ((minimo 3 associazioni) + La schermata principale di EVOC + Ricordarsi sempre di dare il comando EXECUTER per eseguire trasformazione del file csv in txt Pulizia del corpus Esce del programma Creazione del vocabolario e del nuovo vocabolario dopo pulizia Presenta matrice di co-occorrenze tra le parole più frequenti Imposta le soglie i e fissa le 4 aree della RS Consente di creare categorie e di classificare le p parole in queste categorie Studio delle frequenze e analisi di rango, si scelgono le soglie Lista dei contesti in cui compare ogni parole (in quale posizione) Confronta distribuzioni di parole in sottopopolazioni di soggetti Consente di fare analisi su sottopopolazion p p i di soggetti + I comandi LEXIQUE e TRIEVOC OUVRIR FICHIER: aprire il file NB I file di ogni analisi vengono messi nella cartella dove c’è c è il file d’origine d origine. LEXIQUE: il file csv o txt è convertito in un documento di testo utilizzabile da EVOC. • • • Es:1;1;2;19;3;1;2;5;2; 1interessante 2utile 3affascinante 4parlare 5consigliare 6ascoltare 2;1;2;19;3;2;2;6;#NULLO!; 1empatico 2sensibile 3attento 4ascoltare 5riflettere 6i l b 6rielaborar 3;1;1;21;5;2;2;4;1; 1allegro 2professionale 3interessante 4studiare 5pensare Indicare il numero di colonne delle variabili illustrative, illustrative compreso identificativo (attenzione: lo chiede 2 volte) TRIEVOC: crea il vocabolario + Il comando NETTOIE • Pulizia del corpus testuale meglio farla in Excel prima di importare il file in EVOC ma qui si può controllare se è tutto ok e consente di: • • Eliminare i refusi Accorpare – eventualmente alcune parole Deve essere ricontrollato dopo rangmot (!) • • Ricordarsi di salvare le modifiche Ricordarsi di ESEGUIRE NUOVAMENTE TRIEVOC affinché le modifiche siano salvate nel (nuovo) vocabolario (tm2) + Il file RANGMOT Nombre total de mots differents : 239 Nombre total de mots cites : 862 moyenne generale : 2.94 I N D I V I D U O L E DISTRIBUTION DES FREQUENCES freq. q * nb. mots * Cumul evocations et cumul inverse 1 * 141 141 16.4 % 862 100.0 % 2 * 29 199 23.1 % 721 83.6 % 3 * 18 253 29.4 % 663 76.9 % 4 * 15 313 36.3 % 609 70.6 % 5 * 4 333 38.6 % 549 63.7 % 6 * 6 369 42.8 % 529 61.4 % 7 * 2 383 44.4 % 493 57.2 % 8 * 3 407 47.2 % 479 55.6 % 9 * 2 425 49.3 % 455 52.8 % S 10 * 2 445 51.6 % 437 50.7 % O 12 * 1 457 53.0 % 417 48.4 % G 14 * 4 513 59.5 % 405 47.0 % L 15 * 1 528 61.3 % 349 40.5 % I 16 * 1 544 63 63.1 1 % 334 38 38.7 7 % 1 562 65.2 % 318 36.9 % E 18 * 20 * 1 582 67.5 % 300 34.8 % 21 * 1 603 70.0 % 280 32.5 % 25 * 1 628 72.9 % 259 30.0 % 28 * 1 656 76 76.1 1 % 234 27 27.1 1 % 30 * 2 716 83.1 % 206 23.9 % 33 * 1 749 86.9 % 146 16.9 % 36 * 1 785 91.1 % 113 13.1 % 77 * 1 862 100.0 % 77 8.9 % 239 numero totale di parole differenti 862 numero totale di parole citate 2.94 media del rango delle parole citate (effettiva, p ( , non teorica) 141 HAPAX = parole che compaiono una sola volta INDICI LESSICALI Indice di Diversità lessicale: forme distinte/occorrenze totale 239/862=0,27 più è alto più il linguaggio è diverso, vario Indice di Rarità lessicale: hapax/forme distinte 141/239 = 0,58 più iù è alto l più iù il linguaggio li i è composto da parole rare + I comandi SELEVOC e COMPLEX SELEVOC: Serve per selezionare un sottocampione Attenzione! I nomi dei file delle analisi sono sempre gli stessi! Per evitare di sovrascrivere i file delle analisi p precedenti NOMINARE i vecchi file o creare sottocartelle. Selezionare la colonna in cui si trova la variabile illustrativa che ci interessa Selezionare il codice della variabile che indica il sottogruppo e/o i sottogruppi che vogliamo selezionare COMPLEX: Confronto tra i gruppi prescelti Indicare l’etichetta del sottogruppo es. ‘conservatori’ Scegliere le sottopopolazioni da confrontare - Aprire il rapporto di complex e analizzare: • le l parole l uniche i h per ciascun i gruppo • le parole comuni con le rispettive frequenze • confronto tramite calcolo delle specificità (t-student) + Il comando CATEVOC CATEVOC: Serve categorizzare le parole . RECODCAT: ricodifica le parole in categorie • • File .CAA File .PAR elenco categorie g con parole p categorizzate g e frequenze q elenco categorie + La legge gg di Zipfs p – il meccanismo che utilizza EVOC • È una legge empirica che descrive la frequenza di un evento Pi facente parte di un insieme, in funzione della posizione i (detta rango) nell'ordinamento decrescente rispetto alla frequenza q stessa di tale evento. f(P ( i)=c =c/i /i • • i indica il rango Pi indica l'evento che occupa l'i-esimo rango (ovvero l'i-esimo evento più frequente) • f(Pi) è il numero di volte (frequenza) che si verifica l'evento Pi • c è una costante di normalizzazione, p pari al valore f(P ( 1)). + Summary delle sequenze operative CLICCARE SEMPRE SU EXECUTER DOPO AVER SELEZIONATO OGNI COMANDO! Sal o il file excel Salvo e cel csv cs in una na cartella • tutte le analisi sul file verranno salvate in questa cartella Ouvrir ficher colonne prima delle associazioni) TRIEVOC crea vocabolario apro il file e indico subito il numero di variabili illustrative (provvisorio • Indica numero di righe (casi) e numero di mots (parole associate) NETTOIE • modificare,, riscrivere,, accorpare, p , pulire p il corpus p Dopo le operazioni ricordarsi di salvare (FERME ET ENREGISTRE) Ancora TRIEVOC per far girare il nuovo vocabolario! RANGMOT ci chiede il rango medio (teorico) • Es. se chiediamo 3 parole associate il rango medio è 2 Apro il file RANGMOT e devo frequenze e ranghi • Numero totale di parole usate, numero totale di parole, moyenne generale media reale (calcolata sul numero reale di parole citate) RANGMOT scelgo soglie e imposto, poi EDITER Apro il file TABRGFR ed ho il mio OUTPUT che mi presenta i 4 quadranti della RS