Statistica con il computer
Transcript
Statistica con il computer
MANAGEMENT INFERMIERISTICO PER LE FUNZIONI DI COORDINAMENTO Disciplina informatica METODOLOGIE PER LA RICERCA INFERMIERISTICA Polo di Formazione Universitaria Ospedale San Giovanni Evangelista Aprile 2010 Mario Gentili Perché la ricerca L’obiettivo della ricerca infermieristica è quello di migliorare le procedure di assistenza al paziente di contribuire a una migliore comprensione delle condizioni riguardanti gli esseri umani. Queste ricerche, oltre che ad essere dettate da sentimenti umanitari, devono conformarsi a: principi scientifici generalmente accettati, sperimentazione eseguita in modo adeguato e su un’ampia conoscenza della letteratura scientifica. www.mariogentili.it 2 Come cambia la professione L’infermiere, in collaborazione con il medico, deve comunque avere la possibilità di impiegare nuove procedure diagnostiche o terapeutiche nel trattamento dei malati, nel caso in cui queste concorrono alla possibilità di salvarne la vita, di ristabilirne lo stato di salute o di alleviarne le sofferenze. La ricerca clinica deve essere accompagnata da analisi statistiche in cui vengono analizzati i dati clinici e anamnestici dei pazienti. A tal proposito sorgono problematiche correlate alla memorizzazione dei dati, al trattamento, allo scambio delle informazioni tra ricercatori e alla comunicazione dei dati personali dei pazienti. www.mariogentili.it Dotarsi di un metodo Necessita quindi l’adozione di una metodologia di supporto che va dalla raccolta dati alla comunicazione dei risultati, passando attraverso una moltitudine di metodi statistici per trattarli e le soluzioni offerte dal mondo dell’Open Source o aderenti agli standard della struttura sanitaria. www.mariogentili.it Terminologia ¡ ¡ Ricerca Indagine sistematica intrapresa per scoprire fatti o relazioni e raggiungere conclusioni usando un metodo scientifico (Hockey, 1996). Ricerca della letteratura L’identificazione ed il recupero sistematico della letteratura su uno specifico tema o per uno specifico obiettivo. www.mariogentili.it Terminologia ü Ricerca: Atto, effetto del ricercare ü Indagine conoscitiva condotta con sistematicità e tendente ad accrescere o a verificare il complesso di cognizioni, documenti, teorie, leggi inerenti ad una determinata disciplina (Enciclopedia Zanichelli) ü Indagine volta ad accrescere le cognizioni che si posseggono in una qualsiasi disciplina, condotta sistematicamente e secondo i metodi scientifici propri di quella disciplina (Enciclopedia Garzanti) www.mariogentili.it Il codice deontologico “L’infermiere aggiorna le proprie conoscenze attraverso la formazione permanente, la riflessione critica sull’esperienza e la ricerca, al fine di migliorare la sua competenza. L’infermiere fonda il proprio operato su conoscenze validate e aggiornate, così da garantire alla persona le cure e l’assistenza più efficaci. L’infermiere partecipa alla formazione professionale, promuove ed attiva la ricerca, cura la diffusione dei risultati, al fine di migliorare l’assistenza infermieristica”. (articolo 3.1) www.mariogentili.it Come utilizzare i dati statistici Ci sono alcune semplici linee guida da tenere a mente quando si usano dati statistici: Partire con le idee chiare Definire in modo il più possibile preciso l’obiettivo della ricerca, per individuare correttamente le informazioni che servono ed evitare di raccogliere dati che non verranno utilizzati e che possono confondere. Individuare la fonte di produzione dei dati www.mariogentili.it Partire con le idee chiare Ci sono alcune semplici linee guida da tenere a mente quando si usano dati statistici: 1 Partire con le idee chiare: chiare è indispensabile definire in modo il più possibile preciso l’obiettivo della ricerca, per individuare correttamente le informazioni che servono ed evitare di raccogliere dati che non verranno utilizzati e che possono confondere. www.mariogentili.it Dove prendere i dati 2 Individuare la fonte di produzione dei dati: dati identificare cioè quale organizzazione o ufficio o ente può avere le informazioni che si stanno cercando. Il termine fonte assume diverse accezioni, per esempio: ¡ è l’ente che produce ed è responsabile del dato (l’Istituto nazionale di statistica, il Ministero della Salute, l’ufficio Ragioneria, ecc…); ¡ è la rilevazione/elaborazione da cui proviene il dato, ad esempio, la rilevazione campionaria sui degenti o il censimento della popolazione; ¡ è la pubblicazione su carta, cd-rom, o sito web su cui è diffuso il dato, ad esempio, l’Annuario statistico italiano o il database del censimento delle attività ospedaliere. www.mariogentili.it Come scegliere le fonti 2 I dati statistici possono provenire da diverse fonti: censimenti, rilevazioni campionarie, elaborazioni di dati raccolti all’interno di procedimenti di tipo amministrativo (che chiameremo “dati di fonte amministrativa”). Ogni fonte presenta aspetti e particolarità da considerare attentamente. Tipologie possibili di fonti: ¡ Dati da censimenti e da altre rilevazioni totali ¡ Dati da rilevazioni campionarie ¡ Dati di fonte amministrativa www.mariogentili.it Dati da censimenti 2 I censimenti e le rilevazioni totali si riferiscono a dati raccolti per tutte le unità che appartengono a un collettivo o a una popolazione. Scegliendo di usare dati provenienti da questa fonte, dobbiamo considerare i seguenti aspetti: ¡ i risultati sono riferibili all’intera popolazione; ¡ sono disponibili informazioni molto dettagliate; ¡ di norma, se si tratta di censimenti, si effettuano ogni dieci anni e richiedono tempi di realizzazione lunghi, sicuramente maggiori di quelli necessari per una rilevazione campionaria. Criticità: la frequenza di aggiornamento www.mariogentili.it Rilevazione campionaria 2 In una rilevazione campionaria, si richiedono le informazioni soltanto a una parte della popolazione. Scegliendo di usare dati provenienti da questa fonte, dobbiamo considerare i seguenti aspetti: ¡ ¡ ¡ i risultati si estendono all’intera collettività di appartenenza secondo metodi di induzione che rappresentano il contenuto della statistica inferenziale (dal particolare al generale); il livello di dettaglio delle informazioni è legato al tipo di campionamento adottato e alla numerosità campionaria; la periodicità con cui si effettuano le rilevazioni varia e l’informazione è disponibile in tempi relativamente brevi, sicuramente minori di quelli necessari per le rilevazioni totali. Criticità: la consistenza del campione www.mariogentili.it Dati di fonte amministrativa 2 Questi dati sono raccolti come risultato del lavoro di un’istituzione pubblica. Esempi includono dati su nascite, morti, matrimoni, divorzi. Scegliendo di usare dati provenienti da questa fonte, dobbiamo considerare i seguenti aspetti: ¡ ¡ ¡ ¡ i risultati sono riferibili all’intera popolazione poiché i dati vengono raccolti su ogni unità del collettivo, per un lungo periodo e con le stesse modalità; le informazioni sono limitate alla popolazione oggetto di rilevazione perché sono raccolte per specifiche esigenze amministrative (per esempio, la serie storica sulla statura degli italiani è limitata ai maschi poiché la leva ha riguardato storicamente soltanto i maschi); le definizioni sono adeguate ai bisogni informativi del sistema amministrativo e quindi possono non considerare aspetti di interesse del ricercatore e possono essere non confrontabili con altri dati; il controllo e l’accuratezza della rilevazione possono variare da organizzazione a organizzazione e ciò può rendere difficile il confronto tra statistiche relative a uno stesso fenomeno ma provenienti da istituzioni diverse. www.mariogentili.it Criticità: diversità di obiettivi Come trovare le informazioni 3 Trovare le informazioni Se la fonte è un ente, come per esempio l’Istat, i dati sono in genere disponibili sul sito istituzionale. Qualunque sia la fonte di provenienza dei dati, occorre: ¡ verificare la loro attualità (per i nostri fini) attraverso la data di aggiornamento, ¡ consultare attentamente i metadati che li descrivono, ovvero la “descrizione” di quanto la sigla o un nome di un dato rappresenta. Questo processo ci permette di annullare le ambiguità e le incomprensioni. www.mariogentili.it Chiarire tutto e subito 4 Identificare con chiarezza il metodo, i termini, i concetti e le definizioni usate Individuare: come ¡ le modalità di rilevazione, cosa ¡ la popolazione di riferimento, strumenti ¡ la metodologia usata nella costruzione delle statistiche. In questo modo, si potranno sempre confrontare informazioni provenienti da fonti diverse o di periodi precedenti. www.mariogentili.it La popolazione e le variabili 4 La definizione di popolazione è strettamente legata alla definizione della caratteristica, o delle caratteristiche, da osservare su ciascuna unità statistica. In statistica si usa il termine variabile (oppure carattere) per indicare ogni caratteristica che viene rilevata su ciascuna unità. Nel censimento generale della popolazione, ad esempio, le variabili che vengono rilevate su ogni cittadino sono molte. Tra queste: sesso, giorno, mese e anno di nascita, luogo di nascita, titolo di studio, stato civile, mezzo di trasporto utilizzato per recarsi al luogo abituale di studio o di lavoro. www.mariogentili.it Le modalità di una variabile 4 Ciascuna variabile si presenta in modo diverso nelle varie unità statistiche; per questo motivo, si usa il termine modalità per indicare i modi in cui una certa variabile si può manifestare in un collettivo. Ad esempio, Maschio, Femmina sono modalità della variabile Sesso; i valori dell’età degli individui di un certo collettivo (ricavati dalle informazioni sulla data di nascita) sono modalità della variabile Età, i singoli luoghi di nascita sono modalità della variabile Luogo di nascita, e così via. www.mariogentili.it Riassumendo Popolazione (infermieri) Variabile 1 Variabile n (sesso) (età) Modalità 1 Modalità 3 (M) (fascia 20-30) Modalità 2 (F) www.mariogentili.it Modalità n (fascia 31-40) Le classi Quando i dati hanno questo dettaglio, non è semplice interpretare il fenomeno; è naturale domandarsi, ad esempio, se c’è differenza fra il numero di maschi e di femmine di una certa fascia di età, oppure se c’è prevalenza o meno degli anziani sui giovani, in generale e per i due sessi. Per avere questo genere di informazioni è necessario sacrificare il dettaglio e raggruppare più modalità insieme, formando delle classi. 4 www.mariogentili.it Le classi 4 Così, a partire dalla tabella 1 si può costruire un’altra tabella che presenta i dati in forma più sintetica e permette di leggere meglio il fenomeno. www.mariogentili.it Come diffondere i dati 5 Decidere in quale formato pubblicare i dati Le informazioni possono essere rilasciate secondo diverse modalità: in forma cartacea o in formato elettronico (web, media, cd-rom). Occorre accertarsi sempre che: ¡ il formato si adatti alle possibilità individuali di lettura ed elaborazione dei dati, ¡ sia possibile recuperare nel tempo le informazioni. www.mariogentili.it Le tabelle 5 La tabella è uno schema che consente di presentare i dati in modo ordinato e sintetico; quindi rende l’informazione statistica rapidamente leggibile. La tabella è un'immagine semplificata del fenomeno osservato. Può contenere anche risultati di elaborazioni sui dati raccolti: rapporti, differenze, valori medi eccetera. La tabella dovrebbe essere chiara e di facile comprensione. Qualche volta, invece, le tabelle sono complicate e difficili da leggere poiché raccolgono in poco spazio molte informazioni. Inoltre, i termini utilizzati sono spesso basati su definizioni minuziose, oppure sono poco chiari. www.mariogentili.it Le tabelle, quando utilizzarle? 5 Le tabelle, come i grafici, si utilizzano per dare visibilità ai dati dopo che sono stati raccolti individualmente ed elaborati. Tabelle e grafici si completano a vicenda e concorrono a descrivere il fenomeno che costituisce l’oggetto dell'indagine. La tabella è la prima sintesi sistematica a cui si perviene dopo aver raccolto i dati e prodotto l’informazione statistica. È il punto di partenza per la rappresentazione, la lettura, l’interpretazione e l’elaborazione successiva. www.mariogentili.it Le tabelle, quando utilizzarle? 5 A questo fine una tabella deve avere le seguenti caratteristiche: ¡ deve presentare dati statistici dotati di senso; ¡ non deve contenere dati ambigui; ¡ deve trasmettere informazioni in modo efficiente. Una regola generale è la seguente: se occorre citare soltanto alcune informazioni numeriche (4-5 e comunque meno di 10), non è in genere opportuno introdurre una tabella, salvo che nel testo si citino quelle essenziali e la tabella le dettagli. Il ricorso alle tabelle è appropriato per presentare tra una ventina e un centinaio di dati. Al di sopra di questo numero, è di solito più indicato un grafico o una figura. www.mariogentili.it Gli elementi delle tabelle 5 Ogni tabella deve essere autoesplicativa. A questo scopo è necessario che la tabella abbia un titolo che renda evidente il suo contenuto. Il titolo deve indicare l’insieme (popolazione) degli elementi (unità statistiche) su cui è stata effettuata la rilevazione; che cosa è stato rilevato (caratteristica o carattere); il riferimento temporale e territoriale della rilevazione; le eventuali elaborazioni effettuate sui dati. La tabella è organizzata per colonne. Ogni colonna deve portare la propria intestazione. L’insieme delle intestazioni forma la testata. La prima colonna (detta colonna madre) riporta le modalità del carattere rispetto alle quali è stata fatta la classificazione, oppure le occasioni nelle quali i dati sono stati rilevati. www.mariogentili.it Esempio 5 www.mariogentili.it Esempio 5 La preposizione per separa la popolazione oggetto dell’analisi dal carattere rispetto al quale la popolazione è classificata. Dunque la tabella presenta la popolazione residente classificata per regione. La colonna madre indica le regioni e le ripartizioni geografiche (modalità) cui la tabella si riferisce: Nord, Centro e Mezzogiorno. Utilizzando titolo e colonna madre siamo portati a ritenere che la tabella fornisca il numero (frequenza assoluta) dei residenti in ciascuna regione. Occorre allora capire il significato delle altre colonne, dove compaiono fra l’altro anche valori negativi. www.mariogentili.it Esempio 5 In un dato intervallo di tempo, qualsiasi popolazione si modifica numericamente sia per via naturale (per effetto della differenza tra i nati vivi e i morti), sia per effetto di movimenti migratori (differenza tra gli iscritti e i cancellati nei registri anagrafici). L’eccedenza (deficit) di nascite rispetto alle morti è detta saldo naturale come risultato del movimento naturale; è ciò che compare nella seconda colonna. L’eccedenza (deficit) degli iscritti da altri comuni e dall’estero e i cancellati per altri comuni e per l’estero è detta saldo migratorio; è ciò che compare nella penultima colonna come risultato del movimento migratorio. www.mariogentili.it Esempio 5 Le considerazioni fatte consentono di rispondere ad alcune domande: •quanto era la popolazione italiana residente al 31 dicembre 2003? •in quale regione geografica la popolazione era maggiore? •dove è stato maggiore il numero dei morti rispetto al numero dei nati vivi? •in quale regione il numero delle immigrazioni dall’estero è stato maggiore? •vi è stata qualche area dove la cancellazione per emigrazione ha superato l’iscrizione per immigrazione? •se per l’Italia, nel corso del 2003, il saldo migratorio fosse stato nullo, per il solo effetto del saldo naturale la popolazione residente sarebbe aumentata o diminuita? www.mariogentili.it I grafici: quando utilizzarli 5 Il grafico è uno strumento immediatamente comprensibile, che mette efficacemente in luce i fatti che si vogliono presentare. A questo fine un grafico deve essere: •fedele nel tradurre i dati in elementi grafici; •semplice e chiaro: non deve contenere elementi di ambiguità; •accurato nella rappresentazione di differenze e similarità; •completo di titoli e indicazioni che immediatamente e con sicurezza identifichino l'oggetto della rappresentazione. Idealmente, un grafico dovrebbe trasmettere al lettore informazioni che non sarebbero altrettanto efficacemente presentate con una tabella o con una descrizione testuale www.mariogentili.it I grafici: i principali tipi 5 Esiste una grande varietà di rappresentazioni grafiche. I grafici più semplici e nello stesso tempo più efficaci e comunemente utilizzati sono: •i grafici a barre •i grafici a settori circolari (grafici a torta) •gli istogrammi •i grafici a punti www.mariogentili.it I grafici: le barre 5 Sono molto utilizzati per rappresentare la frequenza con cui si presentano le modalità di un carattere qualitativo (sesso, religione praticata). Per esempio, abbiamo rilevato il carattere Sesso di 118 bambini di una scuola elementare. Sono risultati 75 bambini e 43 bambine. Possiamo visualizzare i risultati ottenuti in questo modo: www.mariogentili.it I grafici: le barre 5 È anche possibile rappresentare contemporaneamente sullo stesso grafico due o più caratteri in diverse situazioni (di luogo o di tempo), come per esempio la raccolta di rifiuti urbani per regione - Anno 2001 (in tonnellate) www.mariogentili.it I grafici: le torte Supponiamo di voler rappresentare la seguente distribuzione: 5 Adatto nei casi in cui si vuole confrontare il singolo con il tutto. La torta è il 100% www.mariogentili.it I grafici: istogrammi 5 Si usano per rappresentare graficamente dati quantitativi suddivisi in classi. Ogni frequenza è rappresentata dall'area di un rettangolo, la cui base è uguale all'ampiezza della classe e l'altezza è pari alla densità di frequenza, cioè al rapporto tra la frequenza della classe e l'ampiezza della classe stessa. www.mariogentili.it I grafici a punti 5 Si usano per rappresentare il valore assunto da due variabili su una stessa unità statistica (per esempio il peso e l'altezza di una persona, oppure l'età e il suo reddito mensile). Attraverso questa rappresentazione è possibile verificare visivamente se le due variabili sono connesse, cioè se il comportamento di una è legato al comportamento dell'altra. Il grafico si costruisce su un piano individuato da due assi perpendicolari fra loro (ortogonali), graduati e orientati. Su ciascun asse è riportata l'unità di misura di una delle due variabili considerate. Le unità statistiche sono poi riportate sul piano nel modo seguente: ogni unità è rappresentata da un punto; i punti sono individuati attraverso le rispettive coordinate. www.mariogentili.it I grafici a punti 5 Per esempio abbiamo rilevato su 10 atleti il peso (in Kg) e l'altezza (in cm). Allora, indicando con X il peso e con Y l'altezza, avremo: www.mariogentili.it Il metodo in cinque passi Riassumendo: 1 Definire l’obiettivo della ricerca 2 Individuare le fonti 3 Trovare informazioni attuali 4 Descrivere il metodo usato 5 Pubblicare le informazioni www.mariogentili.it Gli strumenti a disposizione Non strutturati Strutturati ¡ interviste ¡ Questionari ¡ storie di vita ¡ scale ¡ diari ¡ check-list ¡ schede www.mariogentili.it La scala di Likert Tale tecnica consiste principalmente nel mettere a punto un certo numero di affermazioni (tecnicamente definiti item) che esprimono un atteggiamento positivo e negativo rispetto ad uno specifico oggetto. La somma di tali giudizi tenderà a delineare in modo ragionevolmente preciso l'atteggiamento del soggetto nei confronti dell'oggetto. Per ogni item si presenta una scala di accordo/disaccordo, generalmente a 5 o 7 passi ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ www.mariogentili.it Fortemente d’accordo d’accordo incerto in disaccordo fortemente in disaccordo sempre frequentemente talvolta raramente mai Eccellente ottimo buono soddisfacente scarso La scala di Likert VAS NRS Scala Espressioni facciali www.mariogentili.it I questionari • • • • • • • • • Iniziare con l’argomento considerato il più importante Raggruppare le domande che vertono sullo stesso contenuto (stessa area) Posizionare le domande riguardanti i sentimenti e la sensibilità verso la metà del questionario Le domande su aspetti demografici devono essere poste alla fine Fare domande specifiche e non generali Utilizzare un linguaggio semplice- appropriato Ogni domanda dovrebbe rappresentare un concetto, non fare due domande contemporaneamente Delimitare ogni riferimento al tempo ( es spesso) Comporre le domande in modo neutrale www.mariogentili.it I questionari Virginia Henderson Biografia Figlia di un avvocato di Washington, Virginia Henderson nasce a Kansas City nel 1897. Nel 1918 si iscrive alla Scuola Militare di nursing di Washington. Una volta diplomata percorre una strepitosa carriera nel campo dell'insegnamento. Pubblica inoltre numerosi testi e si occupa attivamente di ricerca, principalmente presso la Yale University. Opere The Principles and Practice of Nursing (1955); Basic Principles of Nursing Care (1960) . La Henderson è l'autrice della più celebre e ancor oggi accettata definizione del nursing, contenuta nell'edizione del 1955 del volume The Principles and Practice of Nursing: "La peculiare funzione dell'infermiere è quella di assistere l'individuo malato o sano nell'esecuzione di quelle attività che contribuiscono alla salute o al suo ristabilimento (o ad una morte serena), attività che eseguirebbe senza bisogno di aiuto se avesse la forza, la volontà o la conoscenza necessarie, in modo tale da aiutarlo a raggiungere l'indipendenza il più rapidamente possibile". “Per poter parlare del nursing come scienza, bisogna dimostrare che esso si presta ad essere oggetto di ricerca scientifica[…]Se oggi, in tutte le professioni come l’industria, l’indagine scientifica serve a risolvere dei problemi e fornisce la base alle attività di programmazione, perché dovrebbe fare eccezione proprio la professione infermieristica?” www.mariogentili.it Elaborazione dei dati: gli indici Una volta che i dati elementari sono stati raccolti, organizzati in tabelle e trasformati graficamente è spesso opportuno procedere a semplici elaborazioni matematiche per sintetizzarli, cioè riassumere l’informazione che contengono in pochi valori di immediata e semplice lettura. Questo renderà più agevole l’interpretazione e faciliterà i confronti nel tempo e nello spazio. Gli indici sintetici più usati sono: •la media aritmetica •la media ponderata •la mediana •la moda www.mariogentili.it La media aritmetica La media aritmetica – detta anche semplicemente - media è il valore che rappresenta la ripartizione egualitaria di una variabile (carattere) quantitativa tra le unità del collettivo. Può essere calcolata solo su variabili quantitative. Si calcola sommando i valori di tutte le osservazioni presenti nel collettivo e dividendo il totale così ottenuto per il numero di osservazioni. www.mariogentili.it La media aritmetica Esempio Prendiamo la riga finale che riporta i totali delle frequenze sommate per colonna e riscriviamola in questo modo: www.mariogentili.it La media aritmetica Per calcolare la media aritmetica aggiungiamo alla tabella una colonna in cui riportiamo il risultato delle moltiplicazioni riga per riga tra il valore della modalità e la sua frequenza. Attenzione: l’ultima modalità, 6 o più, rappresenta il raggruppamento dei valori più elevati della distribuzione: le famiglie con 6, 7, 8, …fino al più alto numero di componenti osservati nel Censimento 2001 sono state messe tutte insieme in un’unica classe di valori detta aperta e descritta con una qualità (6 o più) e non una quantità. Per calcolare la media aritmetica abbiamo bisogno di attribuire un valore numerico a questa modalità. Poiché la frequenza di famiglie numerose decresce rapidamente all’aumentare del numero di componenti (per esempio, le famiglie con 8 componenti sono molto meno di quelle con 7 e così via) conviene attribuire un valore piuttosto basso: ho scelto 7. Ora abbiamo tutti gli elementi per effettuare il calcolo: numero medio di componenti per famiglia: 56.816.857/21.810.676=2,6. www.mariogentili.it La media ponderata Nella media ponderata (detta anche pesata), i singoli valori prima di essere sommati tra di loro vengono moltiplicati per il loro peso. Il peso è l’importanza che il singolo valore riveste. La somma così ottenuta, viene divisa per la somma dei pesi: www.mariogentili.it La media ponderata Esempio: Esame voto peso storia 18 6 geografia 20 4 matematica 25 12 (18 x 6) + (20 x 4) + 25 x 12) = 22 108 + 80 + 300 = 22,18 22 www.mariogentili.it La mediana La mediana di una variabile è il valore dell’unità che si trova a metà della distribuzione, in modo che il 50 per cento del collettivo abbia un valore della variabile uguale o inferiore a esso e il restante 50 per cento un valore superiore. Per calcolare la mediana è necessario che la variabile sia quantitativa o almeno qualitativa ordinata, cioè tale che i valori possano essere ordinati in senso crescente (per esempio, i giudizi espressi da un insegnante sono ordinabili anche se non sono espressi in termini quantitativi: non sufficiente, sufficiente, discreto, buono, distinto, ottimo…). www.mariogentili.it La mediana Esempio Calcolo della mediana delle stature (in metri) di 5 studenti: 1,72 1,68 1,75 1,80 1,74. Prima di tutto ordiniamo la statura dei ragazzi in senso crescente: 1,68 1,72 1,74 1,75 1,80. Il valore mediano è quello presentato dallo studente che si trova al 3° posto di questa distribuzione e che ha altezza pari a 1,74. In modo formale procediamo così: se n è il numero di unità del collettivo (5 nel nostro esempio), individuiamo il posto occupato nella distribuzione dal valore mediano con: Nel nostro caso: (5+1): 2=3, quindi, il valore mediano è quello presentato dalla terza unità del collettivo allorchè ordinato, cioè 1,74. www.mariogentili.it La moda La moda è il valore che si presenta con maggiore frequenza nella distribuzione. Se nessun valore si presenta più frequentemente degli altri la distribuzione è senza moda. Sono anche possibili distribuzioni con due o più valori modali. Se i dati sono raggruppati in classi, si può individuare la classe modale, cioè la classe con densità di frequenze più elevata o con frequenza più elevata se tutte le classi hanno uguale ampiezza. Diversamente dalla mediana, che richiede caratteri almeno ordinabili, e dalla media, che può essere calcolata soltanto su variabili quantitative, la moda può essere calcolata per qualunque tipo di variabile, anche per le variabili qualitative sconnesse. Tuttavia, la moda è un indicatore piuttosto povero di informazioni perché indica soltanto il valore che si presenta con maggiore frequenza. www.mariogentili.it La moda Esempio la moda è 5 perché 5 è il valore che si presenta 4 volte nella distribuzione di frequenza dei voti la moda è buono e distinto perché si presenta 6 volte nella distribuzione di frequenza dei giudizi www.mariogentili.it