scala di misurazione statistica variabile

Transcript

scala di misurazione statistica variabile
Luisa Bernardinelli e Pietro Cavagna
BIOSTATISTICA
Prima parte
Corso di Laurea in x LM Biologia Sperimentale ed
Applicata.
Anno accademico 2013-2014
1
INTRODUZIONE
2
STATISTICA
• STATISTICA DESCRITTIVA
Insieme
di
metodi
per
la
l’organizzazione, la sintesi di dati.
raccolta,
• STATISTICA INFERENZIALE
Insieme di metodi che permettono di analizzare i
dati estratti da un campione limitato per arrivare a
conclusioni applicabili all’intera popolazione.
I dati provengono dall’area biologico-sperimentale
3
STUDI STATISTICI
Finalità di uno studio statistico
• Rispondere a quesiti scientifici come:
Le osservazioni che ho fatto hanno portato a risultati
diversi dal caso e significativi ?
L’esperimento che ho condotto ha portato a risultati
diversi dal caso e significativi ?
Es: Vi e’ associazione fra un determinato gene e una specifica malattia?
Es: Diverse condizioni di allevamento determinano variazioni
significative di questo carattere del fenotipo?
Es: Quale antibiotico funziona meglio nei confronti di questo ceppo
batterico? ……
• Predire quantità non osservate o non osservabili:
Es: L’incidenza dell’influenza nella prossima stagione invernale;
Es: Il numero di animali nati in allevamento nel prossimo anno;
Es: La variazione in biomassa in rapporto al cambio climatico
.
4
FASI DI UNO STUDIO
1
Individuazione del problema
5
Verifica delle
ipotesi
4
Raccolta e analisi dei
dati
2
Formulazione
dell’ipotesi
3
Elaborazione del
piano di ricerca
5
• STUDI SPERIMENTALI
Il ricercatore interviene direttamente sul valore
delle variabili primarie negli casi-individui
studiati (tipico esperimento di laboratorio o di
studi clinici in cui si controlla il trattamento).
Limitato impiego uomo-animale per fattori etici.
• STUDI OSSERVAZIONALI
Il ricercatore non interviene direttamente, non
manipola le variabili primarie, ma osserva ciò che
accade naturalmente, spontaneamente (effetto
della dieta, dell’inquinamento , delle stagioni….).
Largo impiego: non esistono problemi etici
6
DESCRITTIVI: ECOLOGICI
STUDI
OSSERVAZIONALI
TRASVERSALI
ANALITICI
PROSPETTIVI
CASO-CONTROLLO
7
LA RACCOLTA DEI DATI
può essere effettuata:
• Indirettamente
Da banche dati, da dati interni
(registri, siti web, cartelle cliniche, archivi museali, lavori
precedenti…).
• Direttamente
Mediante sperimentazione o con indagine anche
retrospettiva tramite questionario.
8
GLOSSARIO MINIMO
9
POPOLAZIONE
Totalità di elementi cui il ricercatore è interessato
in un dato studio.
POPOLAZIONE FINITA
Gli elementi sono in numero finito e quindi
potrebbero essere tutti osservati.
• I residenti nel Comune di Pavia nell’anno 1950;
• gli studenti iscritti a questo corso.
POPOLAZIONE INFINITA
Gli elementi sono una successione infinita.
• I soggetti affetti da AIDS;
• Il numero di batteri del genere…”Clostridium,
Bacillus, Escherichia….”
È una popolazione infinita perché non limitata né nel
tempo né nello spazio.
10
CAMPIONE
Parte di popolazione selezionata per la raccolta
dei dati.
Un campione
popolazione.
è
un
sottoinsieme
di
una
Popolazione
Campione
Campione ⊂ Popolazione
11
UNITA’ STATISTICA
Minima unità da cui si raccolgono i dati in
un’indagine
o, in altre parole,
ciascuno dei componenti il campione su cui si
rilevano i dati.
Esempio
Si vuole condurre un’indagine statistica su animali di un
parco faunistico, in un dato arco di tempo.
Le unità statistiche sono i singoli animali del parco
faunistico, nell’arco di tempo considerato.
La natura dell’unità statistica è varia, ma è
costante nello studio.
12
VARIABILE
Caratteristica rilevata su ogni unità statistica, che
può assumere valori diversi nelle diverse unità
statistiche.
• Statura degli studenti maschi iscritti al 1o anno
del Corso di Laurea in Ingegneria nel corrente
a.a.;
• Gruppo sanguigno A, B, AB, 0 dei soggetti
campionati;
• Intensità di reazione, ad un antigene (nulla,
bassa, alta) nei soggetti studiati.
13
OSSERVAZIONE
Valore assunto da una
determinata unità statistica.
UNITÀ
STATISTICA
Individuo 1
Individuo 2
Individuo 3
variabile
in
una
VARIABILE
(PESO)
80 kg
\
75 kg — OSSERVAZIONI
78 kg
/
14
CLASSIFICAZIONE DELLE
VARIABILI
• QUALITATIVE
NOMINALI
- DICOTOMICHE
- POLITOMICHE
ORDINALI
• QUANTITATIVE
DISCRETE
CONTINUE
15
VARIABILI QUALITATIVE
Sono classificate in categorie.
1. QUALITATIVE NOMINALI
Solo il nome della modalità è importante e non esiste
concetto di ordine tra le diverse modalità.
a. DICOTOMICHE:
presentano solo 2 modalità, non ordinabili.
• Sesso = M/F
• Sopravvivenza = Vivo/Morto
• Positivo –negativo al virus HIV
…………..
b. POLITOMICHE:
presentano più di 2 modalità, non ordinabili.
• Colore dei capelli
•Gruppo sanguigno (A, B, AB, 0)
•Razza di una specie (cocker, terrier, bassotto….)
16
2. QUALITATIVE ORDINALI
È possibile stabilire un ordine tra le modalità:
• Livello socio-economico
(basso-medio-alto)
• Livelli di obesità
(sovrappeso- Obesità I- Obesità II- Obesità III)
• Abitudine all’uso di un presidio medico
(mai-talvolta-sempre)
• Intensità di reazione ad un antigene
(nulla, media, elevata)
La differenza-distanza tra i livelli non è costante ed
esattamente determinata ( la distanza tra livello basso
e medio non è uguale o confrontabile con la distanza
tra livello medio ed alto e viceversa).
17
VARIABILI QUANTITATIVE
Sono espresse da numeri.
1. DISCRETE
Possono assumere solo particolari valori entro un
determinato intervallo (corrispondenza biunivoca
con l’insieme dei numeri naturali).
Sono derivate da conteggi.
• Numero di figli per donna
• Numero di colonie di E. coli su piastra
• Numero di cromosomi di una specie
2. CONTINUE
Possono assumere qualsiasi valore entro un
determinato intervallo (corrispondenza biunivoca
con i numeri reali).
Non sono derivate da conteggi, ma da misure.
• Peso
• Altezza
• Colesterolo ematico
• Pressione arteriosa (PAS e PAD)
18
SCALE DI MISURA
• NOMINALE
• ORDINALE
• INTERVALLARE
• DI RAPPORTI
19
SCALA NOMINALE
Per variabili qualitative nominali.
Consiste in due o più categorie, mutuamente
esclusive.
Esempi:
• genere sessuale (1= maschio 2=femmina);
• stato civile (1=celibe- 2=nubile-3=coniugato);
• attività economica (1=…2=...3=…k=…)
I numeri sono utilizzati per identificare le categorie:
sono solo codifiche, non riflettono una sottostante
scala quantitativa.
.
20
SCALA ORDINALE
Per variabili qualitative ordinali.
(Ma anche per variabili quantitative che sono state
misurate o raggruppate in maniera ordinale).
Consiste in due o più categorie, mutuamente
esclusive, tra cui è possibile stabilire un
ordinamento lineare, una gerarchia.
Esempio: livelli di una patologia
lieve (1)
moderata (2)
grave (3)
Il valore numerico associato ad ogni categoria
differenzia i soggetti con diverse entità della
patologia; a valori elevati della scala
corrispondono intensità maggiori di malattia.
21
SCALA INTERVALLARE
Per variabili quantitative.
E’ possibile stabilire un ordinamento tra le classi;
è possibile calcolare la distanza tra due
osservazioni, ma non il rapporto.
Esempio: temperatura
Si utilizza per quelle variabili quantitative per le
quali è possibile stabilire uno ZERO
ARBITRARIO: lo zero della scala non indica
assenza dell’attributo.
22
SCALA DI RAPPORTI
Per variabili quantitative.
E’ possibile
matematiche.
eseguire
tutte
le
operazioni
Esempi: peso, altezza, velocità
Si utilizza per quelle variabili quantitative per le
quali è possibile stabilire uno ZERO
ASSOLUTO.
PESO
Kg
Libbre
A
10
22.04
B
20
44.08
B pesa il doppio di A in entrambe le scale.
23
TRASFORMAZIONE DI
VARIABILI PER ESIGENZE
DI ANALISI
• TRASFORMAZIONE E
STANDARDIZZAZIONE
• RAGGRUPPAMENTO IN CLASSI
ORDINALI DI UNA VARIABILE
CONTINUA
• TRASFORMAZIONE IN SCALA A
RANGHI
24
STANDARDIZZAZIONE E
TRASFORMAZIONE
Una variabile quantitativa continua può essere
ulteriormente standardizzata o trasformata per
esigenze di:
• confronto tra variabili o campioni da effettuarsi
con la medesima una scala di misurazione ( es.
test Z confronto medie);
• analisi multivariate con variabili a diversa scala
di misurazione (es. analisi componenti principali);
• riduzione della asimmetria dei valori di una
variabile per test che la necessitano (es.
trasformazione di Cox-Box);
• esigenze di presentazione e rappresentazione
grafica ( es. tassi epidemiologici: x100000, LogX );
25
con la Standardizzazione si attua una modifica dei
dati utilizzando statistiche calcolate dai dati stessi.
Centratura:
Xi = X - X
La media aritmetica della variabile è sottratta ad ogni
valore, centra i dati attorno alla media=0.
Normalizzazione:
Ad ogni valore è sottratta la media aritmetica e quindi diviso
per la deviazione standard; centra i dati attorno alla
media=0 con una deviazione standard =1 per tutte le
variabili od i campioni standardizzati.
n
X
0.30
1
1.50
2
1.50
3
2.90
4
3.50
5
4.90
6
5.20
7
6.50
8
8.50
9
11.50
10
media 4.63
Dev. st. 3.48
Y
120.50
110.10
89.70
81.20
69.30
45.30
31.40
31.40
31.40
15.20
62.55
36.82
X normalizzato Y normalizzato
-1.25
1.57
-0.90
1.29
-0.90
0.74
-0.50
0.51
-0.33
0.18
0.08
-0.47
0.16
-0.85
0.54
-0.85
1.11
-0.85
1.98
-1.29
0
0
1
1
26
Trasformazione lineare:
Xi = X*b
Tutti i valori sono moltiplicati per una costante b, cambia i
valori assoluti ma non l’essenza dei risultati,
Trasformazione Logaritmica:
Xi = logc X
Ogni valore è sostituito dal suo logaritmo in base c, riduce le
grandi differenze assolute ovvero “distorce”aumentando i
valori più bassi rispetto a quelli più alti. Se è presente il
valore X =0 si utilizza Xi = logc (X+1)
Trasformazione con elevamento a potenza
c
X =X
i
I valori originali sono elevati a potenza, se il valore c è > 1
vengono aumentati i valori più alti, se c < 1 (es. c= 0.5
trasformazione per radice quadrata) si riduce il peso dei
valori più alti.
27
a: trasformazione logaritmica dei dati
asse x= dati originali, asse Y dati trasformati
b: trasformazione con elevamento a potenza dei dati
asse x= dati originali, asse Y dati trasformati
28
• RAGGRUPPAMENTO IN CLASSI
ORDINALI
DI UNA VARIABILE CONTINUA
I valori di una variabile continua sono raggruppati
in classi ordinali per esigenze di sintesi.
Si utilizza ad esempio per i valori di un indice
(biologico, ecologico, biochimico, antropometrico…) che pur
assumendo tutti i valori di una variabile quantitativa è
tuttavia meglio espresso in poche classi ordinali.
Esempio:
BMI (Body Mass Index) e classi di obesità
BMI <18.5
BMI classi =0
sottopeso
BMI 18.5-24.9
BMI classi = 1
normopeso
BMI
25-29,9
BMI classi = 2
sovrappeso
BMI
30-34,9
BMI classi = 3
obesità I lieve
BMI
35-39,9
BMI classi = 4
obesità II media
BMI
>40
BMI classi = 5
obesità III grave
29
I valori di BMI sono riassunti in classi ed
appaiono
BMI (Kg/ m2)
24.32
22.03
29.58
28.57
34.21
32.5
37.88
36.35
41.56
42.25
Var. continua
BMI classi
Condizione
1
normopeso
1
normopeso
2
sovrappeso
2
sovrappeso
3
obesità I lieve
3
obesità I lieve
4
obesità II media
4
obesità II media
5
Obesità III grave
5
obesità III grave
Var. qualitativa ordinale
Sebbene le variabili continue siano più
informative il raggruppamento in classi ordinali
permette valutazioni descrittive di sintesi :
o conteggi %, analisi e grafici di frequenza, test di
differenza di proporzione;
o tabelle di contingenza con misure di associazione (es.
Chi2);
o analisi di una variabile non raggruppata per gruppistrati di una seconda variabile raggruppata (es. valori
glicemia per età raggruppata in giovane-mediaanziana).
30
TRASFORMAZIONE IN SCALA A RANGHI
La scala a ranghi ordina gli elementi di un gruppo
dal maggiore al minore in accordo alla grandezza
delle osservazioni, assegna i numeri d'ordine
corrispondenti alla posizione occupata (rango) e
trascura le distanze tra gli elementi ordinati.
Questa trasformazione permette di applicare test statistici
quando le variabili originarie non soddisfano le assunzioni
dei test parametrici più usati (es. analisi non parametriche
test Mann-Whitney, ANOVA Kruskal Wallis, correlazione
di Spearman).
Procedura:
o Le n1, n2,…nk osservazioni provenienti da k
campioni (ma anche da un solo campione) sono
aggregate in unica serie di dati di dimensioni n e
messe in ordine crescente.
o Alle osservazioni vengono poi assegnati dei
ranghi partendo da1, che viene dato alla più
piccola, fino ad n che viene dato alla più grande.
o Quando due o più osservazioni hanno lo stesso
valore ad ogni osservazione viene assegnata la
media dei ranghi di tutte le osservazioni con lo
stesso valore.
31
Esempio:
Variabile:
contenuto nucleare di DNA in pg ( Rattus norvegicus)
Campione 1
Campione 2
Campione 3
2.98
3.33
2.95
3.15
2.86
3.05
3.5
3.12
3.42
2.89
3.02
2.9
3.05
2.98
2.87
3.15
3.12
Raggruppamento ed assegnazione dei ranghi
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
Variabile Rango campione
originale
1
2.86
2
2
2.87
3
3
2.89
1
4
2.9
3
5
2.95
3
6.5
2.98
1
6.5
2.98
2
8
3.02
2
9.5
3.05
1
9.5
3.05
3
11.5
3.12
2
11.5
3.12
3
13.5
3.15
1
13.5
3.15
1
15
3.33
2
16
3.42
3
17
3.5
1
32
RACCOLTA E
ORGANIZZAZIONE DEI DATI
•
MATRICE DATI
•
TABELLE SEMPLICI
•
TABELLE A DOPPIA ENTRATA
•
FREQUENZE
•
GRAFICI
33
Immaginiamo di compiere una ricerca sulle
abitudini alimentari degli studenti iscritti al
quarto anno dei Corsi di Laurea dell’Università di
Pavia nel corrente a.a.
E’ necessario raccogliere dati-informazioni
specifiche che poi sono elaborate ed analizzate:
• dalla popolazione d interesse si estrae un
campione ( * tecniche di estrazione, * dimensioni del
campione) sufficientemente grande, es. 500
soggetti
• viene somministrato un questionario con
domande:
34
ID_________________________
Sesso ( 1= M, 2=F)____________ (var qualitativa nominale dicotomica)
Età (anni compiuti)____________ (var quantitativa continua)
Peso ( Kg)___________________ (var quantitativa continua)
Statura (cm)__________________ (var quantitativa continua)
Quante volte mangi alla settimana
(var quantitativa discreta)
Pasta_________________
Pesce_________________
Dolci _________________
Quante volte alla settimana salti i pasti principali
(var qualitativa ordinale)
(colazione, pranzo, cena)?
-mai – (=1)
- spesso (=3)
-talvolta (=2)
- sempre (=4)
Quante ore alla settimana fa attività fisica/sport?
(var qualitativa ordinale)
-mai (1) (=1)
-meno di 1 ora(=2)
-1/2 ore (=3)
-3/4 ore (=4)
-4/5 ore (=5)
-6/7 ore (=6)
ecc….
35
E’ necessaria una
prima SINTESI delle informazioni raccolte
MATRICE DEI DATI
Quante Quante Quante Quanto
ID Sesso Età Peso Statura
(anni) (kg)
(cm)
pasta pesce dolci salta pasti
Quanto
sport
1
M
21
70
165
1
2
1
mai
0
2
M
22
80
180
2
2
1
talvolta
1
3
F
19
60
169
3
1
2
mai
2
4
M
26
68
170
1
2
1.5
spesso
5
...
…
…
…
…
…
…
…
…
…
500
F
24
45
155
3
1
2
sempre
3
I dati sono quindi esplorati e controllati mediante
metodi di sintesi che, a seconda del tipo di
variabile, calcolano misure di tendenza centrale e
dispersione (variabili quantitative), realizzano
tabelle calcolano frequenze e distribuzioni di
frequenze realizzano grafici ( tutte le variabili).
36
TABELLE
• TABELLE SEMPLICI
Unità statistiche classificate secondo UNA delle
variabili rilevate.
• TABELLE A DOPPIA ENTRATA
Unità statistiche classificate secondo DUE delle
variabili rilevate.
37
TABELLA SEMPLICE
(variabile qualitativa nominale)
Sesso Frequenza assoluta
M
280
F
220
Totale
500
Legenda: M = maschio, F = femmina
38
TABELLA A DOPPIA ENTRATA
Incrociamo le variabili “Sesso” e “Quanto salta i
pasti (volte/settimana)”.
Sesso
Salta i pasti
(volte/settimana)
Mai -1
Talvolta-2
Spesso-3
Sempre-4
Totale
M
F
Totale
40
200
30
10
280
10
50
100
60
220
50
250
130
70
500
39
TABELLA SEMPLICE
(variabile quantitativa continua)
Statura (cm)
FREQUENZA
ASSOLUTA
152
153
154
155
…
…
192
193
194
Totale
3
4
6
6
…
…
6
4
2
500
40
È NECESSARIO
RAGGRUPPARE I DATI IN CLASSI
• MUTUAMENTE ESCLUSIVE
• ESAUSTIVE
• QUANTE CLASSI?
- Regola del buon senso: non meno di 6 non più di 15.
- Formula di Sturges:
k=1+3,322 (log10n)
dove
k= numero di classi
n= numero di osservazioni
• DI QUALE AMPIEZZA?
- Regole del buon senso:
sono consigliabili classi di ampiezza 5, 10 o multipli di 10 e
terminanti con 0 o con 5;
se è possibile, formare classi di uguale ampiezza
- Formula per il calcolo dell’ampiezza
dove
w=R/k
R= range
k= numero di classi
• COME INDICARLE?
41
DISTRIBUZIONE DI FREQUENZA
DATI RAGGRUPPATI IN CLASSI
9 CLASSI di AMPIEZZA 5
Altezza (cm)
[150 - 155)
[155 - 160)
[160 - 165)
[165 - 170)
[170 - 175)
[175 - 180)
[180 - 185)
[185 - 190)
[190 - 195)
Totale
1a classe → [150 - 155)
Frequenza assoluta
13
26
58
99
88
82
95
22
17
500
150 estremo inferiore
155 estremo superiore aperto
155 è, in realtà, l’estremo inferiore della classe successiva.
Pertanto la 1a classe raggruppa le osservazioni comprese
nell’intervallo (150 - 154,9999…).
2a classe → [155 - 160)
155 estremo inferiore
160 estremo superiore aperto
160 è, in realtà, l’estremo inferiore della classe successiva.
Pertanto la 2a classe raggruppa le osservazioni comprese
nell’intervallo (155 - 159,9999…).
.... e così via ….
42
FREQUENZE
ASSOLUTA
N° di volte in cui si osserva ciascuna
modalità (o valore) di una variabile.
RELATIVA
Frequenza assoluta / numero totale casi
0 ≤ freq. rel. ≤ 1
PERCENTUALE
Frequenza relativa*100
0 ≤ frequenza% ≤ 100
CUMULATIVA
Fornisce, per ogni valore x della variabile X di
interesse, la frequenza delle osservazioni con
valore minore o uguale a x.
43
RIEPILOGO
Per una variabile continua definiamo la frequenza:
• assoluta (n)
• relativa (f)
• percentuale (p)
• percentuale cumulata (P)
Statura
(cm)
n
Frequenza
assoluta
f
Frequenza
relativa
p
Frequenza
%
P
Frequenza %
cumulata
[150-155)
[155-160)
[160-165)
[165-170)
[170-175)
[175-180)
[180-185)
[185-190)
[190-195]
13
26
58
99
88
82
95
22
17
13/500=0.026
26/500=0.052
58/500=0.116
99/500=0.198
88/500=0.176
82/500=0.164
95/500=0.190
22/500=0.044
17/500=0.034
2.6
5.2
11.6
19.8
17.6
16.4
19.0
4.4
3.4
2.6
2.6+5.2=7.8
2.6+…+11.6=19.4
2.6+…+19.8=39.2
2.6+…+17.6=56.8
2.6+…+16.4=73.2
2.6+…+19.0=92.2
2.6+…+4.4=96.6
2.6+…+3.4=100
Totale
500
1
100
44
Per una variabile nominale:
Stato
civile
0
1
2
3
Totale
Legenda:
n
f
p
3 0.3 30%
4 0.4 40%
2 0.2 20%
1 0.1 10%
10 1 100%
0 = non coniugato/a
1 = coniugato/a
2 = separato/a
3 = vedovo/a
N.B.
Per le variabili qualitative nominali non ha senso calcolare le
frequenze cumulate, perché tra le loro modalità non è
possibile stabilire una gerarchia.
45
GRAFICI
46
GRAFICI
DI VARIABILI QUALITATIVE
(e QUANTITATIVE DISCRETE)
• DIAGRAMMA A BARRE O COLONNE
La base delle colonne è uguale, l’altezza è
proporzionale alla frequenza.
• DIAGRAMMA CIRCOLARE
Ad ogni modalità della variabile corrisponde un
settore circolare la cui area è proporzionale alla
frequenza della modalità considerata.
L’ampiezza di ogni settore circolare è data da:
360:αi=100:fi
L’uso di diagrammi a colonne distanziate e di diagrammi
circolari enfatizza il fatto che i dati vengono considerati in
categorie discrete, distinte e separate.
47
DIAGRAMMA A COLONNE
Frequenza
Sesso
300
250
200
150
100
50
0
280
220
M
F
DIAGRAMMA CIRCOLARE
Sesso
220
280
Sesso
M
F
Totale
M
F
Frequenza assoluta
280
220
500
48
GRAFICI
DI VARIABILI QUANTITATIVE
CONTINUE
• ISTOGRAMMA
Colonne non distanziate* di area proporzionale alla
frequenza.
*colonne non distanziate, perché i dati sono misurati su
scala continua.
• POLIGONO DI FREQUENZA
Ogni punto, corrispondente a un intervallo, ha
coordinata orizzontale data dal valore centrale
dell’intervallo e coordinata verticale data dalla
frequenza delle osservazioni comprese in
quell’intervallo.
49
ISTOGRAMMA
120
Frequenza
100
80
60
40
20
0
[150155)
[155160)
[160165)
[165170)
[170175)
[175180)
[180185)
[185190)
[190195)
Altezza (cm)
Altezza (cm)
[150 - 155)
[155 - 160)
[160 - 165)
[165 - 170)
[170 - 175)
[175 - 180)
[180 - 185)
[185 - 190)
[190 - 195)
Frequenza assoluta
13
26
58
99
88
82
95
22
17
Totale
500
50
POLIGONO DI FREQUENZA
120
Frequenza
100
80
60
40
20
0
[150155)
[155160)
[160165)
[165170)
[170175)
[175180)
[180185)
[185190)
[190195)
Altezza (cm)
Altezza (cm)
[150 - 155)
[155 - 160)
[160 - 165)
[165 - 170)
[170 - 175)
[175 - 180)
[180 - 185)
[185 - 190)
[190 - 195)
Totale
xk
152.5
157.5
162.5
167.5
172.5
177.5
182.5
187.5
192.5
Frequenza assoluta
13
26
58
99
88
82
95
22
17
500
51
GRAFICI DI
FREQUENZA CUMULATIVA:
a. VARIABILE DISCRETA:
DIAGRAMMA A GRADINI
Frequenza cumulata
30
25
20
15
10
5
0
1
2
3
4
5
6
n° di componenti familiari
n° di componenti
familiari
1
2
3
4
5
6
Frequenza assoluta
4
3
8
9
2
1
27
Frequenza assoluta
cumulativa
4
7
15
24
26
27
52
Frequenza % cumulata
b. VARIABILE CONTINUA
SIGMOIDE
120
100
80
60
40
20
0
155 160 165 170 175 180 185 190 195
Altezza (cm)
Altezza Frequenza Frequenza Frequenza Frequenza %
(cm)
assoluta
relativa
%
cumulata
[150-155)
13
13/500=0.026
2.6
2.6
[155-160)
26
26/500=0.052
5.2
2.6+5.2=7.8
[160-165)
58
58/500=0.116
11.6
2.6+…+11.6=19.4
[165-170)
99
99/500=0.198
19.8
2.6+…+19.8=39.2
[170-175)
88
88/500=0.176
17.6
2.6+…+17.6=56.8
[175-180)
82
82/500=0.164
16.4
2.6+…+16.4=73.2
[180-185)
95
95/500=0.190
19.0
2.6+…+19.0=92.2
[185-190)
22
22/500=0.044
4.4
2.6+…+4.4=96.6
[190-195)
17
17/500=0.034
3.4
2.6+…+3.4=100
Totale
500
1
100
53