La distribuzione statistica doppia (o bivariata) La distribuzione

Transcript

La distribuzione statistica doppia (o bivariata) La distribuzione
Marilena Pillati - Seminari di Statistica (SVIC)
"Le distribuzioni doppie"
La distribuzione statistica doppia
(o bivariata)
Se in un insieme di n unità statistiche si
osservano gli stati di grandezza assunti da
due caratteri X e Y si ottiene una n-pla
statistica bivariata
La n-pla bivariata può essere sintetizzata in
una distribuzione statistica doppia, dove ogni
coppia di modalità è accompagnata dal
numero delle unità in cui si sono osservate
simultaneamente tali modalità
E’ lo strumento più semplice per lo studio
simultaneo di due caratteri X e Y
La distribuzione statistica doppia
x1
x2
.
. xh .
. .
xv
y1
n11
n12
.
. .
n1v
n10
y2
n21
n22
.
. n1h
.
. n2h
..
. .
n2v
n20
:
:
:
:
:
:
yi
ni1
ni2
.
. .
:
:
:
:
. nih
.
:
yu
nu1
nu2
.
. .
nuv
nu0
n01
n02
.
. nuh
.
. n0h
.
. .
n0v
n
:
:
niv
:
:
ni0
:
1
Marilena Pillati - Seminari di Statistica (SVIC)
"Le distribuzioni doppie"
Distribuzioni marginali e distribuzioni condizionate
Distribuzioni marginali
La distribuzione della X, indipendentemente dalle modalità
della Y (ultima riga), si dice distribuzione marginale di X
La distribuzione della Y, indipendentemente dalle modalità
della X (ultima colonna) si dice distribuzione marginale di Y
Distribuzioni condizionate
Le distribuzioni della X, in corrispondenza di ciascuna
modalità della Y, si dicono distribuzioni condizionate di X
Le distribuzioni della Y, in corrispondenza di ciascuna
modalità della X si dicono distribuzioni condizionate di Y
Distribuzioni delle frequenze relative
{ Rapportando le frequenze di una distribuzione
doppia al numero n delle unità si ottiene la
distribuzione congiunta delle frequenze relative
{ Rapportando le frequenze di ciascuna colonna ai
totali di colonna n0i si ottengono le distribuzioni
delle frequenze relative condizionate della Y
{ Rapportando le frequenze di ciascuna riga ai
totali di riga ni 0 si ottengono le distribuzioni delle
frequenze relative condizionate della X
{ Rapportando le frequenze marginali di riga o di
colonna al numero n delle unità si ottengono le
distribuzioni delle frequenze relative marginali
2
Marilena Pillati - Seminari di Statistica (SVIC)
"Le distribuzioni doppie"
Residenti nella provincia di Bologna
per classi di età e nazionalità
Classi di età
Italiani
Stranieri
Totale
0-14 anni
100474
10843
111317
15-39 anni
252921
31074
283995
40-64 anni
312832
13071
325903
65 anni e oltre
222228
836
223064
888455
55824
944279
Totale
Residenti nella provincia di Bologna per classi di età
e nazionalità (distribuzioni percentuali condizionate)
Italiani
Stranieri
0-14 anni
Età
11,31%
19,42%
15-39 anni
28,47%
55,66%
40-64 anni
35,21%
23,41%
65 anni e oltre
25,01%
1,50%
100%
100%
Stranieri
Totale
Età
Italiani
0-14 anni
90,26%
9,74%
100%
15-39 anni
89,06%
10,94%
100%
40-64 anni
95,99%
4,01%
100%
65 anni e oltre
99,63%
0,37%
100%
3
Marilena Pillati - Seminari di Statistica (SVIC)
"Le distribuzioni doppie"
Popolazione residente nel Comune di Bologna
per grandi classi di età e sesso al 31 dicembre 2004
Maschi Femmine
19.350
18.358
24.595
23.187
45.473
44.890
46.494
51.950
38.943
61.185
174.855 199.570
Età
0-14
15-29
30-44
45-64
65 e oltre
Totale
Totale
37.708
47.782
90.363
98.444
100.128
374.425
Distribuzione di frequenze relative marginali
Età
0-14
15-29
30-44
45-64
65 e oltre
Totale
Maschi Femmine
0,51
0,49
0,51
0,49
0,50
0,50
0,47
0,53
0,39
0,61
0,47
0,53
Totale
1,00
1,00
1,00
1,00
1,00
1,00
Età
0-14
15-29
30-44
45-64
65 e oltre
Totale
Maschi Femmine
0,11
0,09
0,14
0,12
0,26
0,22
0,27
0,26
0,22
0,31
1,00
1,00
Totale
0,10
0,13
0,24
0,26
0,27
1,00
Grafico a barre dei residenti nella provincia di Bologna
per classi di età e nazionalità
65 e oltre
60-64 anni
55-59 anni
50-54 anni
45-49 anni
40-44 anni
35-39 anni
30-34 anni
25-29 anni
20-24 anni
15-19 anni
10-14 anni
5-9 anni
ITALIANI
0-4 anni
STRANIERI
0
20000
40000
60000
80000
100000
120000
140000
160000
180000
200000
4
Marilena Pillati - Seminari di Statistica (SVIC)
"Le distribuzioni doppie"
Residenti nella provincia di Bologna per classi di età
e nazionalità (distribuzioni cumulate)
Classi di eta' lavorativa e non
Frequenze assolute
Frequenze cumulate
ITALIANI
STRANIERI
ITALIANI
STRANIERI
0-14 anni
100.474
10.843
100.474
10.843
15-39 anni
252.921
31.074
353.395
41.917
40-64 anni
312.832
13.071
666.227
54.988
888.455
55.824
65 anni e oltre
222.228
836
TOTALE
888.455
55.824
Classi di eta' lavorativa e non
Frequenze relative
Frequenze relative
cumulate
ITALIANI
STRANIERI
ITALIANI
STRANIERI
0-14 anni
11.3%
19.4%
11.3%
19.4%
15-39 anni
28.5%
55.7%
39.8%
75.1%
40-64 anni
35.2%
23.4%
75.0%
98.5%
65 anni e oltre
25.0%
1.5%
100.0%
100.0%
100.0%
100.0%
TOTALE
Esempio
L’ATTIVITÀ CONGRESSUALE ITALIANA NEL PRIMO SEMESTRE 2000
DISTRIBUZIONE DEI CONGRESSI PER PROMOTORE E STRUTTURA OSPITANTE
PROMOTORI
Imprese
Enti Pubblici
Sindacati
Ass. scientifiche
Ass. religiose
Ass. culturali
Ass. sportive
Totale
Alberghi
19789 54,56%
3411
9,40%
4234 11,67%
3975 10,96%
788
2,17%
2531
6,98%
1545
4,26%
36273 100,00%
Centri congressi
8080 36,63%
4259 19,31%
4863 22,05%
2344 10,63%
631
2,86%
1389
6,30%
491
2,23%
22057 100,00%
27869
7670
9097
6319
1419
3920
2036
58330
Totale
47,78%
13,15%
15,60%
10,83%
2,43%
6,72%
3,49%
100,00%
5
Marilena Pillati - Seminari di Statistica (SVIC)
"Le distribuzioni doppie"
Distribuzione di 330 investitori rispetto alla
professione e al tipo di investimento finanziario
preferito
Tipo di investimento preferito
Professione
fondi
azionari
fondi
obbligazionari
azioni
titoli di
stato
totale
Medico
30
25
15
0
70
Avvocato
29
34
12
6
81
Commercialista
50
35
29
15
129
Altro
21
14
10
5
50
130
108
66
26
330
Totale
Distribuzione di frequenze relative
congiunta e marginali
Tipo di investimento preferito
Professione
fondi azionari
fondi
obbligazionari
azioni
titoli di
stato
totale
Medico
0.091
0.076
0.045
0.000
0.212
Avvocato
0.088
0.103
0.036
0.018
0.245
Commercialista
0.152
0.106
0.088
0.045
0.391
Altro
0.064
0.042
0.030
0.015
0.152
Totale
0.394
0.327
0.200
0.079
1.000
6
Marilena Pillati - Seminari di Statistica (SVIC)
"Le distribuzioni doppie"
Distribuzioni condizionate
Tipo di investimento preferito
fondi
azionari
fondi
obbligazionari
azioni
titoli di
stato
totale
Medico
0.231
0.231
0.227
0.000
0.212
Avvocato
0.223
0.315
0.182
0.231
0.245
Commercialista
0.385
0.324
0.439
0.577
0.391
Altro
0.162
0.130
0.152
0.192
0.152
1
1
1
1
1
Professione
Totale
Tipo di investimento preferito
fondi
azionari
fondi
obbligazionari
azioni
titoli di
stato
totale
Medico
0.429
0.357
0.214
0.000
1
Avvocato
0.358
0.420
0.148
0.074
1
Commercialista
0.388
0.271
0.225
0.116
1
Altro
0.420
0.280
0.200
0.100
1
Totale
0.394
0.327
0.200
0.079
1
Professione
Medie e misure di variabilità in una
distribuzione statistica doppia
{
{
In una distribuzione doppia per
caratteri quantitativi possono essere
determinate oltre alle medie e alle
varianze marginali, le medie e le
varianze condizionate
Per esse valgono tutte le
considerazioni fatte per la media
aritmetica e la varianza
7
Marilena Pillati - Seminari di Statistica (SVIC)
"Le distribuzioni doppie"
Media aritmetica condizionata
Media aritmetica di X condizionata
H
1
M a (X | Y = y i ) =
ni 0
∑x n
j ij
j =1
Media aritmetica di Y condizionata
K
1
M a (Y | X = x h ) =
noh
∑y n
j
jh
j =1
Varianza condizionata
Varianza di X condizionata
1
V (X | Y = y i ) =
ni 0
2
H
∑ (x
j
)
− Ma (X | Y = y i ) nij
j =1
Varianza di Y condizionata
1
V (Y | X = x h ) =
n0h
2
K
∑ (y
j
)
− M a (Y | X = x h ) n jh
j =1
8