Parte finale Capitolo 3

Transcript

Parte finale Capitolo 3
Relazione tra variabili (cont.)
In questo parte del corso analizziamo la relazione tra una variabile
continua e un’altra qualitativa o discreta.
María Eugenia Castellanos Nueda (DEIO)
Estadística Aplicada a la Publicidad
Noviembre de 2009
1/8
Relazione tra una variabile continua e un’altra qualitativa o
discreta
Se il nostro obiettivo è riassumere l’informazione congiunta di due
variabili osservate, una quantitativa e l’altra qualitativa o discreta, un
grafico molto utile è il diagramma di scatola e baffi o meglio
conosciuto come Box-plot.
Nota: Un solo Box-plot può essere usato anche per rappresentare la
distribuzione di una variabile continua (senza necessariamente riferirsi
a un’altra variabile qualitativa).
María Eugenia Castellanos Nueda (DEIO)
Estadística Aplicada a la Publicidad
Noviembre de 2009
2/8
Diagramma di scatola e baffi o Box-plot
Il Box-plot è un grafico che rappresenta diverse statistiche per un
insieme di dati.
Gli estremi della scatola rappresentano il primo e il terzo quartile. Dove
primo (Q1), secondo (Q2) e terzo quartile (Q3) sono tre valori che nel
campione ordinato che cumulano rispettivamente il 25 %, 50 % e 75 %
delle frequenze. La mediana è il secondo quartile (Q2).
All’interno della scatola è rappresentata la mediana con un segmento
generalmente più spesso. La grandezza della scatola (differenza: terzo
quartile - primo quartile) è chiamato rango interquartilico (RI), ed è una
misura di variabilità così come lo è la varianza.
I baffi rappresentano gli estremi. Se i valori osservati sono: più grandi
del terzo quartile più 1.5 · RI, oppure, più piccoli del primo quartile meno
1.5 · RI sono rappresentati tramite punti. Questo fatto indica che tali
punti possono essere valori anomali rispetto alla maggioranza delle
osservazioni.
se non ci sono punti, i baffi rappresentano il minimo e il massimo
osservato.
María Eugenia Castellanos Nueda (DEIO)
Estadística Aplicada a la Publicidad
Noviembre de 2009
3/8
Esempio di Box-plot
Q1 Median
Min
20
María Eugenia Castellanos Nueda (DEIO)
40
Q3 56.2<Q3+1.5 RI
60
Max
80
Estadística Aplicada a la Publicidad
100
Noviembre de 2009
4/8
Il Box-plot per una variabile continua in funzione di una qualitativa
o discreta
In questo caso, invece di fare un unico Box-plot per riassumere una
variabile continua, facciamo un Box-plot per le osservazioni relative a
ogni modalità della variabile qualitativa (diversi valori della variabile
qualitativa). Vediamo un esempio.
María Eugenia Castellanos Nueda (DEIO)
Estadística Aplicada a la Publicidad
Noviembre de 2009
5/8
Esempio: Miglior attore e miglior attrice nelle diverse edizioni degli
Oscar.
Prendiamo l’esempio degli Oscar per il miglior attore o la miglior
attrice. Supponiamo di essere interessati in studiare l’età in cui hanno
vinto gli oscar, secondo la variabile sesso. Vogliamo riassumere la età
per gli attori e l’età per le attrici.
María Eugenia Castellanos Nueda (DEIO)
Estadística Aplicada a la Publicidad
Noviembre de 2009
6/8
Esempio
30
30
20
40
50
60
70
80
Eta per sesso
20
40
50
60
70
80
Eta di attori e attrici
f
María Eugenia Castellanos Nueda (DEIO)
Estadística Aplicada a la Publicidad
m
Noviembre de 2009
7/8
Esempio
Descrizione numerica della età per il sesso
Possiamo vedere come l’età in cui gli attori e le attrici hanno vinto il
Oscar ha una distribuzione diversa per sesso.Dopo aver visto il
Box-Plot possiamo approfondire lo studio facendo una descrizione
numerica della variabile età per gli uomini e per le donne,
separatamente. Per esempio, possiamo fare una descrizione
quantitativa dell’eta nei due gruppi (uno per ogni sesso).
Donne
Uomini
Min.
21
29
1st Qu.
28
37
Median
33
42
Mean
35
43
3rd Qu.
38
48
Max.
80
76
Sd
11.4
8.90
È chiaro che l’età con cui le donne hanno vinto gli Oscar, in generale, è più
bassa dell’età con cui hanno vinto gli uomini. Si nota un caso estremo per le
donne, infatti c’è un’attrice che ha vinto gli Oscar con 80 anni:
Sesso Posizione Anno Vincitore Film Ettà
f 62 1990 Jessica Tandy Driving Miss Daisy 80
María Eugenia Castellanos Nueda (DEIO)
Estadística Aplicada a la Publicidad
Noviembre de 2009
8/8