Parte finale Capitolo 3
Transcript
Parte finale Capitolo 3
Relazione tra variabili (cont.) In questo parte del corso analizziamo la relazione tra una variabile continua e un’altra qualitativa o discreta. María Eugenia Castellanos Nueda (DEIO) Estadística Aplicada a la Publicidad Noviembre de 2009 1/8 Relazione tra una variabile continua e un’altra qualitativa o discreta Se il nostro obiettivo è riassumere l’informazione congiunta di due variabili osservate, una quantitativa e l’altra qualitativa o discreta, un grafico molto utile è il diagramma di scatola e baffi o meglio conosciuto come Box-plot. Nota: Un solo Box-plot può essere usato anche per rappresentare la distribuzione di una variabile continua (senza necessariamente riferirsi a un’altra variabile qualitativa). María Eugenia Castellanos Nueda (DEIO) Estadística Aplicada a la Publicidad Noviembre de 2009 2/8 Diagramma di scatola e baffi o Box-plot Il Box-plot è un grafico che rappresenta diverse statistiche per un insieme di dati. Gli estremi della scatola rappresentano il primo e il terzo quartile. Dove primo (Q1), secondo (Q2) e terzo quartile (Q3) sono tre valori che nel campione ordinato che cumulano rispettivamente il 25 %, 50 % e 75 % delle frequenze. La mediana è il secondo quartile (Q2). All’interno della scatola è rappresentata la mediana con un segmento generalmente più spesso. La grandezza della scatola (differenza: terzo quartile - primo quartile) è chiamato rango interquartilico (RI), ed è una misura di variabilità così come lo è la varianza. I baffi rappresentano gli estremi. Se i valori osservati sono: più grandi del terzo quartile più 1.5 · RI, oppure, più piccoli del primo quartile meno 1.5 · RI sono rappresentati tramite punti. Questo fatto indica che tali punti possono essere valori anomali rispetto alla maggioranza delle osservazioni. se non ci sono punti, i baffi rappresentano il minimo e il massimo osservato. María Eugenia Castellanos Nueda (DEIO) Estadística Aplicada a la Publicidad Noviembre de 2009 3/8 Esempio di Box-plot Q1 Median Min 20 María Eugenia Castellanos Nueda (DEIO) 40 Q3 56.2<Q3+1.5 RI 60 Max 80 Estadística Aplicada a la Publicidad 100 Noviembre de 2009 4/8 Il Box-plot per una variabile continua in funzione di una qualitativa o discreta In questo caso, invece di fare un unico Box-plot per riassumere una variabile continua, facciamo un Box-plot per le osservazioni relative a ogni modalità della variabile qualitativa (diversi valori della variabile qualitativa). Vediamo un esempio. María Eugenia Castellanos Nueda (DEIO) Estadística Aplicada a la Publicidad Noviembre de 2009 5/8 Esempio: Miglior attore e miglior attrice nelle diverse edizioni degli Oscar. Prendiamo l’esempio degli Oscar per il miglior attore o la miglior attrice. Supponiamo di essere interessati in studiare l’età in cui hanno vinto gli oscar, secondo la variabile sesso. Vogliamo riassumere la età per gli attori e l’età per le attrici. María Eugenia Castellanos Nueda (DEIO) Estadística Aplicada a la Publicidad Noviembre de 2009 6/8 Esempio 30 30 20 40 50 60 70 80 Eta per sesso 20 40 50 60 70 80 Eta di attori e attrici f María Eugenia Castellanos Nueda (DEIO) Estadística Aplicada a la Publicidad m Noviembre de 2009 7/8 Esempio Descrizione numerica della età per il sesso Possiamo vedere come l’età in cui gli attori e le attrici hanno vinto il Oscar ha una distribuzione diversa per sesso.Dopo aver visto il Box-Plot possiamo approfondire lo studio facendo una descrizione numerica della variabile età per gli uomini e per le donne, separatamente. Per esempio, possiamo fare una descrizione quantitativa dell’eta nei due gruppi (uno per ogni sesso). Donne Uomini Min. 21 29 1st Qu. 28 37 Median 33 42 Mean 35 43 3rd Qu. 38 48 Max. 80 76 Sd 11.4 8.90 È chiaro che l’età con cui le donne hanno vinto gli Oscar, in generale, è più bassa dell’età con cui hanno vinto gli uomini. Si nota un caso estremo per le donne, infatti c’è un’attrice che ha vinto gli Oscar con 80 anni: Sesso Posizione Anno Vincitore Film Ettà f 62 1990 Jessica Tandy Driving Miss Daisy 80 María Eugenia Castellanos Nueda (DEIO) Estadística Aplicada a la Publicidad Noviembre de 2009 8/8