Statistica:indici di posizione e dispersione
Transcript
Statistica:indici di posizione e dispersione
Statistica:indici di posizione e dispersione Se lo stipendio di ciascun impiegato statale venisse aumentato del 6% come cambierebbe lo stipendio medio? E la deviazione standard degli stipendi? Statistica:indici di posizione e dispersione SOLUZIONE: Lo stipendio medio verrebbe aumentato del 6%, infatti ogni stipendio xi diventerebbe xi +6%xi=(106/100)xi quindi, indicando con x* la media degli stipendi prima dell’aumento, si avrebbe, dopo l’aumento, la nuova media Σi(106/100)xi/n=(106/100)Σixi/n=(106/100)x*=x*+6%x* Anche la deviazione standard σ2 subisce lo stesso aumento del 6%, infatti si otterrebbe per la varianza Σi[(106/100)(xi–x*)]2/n=(106/100)2Σi(xi–x*)2/n= =(106/100)2 σ2 poichè la deviazione standard è la radice quadrata della varianza, si ha (106/100 )σ =σ+6%σ Statistica:indici di posizione e dispersione In una fabbrica che produce apparecchi di misurazione per una centrale elettrica c’è una squadra di 10 operai molto bravi: il caposquadra, un uomo anziano e con vasta esperienza, 9 giovani diplomati di una scuola professionale. Ognuno dei giovani operai produce 15 apparecchi al giorno e il caposquadra riesce a produrne 9 più della media di tutta la squadra composta da 10 operai. Quanti apparecchi produce il capo squadra e quanti l’intera squadra ogni giorno? Statistica:indici di posizione e dispersione SOLUZIONE: Indichiamo con x* la media di apparecchi prodotti da tutta la squadra, si ha x*= (15·9+(x*+9))/10, da cui si ricava x*=16; gli apparecchi prodotti dal caposquadra sono dunque 25 e dall’intera squadra 160. Statistica:indici di posizione e dispersione Hai ottenuto tre dati sperimentali tutti compresi tra 11 e 13. La loro deviazione standard può essere uguale a 5? Se sì fai un esempio, se no, spiega perché. Dati campionari:media, varianza,…bruchi Un entomologo sta studiando un bruco divoratore di foglie; esaminando 300 foglie ha trovato presenti dei bruchi, secondo i numeri riportati nella seguente tabella: n° dei bruchi n° delle foglie 0 167 1 98 2 30 3 5 Calcolare il numero medio di bruchi per foglia e la relativa deviazione standard Dati campionari: media, varianza,…bruchi Per calcolare il numero medio di bruchi per foglia, dobbiamo calcolare il numero totale dei bruchi, il numero totale delle foglie e fare il rapporto tra questi due numeri. Numero totale bruchi:0·167 + 1·98 + 2·30 +3·5 = 173 Numero totale foglie: 167+98+30+5 = 300 Numero medio di bruchi per foglia = 173/300≈4% Dati campionari: media, varianza,…bruchi Per calcolare la deviazione standard dobbiamo calcolare dapprima la varianza, infatti la deviazione standard è la radice quadrata della varianza. Utilizziamo la formula per il calcolo “veloce” della varianza, vale a dire: calcoliamo la media dei quadrati e sottraiamo la media al quadrato: Media dei quadrati:( 0·167 + 1·98 + 22·30 +32·5)/300 = =263/300 Media al quadrato: (173/300)2 Varianza: 263/300 - (173/300)2 = 48971/90000 Deviazione standard: sqr(48971/90000) ≈ 0.74 Dati campionari: media, varianza,… Esercizio: Nella seguente tabella sono rappresentate le frequenze del numero dei giorni che un certo unguento impiega per far scomparire i segni di un rash cutaneo Numero dei giorni 1 2 3 4 5 6 Determina la media e la varianza campionaria Frequenza 2 7 9 27 11 5 Dati campionari: media, varianza,… SOLUZIONE: Il numero medio dei giorni che l’unguento impiega a far scomparire i segni del rash cutaneo si ottiene dal calcolo seguente: Numero totale giorni osservati/Numero totale casi esaminati=(2 +14+27+108+55+30)/61 =236/61 ≈ 3.87 Per la varianza possiamo utilizzare la formula: media aritmetica dei dati elevati al quadrato - media dati elevata al quadrato, quindi (2+28+81+432+275+180)/61- (3.87)2 ≈ 1.38 Dati campionari: media, varianza,… Con l’aumentare dell’età le capacità uditive diminuiscono. E’ stata effettuata una ricerca per determinare il livello ideale di suono per persone di diversa età. I dati sono riportati di seguito: Età (in anni) 15 25 35 45 60 Livello di suono (decibel) 56 62 60 58 65 a) Calcola il livello di suono mediano; b) Calcola la media aritmetica di entrambe le variabili; c) Calcola il coefficiente di correlazione tra età e livello del suono Dati campionari: media, varianza,…pile Due ditte di pile pubblicizzano il loro modello “ministilo” a 1.5 volt e affermano, entrambe, che le loro pile hanno una carica complessiva di 1.25 A h (carica equivalente a un flusso di corrente di 1.25 ampere della durata di un’ora). Per verificare queste affermazioni, vengono scelti due campioni casuali di 50 pile prodotte da ciascuna delle due ditte, viene compilata la tabella dei valori delle frequenze assolute con cui sono stati osservati i diversi valori di carica Dati campionari: media, varianza,…pile Carica in A h 1.15 1.20 1.25 1.30 Prima ditta 1 16 25 8 Seconda ditta 17 0 9 24 Che cosa possiamo concludere? Dati campionari: media, varianza,…pile La carica media in entrambi i casi è 1.24 La varianza per la prima ditta è 0.065/50=0.0013 La varianza per la seconda ditta è 0.225/50=0.0045 La DS per la prina ditta è ≈ 0.036 La DS per la seconda ditta è ≈ 0.067 Nella seconda ditta, i dati sono più dispersi rispetto alla media, quindi il valore della media è più attendibile per la prima ditta. Farmaco e tempo di coagulo… Ad un campione di 12 cavie è stato somministrato un diverso quantitativo di un certo farmaco che si vuol stabilire se produce, oltre ad effetti benefici, un ritardo nel coagulo del sangue per tararne il dosaggio. Indicando con X la dose di farmaco somministrata, misurata in mg, e con Y il tempo di coagulo rilevato, misurato in minuti, si sono osservati i dati riportati nella tabella che segue. E’ ragionevole ipotizzare una dipendenza lineare di Y da X? Farmaco e tempo di coagulo… X 81 21 68 35 15 40.5 19 48.5 17.5 57.5 72 29.5 x* 42.04 Y 33.1 2.0 11.2 4.0 1.6 5.1 1.9 7.2 1.8 9.1 15.3 3.2 y* 7.96 X2 6561 441 4624 1225 225 1640.25 361 2352.25 306.25 3306.25 5184 870.25 x2* 2258.02 Y2 1095.61 4.0 125.44 16.0 2.56 26.01 3.61 51.84 3.24 82.81 234.09 10.24 y2* 137.95 XY 2681.1 42.0 761.6 140.0 24.0 206.55 36.1 349.2 31.5 523.25 1101.6 94.4 (xy)* 499.275 Farmaco e tempo di coagulo… Determiniamo la retta di regressione Y=mX+q Otteniamo m (rivedi la lezione del 13-01-11) dalla formula m = [(x·y)* - x*·y*]/[(x2 )* - (x*)2] m= [499.275 -(42.04)·(7.96)]/[2258.02 - (42.04)2 ] ≈ 0.34 Si ottiene q dalla formula q = y* - mx*, quindi q=7.96 - (0.34)(42.04) ≈ - 6.33 Vediamo se la retta approssima bene i dati calcolando il coefficiente di correlazione di Pearson CP, dalla formula CP= [(x·y)* - x*·y*]/ (DSx · DSy ) Farmaco e tempo di coagulo… CP= [(x·y)* - x*·y*]/ (DSx · DSy ) Calcoliamo la deviazione standard dei dati campionari X, DSx =sqr(2258.02 -(42.04)2 ) ≈ 22.15 Con “sqr” indichiamo la radice quadrata Calcoliamo la deviazione standard dei dati campionari Y, DSy =sqr(137.95 - (7.96)2 ) ≈ 8.64 Siamo ora in grado di calcolare il CP CP=[499.275 - (42.04)(7.96)] /[(22.15)(8.64)] ≈ 0.86 Il CP non è vicinissimo ad 1, la relazione tra X ed Y potrebbe essere di tipo non lineare. Potremmo ipotizzare una legge a potenza Y=cXk ? Come fare….?