10. Inferenza Statistica Esercizi

Transcript

10. Inferenza Statistica Esercizi
13. INFERENZA STATISTICA ESERCIZI Esercizio 1 Una popolazione formata da tre bambini A, B e C è stata sottoposta a un test e i tempi espressi in minuti sono stati i seguenti: 11, 15 e 10. a. Calcolare media e varianza della popolazione. b. Costruire lo spazio campionario corrispondente ai campioni ordinati di dimensione n = 2 estratti senza ripetizione. Determinare le distribuzioni della media campionaria e della varianza campionaria corretta, media e varianza della media campionaria e media della varianza campionaria corretta. c. Costruire lo spazio campionario corrispondente ai campioni ordinati di dimensione n = 2 estratti con ripetizione. Determinare le distribuzioni della media campionaria e della varianza campionaria corretta, media e varianza della media campionaria e media della varianza campionaria corretta. Esercizio 2 Il peso sgocciolato di quattro scatolette di tonno è 58, 59, 61, 62 grammi. a. Calcolare media e varianza della popolazione. b. Costruire lo spazio campionario corrispondente ai campioni ordinati di dimensione n = 3 estratti senza ripetizione. Determinare le distribuzioni della media campionaria e della varianza campionaria corretta, media e varianza della media campionaria e media della varianza campionaria corretta. c. Costruire lo spazio campionario corrispondente ai campioni ordinati di dimensione n = 2 estratti con ripetizione. Determinare le distribuzioni della media campionaria e della varianza campionaria corretta, media e varianza della media campionaria e media della varianza campionaria corretta. Esercizio 3 Ad un campione casuale semplice di 36 studenti estratto da scuole con caratteristiche simili è stato somministrato un test con punteggio da 0 a 100 per verificare il grado di preparazione. Il punteggio medio del test nella popolazione degli studenti è uguale a 80 e la varianza è pari a 100. a. Determinare valore atteso, varianza e distribuzione della media campionaria. b. Trovare la probabilità che il campione abbia un punteggio medio compreso tra 77 e 83. [0,9282] Esercizio 4 Una popolazione è costituita da 500 anelli di acciaio per tende aventi la misura del diametro distribuita normalmente con media uguale a 32 millimetri e deviazione standard uguale a 3 millimetri. Si estrae un campione casuale semplice di dimensione 16. a. Determinare valore atteso, varianza e distribuzione della media campionaria. b. Calcolare la probabilità che il diametro medio del campione sia compreso tra 30,5 e 33 millimetri. [0,8854] Esercizio 5 In un paese la percentuale dei residenti laureati è del 20%. Si estrae da tale popolazione un campione casuale di 50 cittadini. a. Qual è la probabilità che la proporzione campionaria risulti maggiore di 0,2? b. Qual è la probabilità di osservare nel campione un numero di laureati compreso tra 0 e 5, estremi inclusi? c. È più probabile osservare nel campione una proporzione di laureati maggiore o uguale a 0,3 oppure minore o uguale a 0,15? [0,5 – 0,048 – 0,0485;0,2033 ] Esercizio 6 Considerato un campione casuale semplice costituito dalle variabili casuali X1, X2, X3 estratto da una popolazione con 2
valore atteso µ e varianza pari a σ , si definiscono i seguenti stimatori per µ: T1 = (2X1 + X2 + 2X3)/5, T2 = (X1 + 2X2 + X3)/4 e T3 = (X1 + X2 + X3)/3. Verificare se tali stimatori sono non distorti e dire quale dei tre è preferibile. 139 Esercizio 7 In un piccolo paese con 5000 occupati, il salario medio è uguale a 1.000 euro con una varianza pari a 400. Si estrae dalla popolazione degli occupati un campione casuale di 150 unità. a. Qual è il valore atteso della media campionaria dei salari? b. Qual è la varianza della media campionaria dei salari? c. La media campionaria è distribuita secondo una Normale? Esercizio 8 Per recarsi al lavoro, un individuo prende abitualmente un certo autobus e per i sei giorni lavorativi di una data settimana di dicembre misura il tempo necessario per arrivare dalla sua fermata alla fermata del posto di lavoro. I risultati delle misurazioni in minuti sono i seguenti: 35, 47, 30 , 42, 21, 44. Nel mese di aprile ripete le misurazioni ottenendo i seguenti risultati: 28, 33, 40, 30 , 31, 25. a. Calcolare la stima del tempo medio necessario per percorrere il tragitto da casa al posto di lavoro per ognuno dei due mesi. b. Tramite un opportuno stimatore corretto, calcolare la stima della varianza del tempo necessario per percorrere il tragitto da casa al posto di lavoro per ognuno dei due mesi. c. Dalle stime ottenute, quali considerazioni si possono trarre circa i due mesi considerati? d. Calcolare gli errori standard delle stime dei parametri ignoti. [36,5 – 31,2 – 96,3 – 26,2 – 4 – 2,1 – 60,9 – 16,6] Esercizio 9 In occasione degli Esami di Stato dello scorso anno scolastico sono stati rilevati in modo casuale i punteggi di 20 studenti delle scuole superiori di Bolzano: 60, 78, 62, 88, 93, 65, 70, 68, 64, 100, 60, 95, 61, 67, 71, 65, 70, 72, 62, 63. a. Stimare, mediante un opportuno stimatore corretto, il punteggio medio. b. Stimare, mediante un opportuno stimatore corretto, la varianza del punteggio. c. Stimare, mediante un opportuno stimatore corretto, la proporzione dei punteggi maggiori di 90 nella popolazione. [71,7 – 155,1 – 0,15] Esercizio 10 Il peso medio di un campione di 16 adulti è risultato pari a 90 chilogrammi mentre la varianza campionaria corretta è risultata pari a 9. Sapendo che il peso nella popolazione è distribuito secondo una Normale, costruire l’intervallo di confidenza al 90% per il peso medio della popolazione. [(88,7;91,3)] Esercizio 11 2
In una popolazione di adulti la varianza della statura è pari a 49 cm . Costruire l’intervallo di confidenza al 95% per la statura media della popolazione, supponendo di aver osservato un campione di 100 individui con media campionaria pari a 170 centimetri. [(168,7;171,4)] Esercizio 12 In una popolazione di studenti il punteggio conseguito in una prova di matematica si distribuisce secondo una Normale. Un campione casuale di 25 studenti presenta un punteggio medio uguale a 65,5 con deviazione standard corretta pari a 10,3 . Trovare l’intervallo di confidenza al 98% per il punteggio medio della popolazione di studenti. [(60,4;70,6)] Esercizio 13 In una popolazione il reddito pro-­‐capite è distribuito secondo una Normale. In un campione casuale di dimensione 400 estratto dalla popolazione il reddito pro-­‐capite medio è uguale a 980,5 euro con deviazione standard corretta pari a 56,3 euro. Trovare l’intervallo di confidenza al 99% per il reddito medio pro-­‐capite. [(973,25;987,75)] Esercizio 14 Una grande azienda di software vuole stimare la proporzione di ragazzi con età tra i 15 e i 20 anni che utilizzano la rete Internet. Dei 370 ragazzi intervistati 214 dichiarano di utilizzare la rete. Calcolare l’intervallo di confidenza al 95% per la proporzione di ragazzi che utilizzano Internet. [(0,528;0,629)] 140 Esercizio 15 A un campione di 50 individui residenti in una città è stato chiesto di dare un voto da 1 (pessimo) a 10 (ottimo) al servizio di raccolta di rifiuti. La media campionaria del punteggio è uguale a 6,5 con deviazione standard corretta pari a 1,5. a. Supponendo che i punteggi si distribuiscano secondo una Normale, calcolare l’intervallo di confidenza al 95% per il punteggio medio dato dai cittadini. b. L’intervallo di confidenza al 99% è più ampio o più ristretto rispetto all’intervallo di confidenza al 95%? Perché? c. Supponendo che la stessa media campionaria e la stessa deviazione standard corretta campionaria siano state osservate su un campione di 100 cittadini, calcolare il nuovo intervallo di confidenza al 95%. È più o meno ampio del primo intervallo calcolato? Perché? [(6,07;6,93) – (5,93;7,07) – (6,20;6,80)] Esercizio 16 Pochi giorni prima delle elezioni, un noto quotidiano commissiona un sondaggio di opinione per prevedere quale delle due coalizioni, quella di Centro-­‐Destra o quella di Centro-­‐Sinistra, avrebbe vinto le elezioni. Intervistate 1750 persone, il 39% di esse è favorevole al Centro – Sinistra, mentre il 42% è favorevole al Centro – Destra. a. Calcolare l'intervallo di confidenza al 95% per la proporzione di elettori che voteranno la coalizione di Centro – Sinistra. b. Calcolare l'intervallo di confidenza al 95% per la proporzione di elettori che voteranno la coalizione di Centro – Destra. c. Si può affermare che la coalizione di Centro – Destra è veramente in vantaggio? [(0,367;0,413) – (0,397;0,443) – No…] Esercizio 17 Un laboratorio analizza un composto farmaceutico per determinare la concentrazione di principio attivo. Vengono effettuate con un'opportuna strumentazione diverse misurazioni. È noto che i valori di concentrazione misurati nelle varie prove seguono una distribuzione Normale con media ignota e deviazione standard (dipendente dalla strumentazione) pari a σ = 0,2. Il laboratorio esegue 4 misurazioni del composto ottenendo i seguenti risultati: 2,1; 1,9; 1,8; 2,0. a. Calcolare un intervallo di confidenza al 95% per la concentrazione media di principio attivo. b. La casa farmaceutica stabilisce che l'ampiezza dell'intervallo di confidenza al 95% non debba superare il valore 0,248. Quale dimensione campionaria bisognerà scegliere? [(1,754;2,146) – n = 10] Esercizio 18 Si ipotizza che gli scarti dalla media mensile di un indice di borsa seguano una distribuzione Normale con media e varianza ignote. Sono osservati i seguenti 5 scarti: 1,2; -­‐1; 1,3; 1,5; -­‐0,5. a. Determinare un intervallo di confidenza al 95% per lo scarto medio mensile. 2
b. Determinare un intervallo di confidenza al 95% per la varianza σ . [(-­‐0,94;1,94) – (0,483;11,107)] Esercizio 19 In un determinato tratto di autostrada con limite di velocità di 120 km/h, la polizia stradale ha rilevato la velocità di un campione casuale di 64 automobili. La velocità media del campione è stata di 132 km/h con s = 20. a. Supponendo che la velocità delle automobili segua una distribuzione Normale, calcolare un intervallo di confidenza al 95% per la velocità media delle automobili. Si può affermare che in quel tratto di autostrada le automobili superano mediamente il limite di velocità? b. Quale dovrebbe essere la numerosità campionaria per ottenere un intervallo di confidenza di ampiezza non superiore a 8? [(127;137) – n = 96] Esercizio 20 Si vuole studiare la temperatura massima di Marrakech (Marocco) nel periodo marzo – aprile. Nel suddetto periodo le temperature massime osservate in 7 giorni sono state le seguenti: 22, 26, 25, 25, 28, 23, 24. Supponendo che le temperature massime giornaliere seguano una distribuzione Normale, calcolare l’intervallo di confidenza al 90% per la media e la varianza della temperatura massima. [(23,26;26,16) – (1,86;34,63)] 141 Esercizio 21 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume in un determinato anno è stata del 7,1%. L’anno seguente sono state effettuate 5 rilevazioni e la concentrazione media di sostanze inquinanti è risultata pari a 7,07% con s = 0,0265. Supposto che la concentrazione segua una distribuzione Normale, a un livello di significatività α = 0,05 si può affermare che il valore medio della concentrazione è diverso da quello riscontrato nell’anno precedente? [Si accetta l’ipotesi nulla] Esercizio 22 Una fabbrica di automobili utilizza guarnizioni per freni con una durata media pari a 20000 chilometri. Tale ditta sta considerando la possibilità di sostituirle con un altro tipo di guarnizioni che dovrebbe avere una durata maggiore. Le nuove guarnizioni vengono montate su 64 auto e la loro durata media risulta pari a 22000 chilometri con una varianza stimata corretta pari a 4000. Supponendo che la durata sia approssimativamente distribuita come una Normale, si può concludere a un livello di significatività α = 0,01 che le nuove guarnizioni sono migliori delle precedenti? [Si rifiuta l’ipotesi nulla] Esercizio 23 Il direttore di un’azienda che produce pasta ha il sospetto che il peso medio dei pacchi di pasta confezionati sia superiore a 500 grammi. Un campione di 25 pacchi ha fatto registrare un peso medio pari a 510 grammi con una stima corretta della varianza pari a 100. Supposto che il peso dei pacchi sia distribuito normalmente, verificare l’ipotesi che il peso medio sia effettivamente di 500 grammi contro l’ipotesi che sia maggiore al livello di significatività α = 0,01. [Si rifiuta l’ipotesi nulla] Esercizio 24 Si vuole appurare se la percentuale di fumatori tra gli impiegati è diversa rispetto a quella dell’intero paese. Si è a conoscenza che nel paese il 25% delle persone fuma. In un ufficio su 80 impiegati 24 sono fumatori. La differenza osservata è dovuta al caso? [Si accetta l’ipotesi nulla] Esercizio 25 Una macchina produce bulloni di diametro medio pari a 8 centimetri. Studi effettuati sulla distribuzione del diametro hanno portato a ritenere che questa sia approssimativamente di tipo Normale con varianza pari a 1. Si ha il sospetto che la macchina sia fuori taratura e che quindi il diametro medio sia cambiato. Per verificare questa ipotesi si estraggono casualmente 81 bulloni e si calcola il diametro medio che risulta pari a 7 centimetri. A un livello di significatività α = 0,05, si può concludere che la macchina sia tarata correttamente? [Si rifiuta l’ipotesi nulla] Esercizio 26 In uno studio sugli effetti nocivi delle polveri respirate dagli operai di un’industria, si è trovato che 16 operai sui 120 visitati presentano forti disturbi respiratori. È noto che il 10% della popolazione è affetta da tali disturbi. Verificare se la proporzione osservata tra gli operai è maggiore della proporzione nella popolazione a un livello di significatività α = 0,05. [Si accetta l’ipotesi nulla] Esercizio 27 La deviazione standard campionaria corretta s del prezzo a metro quadro di 12 appartamenti di uguale dimensione e situati nello stesso quartiere è uguale 709 euro. Nell’intera città, invece, la deviazione standard σ del prezzo degli appartamenti della stessa dimensione è pari a 350 euro. Ipotizzando che il prezzo sia distribuito secondo una Normale, verificare a un livello di significatività α = 0,05 se il prezzo delle case nel quartiere è più variabile che nell’intera città. [Si rifiuta l’ipotesi nulla] Esercizio 28 Un’industria produce un certo tipo di viti. Si vuole controllare che il processo di produzione sia sotto controllo, cioè vengano prodotte viti di lunghezza media pari a 1. Si considera allora un campione di 400 viti, di cui viene misurata la lunghezza, ottenendo una lunghezza media uguale a 1,1 centimetri e una varianza stimata corretta pari a 0,25. A un livello di significatività α = 0,01, si può concludere che il processo di produzione funzioni correttamente? [Si rifiuta l’ipotesi nulla] 142 Esercizio 29 In uno studio riguardante i bambini in età scolare si vuole verificare se la difficoltà nella lettura è un fattore che influisce sulla capacità globale di apprendimento, misurata attraverso un opportuno test. In particolare, si vuole verificare se il punteggio medio conseguito al test dai bambini con difficoltà nella lettura risulta inferiore al punteggio medio generale che è uguale a 105. Si osserva un campione casuale di 144 bambini che presentano difficoltà nella lettura e si trova che il loro punteggio medio è uguale a 102,5 con una deviazione standard corretta pari a 8,5. Verificare l’ipotesi nulla che il punteggio medio sia lo stesso per i bambini con difficoltà nella lettura e per i bambini in generale a un livello di significatività α = 0,05. [Si rifiuta l’ipotesi nulla] Esercizio 30 Il peso dei pacchi di sale dichiarato da un’azienda produttrice è pari a 500 grammi. Un’associazione di consumatori sostiene che in realtà i pacchi contengono in media una quantità inferiore di sale. Si è rilevato il peso X in grammi di 7 pacchi ottenendo i seguenti valori: 455, 430, 495, 499, 458, 428, 465. Si può assumere per X una distribuzione Normale. a. Volendo stimare il peso medio μ dei pacchi di sale, quale tra i due seguenti stimatori è opportuno utilizzare e perché? 7
T1 =
∑Xi
i=1
6
T2 =
∑ X +7X
i
7
i=1
7
7
b. Costruire un intervallo di confidenza di livello 95% per la media del peso e commentare il risultato che si ottiene. c. Costruire un intervallo di confidenza al 95% per la varianza del peso. d. Verificare al livello di significatività α = 1% che il peso medio sia 500 grammi, contro l’alternativa che sia inferiore. [T1 – (435,51;487,35) – (326;3798) – Si rifiuta l’ipotesi nulla] Esercizio 31 Su un campione casuale semplice di 120 giovani fra i 18 e 30 anni è stato rilevato il carattere X = “il numero di libri 120
120
i=1
i=1
letti in un anno” di cui si sa che ∑ x i = 420 e che ∑ x 2i = 1920 . a.
b.
c.
2
Fornire una stima puntuale del numero medio μ di libri letti in un anno e della varianza σ . Calcolare l’intervallo di confidenza di livello 98% per μ e commentare il risultato che si ottiene. Eseguire un test statistico sulla media per verificare l’ipotesi nulla H0: μ = 4 contro l’ipotesi alternativa che μ sia minore di 4 al livello di significatività α = 0,01. [3,5 – 3,78 – (3,09;3,91) – Si rifiuta l’ipotesi nulla] Esercizio 32 Un’indagine effettuata da una rivista automobilistica vuole accertare se i maschi apprezzano le automobili principalmente per le prestazioni mentre le donne per il loro aspetto esteriore. Su un campione di 200 uomini e 250 donne è stata rilevata la preferenza, riassunta nella seguente tabella: PREFERENZA SESSO ASPETTO ESTERNO PRESTAZIONE Uomo 75 125 Donna 150 100 Verificare l’ipotesi di indipendenza tra i due caratteri a un livello di significatività α = 0,05. [Si rifiuta l’ipotesi nulla di indipendenza] 143 Esercizio 33 In un’indagine sulle preferenze alimentari si sono svolte 139 interviste e si è chiesto di indicare la preferenza tra tre alimenti liquidi (caffellatte, tè, succo di frutta) e tre alimenti solidi (biscotti, merendine, fette biscottate) da consumare al mattino a colazione. Si è rilevata la seguente tabella: ALIMENTI LIQUIDI ALIMENTI SOLIDI BISCOTTI MERENDINE FETTE BISCOTTATE Caffelatte 45 8 5 Tè 7 5 31 Succo di frutta 5 27 6 Verificare l’ipotesi di indipendenza tra i due caratteri a un livello di significatività α = 0,01. [Si rifiuta l’ipotesi nulla di indipendenza] Esercizio 34 A un campione di 1368 giovani è stato chiesto di indicare il loro livello di felicità e il loro grado di istruzione. La seguente tabella riporta la distribuzione congiunta delle risposte date dal campione: LIVELLO DI FELICITÀ TITOLO DI STUDIO POCO FELICE ABBASTANZA FELICE MOLTO FELICE Scuola media inferiore 45 8 5 Scuola media superiore 7 5 31 Laurea 5 27 6 Verificare l’ipotesi di indipendenza tra i due caratteri a un livello di significatività α = 0,05. Si può concludere che l’associazione tra i due caratteri è molto elevata? [Si rifiuta l’ipotesi nulla di indipendenza – …] 144