Esercizio 3B (26.02.2009, circa 1.5 ore)
Transcript
Esercizio 3B (26.02.2009, circa 1.5 ore)
Laboratorio di Didattica di elaborazione dati – 3B DISTRIBUZIONI CAMPIONARIE LA FUNZIONE CERCA.VERT() Per determinare le caratteristiche fondamentali di una popolazione statistica non è sempre necessario analizzare tutta la popolazione statistica, ma risulta sufficiente esaminare un campione statistico. Un campione statistico è un sottoinsieme opportunamente scelto dall'intera popolazione, partendo dai dati di questo sottoinsieme è possibile trarre conclusioni riguardanti l'intera popolazione. Le ragioni per cui può essere preferibile analizzare i dati di un campione piuttosto di quelli dell'intera popolazione possono essere diverse: • la popolazione può essere molto vasta (ed è costoso e lungo analizzare tutte le unità statistiche), • le misure possono essere distruttive, • le unità statistiche non presentano variabilità – in questo caso risulta inutile effettuare molte misure, i parametri della popolazione risultano determinati con poche misure, • non tutti gli elementi della popolazione sono disponibili (quando si lavora, per esempio, con i dati storici). Nei seguenti esercizi studieremo le relazioni tra caratteristiche campionarie e caratteristiche della popolazione 1. Nel cassetto dell'elettricista ci sono tanti condensatori, di cui ciascuno dovrebbe avere la capacità di 470 nF. In realtà condensatori sono prodotti con una certa toleranza, per cui le loro capacità non sono esattamente uguali a 470 nF. Di fatto, un quarto dei condensatori proviene da una partita nella quale le capacità sono uguali (esattamente) a 473 nF, un quarto ha la capacità di 466 nF, un quarto la capacità di 468 nF, il rimanente un quarto – la capacità di 471 nF. Dunque le capacità non sono distribuite in modo continuo intorno alla media, invece abbiamo un insieme di 4 valori discreti di capacità. Tiriamo a sorte un condensatore dal cassetto. Qual è la media di capacità? La deviazione standard? (Raccomandazione: ci serviranno le funzione MEDIA() e DEV.ST.POP()). 2. Tiriamo a sorte due condensatori dal cassetto a. Trova tutte le medie di campioni possibili (di due condensatori). b. Qual è la speranza matematica della media di un campione (di due condensatori)? c. Qual è la sua deviazione standard? Laboratorio di Didattica di elaborazione dati 2008-2009, Jacek Dziedzic Per cavarsela con l'esercizio 2. dobbiamo generare un insieme di tutti i campioni dell'ampiezza 2, cioè {{473, 473}, {473, 466}, {473, 468}, {473, 471}, {466, 473}, {466, 466}, {466, 468}, 466, 471}, {468, 473}, {468, 466}, {468, 468}, {468, 471}, {471, 473}, {471, 466}, {471, 468}, {471, 471}}. In realtà non è un compito facile (se vogliamo eseguirlo in modo automatico, senza digitare a mano le 16 coppie). Anche se digitare può sembrare più facile, è meglio saperlo fare automaticamente – quando vorremmo generare tripli (ci sarebbero 64) o coppie di, per esempio, 20 valori (ci sarebbero 400) ci servirà questa conoscenza. Allora, al lavoro! Prima digita in una colonna 4 valori possibili che possiamo ottenere: 473, 466, 468, 471. Al lato, in una cella separata, digita ne il numero (4), oppure a mano, o usando la funzione CONTA.NUMERI(raggio), la quale può contare da sola il numero dei valori (se nel futuro ci venisse in mente di aumentare il numero di valori). Nella colonna precedente digita ne numeri ordinali, da 1 a 4. Accanto calcola ne il valore medio e la deviazione standard (infatti l'abbiamo fatto nel punto 1). Il nostro (lontano) scopo è adesso creare due colonne che dovranno contenere coppie di valori dal nostro elenco (vide le due ultime colonne del disegno accanto). Per comminciare facciamo qualcosa di più facile – creiamo due colonne che contengano i numeri ordinali dei valori delle coppie (come nelle due prime colonne del disegno accanto). Cominciamo dalla seconda colonna, cioè quella che contiene i valori 1, 2, 3, 4, 1, 2, e così via. Il primo “1” digita a mano (c'è sempre un punto da dove dobbiamo cominciare). Nella riga seguente digita una NO La riga precedente contiene il Prendi un 1 di più SE() formula generale (usando SE()), che effettui il suo valore massimo ( 4 )? valore in base al valore della riga precedente. Un SÌ suggerimento troverai nel diagramma accanto. Siamo non digitare il numero 4 ordinati e prendiamo il valore massimo dalla cella nella a mano! Prendi 1 quale l'abbiamo precedentemente inserito (usa un indirizzo assoluto). Copia ed incolla la stessa formula nelle righe seguenti. Hai ottenuto la colonna “numero ordinato 2”? Ora ci occupiamo della prima colonna (“numero ordinale 1”). Il primo valore (1) digita a mano. I seguenti valori li calcola usando una formula, la quale inventa con l'auito del diagramma sotto. Copia ed incolla la stessa formula nelle righe seguenti. Hai ottenuto la colonna “numero ordinato 1”? NO La cella accanto (nella Ora cerchiamo di ottenere le colonne terza e quarta, che Prendi il valore dalla SE() seguente colonna) contiene riga precedente contengono i valori di capacità. Nota che per riempire la 1? terza colonna è sufficiente prendere la i-esima capacità SÌ dall'elenco delle capacità, dove i indica il numero ordinale dalla prima colonna. Allo stesso modo, per Prendi il valore dalla riga precedente più 1 riempire la quarta colonna è sufficiente prendere la j- esima capacità dall'elenco delle capacità, dove j indica il numero ordinale dalla seconda colonna. Laboratorio di Didattica di elaborazione dati 2008-2009, Jacek Dziedzic Per fare questo useremo una funzione molto utile: CERCA.VERT(). La sua sintassi è la seguente: CERCA.VERT(valore,tabella,indice,FALSO). La funzione cerca il valore nella prima colonna della tabella (un raggio) e restituisce un valore dalla colonna numero indice, dalla riga in cui si trova il valore. L'ultimo argomente (FALSO) significa che cerchiamo un valore esatto. Il modo in cui funziona CERCA.VERT() è più facile comprendere usando un esempio accanto. Scrivendo CERCA.VERT("Giorgio", C2:D5,2,FALSO) possiamo ottenere il codice fiscale di Giorgio. Qua “Giorgio” è il valore che cerchiamo, C2:D5 indica la tabella e 2 è il numero della colonna (indice) nella tabela in cui si trovano i codici fiscali. Occhio: È cruciale che i valori nella prima colonna siano disposti in ordine crescente, altrimenti la funzione CERCA.VERT() può restituire una risposta sbagliata (!). Allora, usa la funzione CERCA.VERT() per riempire le colonne terza e quarta. Ora abbiamo tutte le coppie della capacità. Nella colonna seguente calcola la media per ciascuna coppia, e sotto la media delle medie. Verifica se la media della distribuzione campionaria delle medie ( ) la quale hai x appena calcolato coincide con la media della popolazione ( ) la quale hai calcolato nel punto 1. La deviazione standard della distribuzione campionaria delle medie ( ) deve invece essere uguale x a x= , dove è la deviazione n standard della popolazione e n significa l'ampiezza della campione (2 nel nostro caso). Calcola la deviazione standard della distribuzione campionaria delle medie per verificare l'asserzione sopra. Usa DEV.ST.POP() perché lavoriamo con tutta la popolazione (abbiamo tutti i campioni possibili). Durante il nostro incontro seguente continueremo a lavorare colle distribuzioni campionarie Laboratorio di Didattica di elaborazione dati 2008-2009, Jacek Dziedzic