Esercizio 3B (26.02.2009, circa 1.5 ore)

Transcript

Esercizio 3B (26.02.2009, circa 1.5 ore)
Laboratorio di Didattica di elaborazione dati – 3B
DISTRIBUZIONI CAMPIONARIE
LA FUNZIONE CERCA.VERT()
Per determinare le caratteristiche fondamentali di una popolazione statistica non è sempre
necessario analizzare tutta la popolazione statistica, ma risulta sufficiente esaminare un campione
statistico. Un campione statistico è un sottoinsieme opportunamente scelto dall'intera popolazione,
partendo dai dati di questo sottoinsieme è possibile trarre conclusioni riguardanti l'intera
popolazione.
Le ragioni per cui può essere preferibile analizzare i dati di un campione piuttosto di quelli
dell'intera popolazione possono essere diverse:
•
la popolazione può essere molto vasta (ed è costoso e lungo analizzare tutte le unità
statistiche),
•
le misure possono essere distruttive,
•
le unità statistiche non presentano variabilità – in questo caso risulta inutile effettuare molte
misure, i parametri della popolazione risultano determinati con poche misure,
•
non tutti gli elementi della popolazione sono disponibili (quando si lavora, per esempio, con
i dati storici).
Nei seguenti esercizi studieremo le relazioni tra caratteristiche campionarie e caratteristiche della
popolazione
1. Nel cassetto dell'elettricista ci sono tanti condensatori, di cui ciascuno dovrebbe avere la
capacità di 470 nF. In realtà condensatori sono prodotti con una certa toleranza, per cui le
loro capacità non sono esattamente uguali a 470 nF. Di fatto, un quarto dei condensatori
proviene da una partita nella quale le capacità sono uguali (esattamente) a 473 nF, un quarto
ha la capacità di 466 nF, un quarto la capacità di 468 nF, il rimanente un quarto – la capacità
di 471 nF. Dunque le capacità non sono distribuite in modo continuo intorno alla media,
invece abbiamo un insieme di 4 valori discreti di capacità. Tiriamo a sorte un condensatore
dal cassetto. Qual è la media di capacità? La deviazione standard? (Raccomandazione: ci
serviranno le funzione MEDIA() e DEV.ST.POP()).
2. Tiriamo a sorte due condensatori dal cassetto
a. Trova tutte le medie di campioni possibili (di due condensatori).
b. Qual è la speranza matematica della media di un campione (di due condensatori)?
c. Qual è la sua deviazione standard?
Laboratorio di Didattica di elaborazione dati
2008-2009, Jacek Dziedzic
Per cavarsela con l'esercizio 2. dobbiamo generare un insieme di tutti i campioni dell'ampiezza 2,
cioè {{473, 473}, {473, 466}, {473, 468}, {473, 471}, {466, 473}, {466, 466}, {466, 468},
466, 471}, {468, 473}, {468, 466}, {468, 468}, {468, 471}, {471, 473}, {471, 466}, {471, 468}, {471, 471}}.
In realtà non è un compito facile (se vogliamo eseguirlo in modo automatico, senza digitare a mano
le 16 coppie). Anche se digitare può sembrare più facile, è meglio saperlo fare automaticamente –
quando vorremmo generare tripli (ci sarebbero 64) o coppie di, per esempio, 20 valori (ci sarebbero
400) ci servirà questa conoscenza. Allora, al lavoro!
Prima digita in una colonna 4 valori possibili
che possiamo ottenere: 473, 466, 468, 471.
Al lato, in una cella separata, digita ne il
numero (4), oppure a mano, o usando la
funzione CONTA.NUMERI(raggio), la quale
può contare da sola il numero dei valori (se
nel futuro ci venisse in mente di aumentare il
numero di valori). Nella colonna precedente
digita ne numeri ordinali, da 1 a 4. Accanto
calcola ne il valore medio e la deviazione
standard (infatti l'abbiamo fatto nel punto 1).
Il nostro (lontano) scopo è adesso creare due colonne che dovranno contenere coppie di valori dal
nostro elenco (vide le due ultime colonne del disegno accanto). Per comminciare facciamo qualcosa
di più facile – creiamo due colonne che contengano i numeri ordinali dei valori delle coppie (come
nelle due prime colonne del disegno accanto). Cominciamo dalla seconda colonna, cioè quella che
contiene i valori 1, 2, 3, 4, 1, 2, e così via. Il primo “1” digita a mano (c'è sempre un punto da dove
dobbiamo cominciare). Nella riga seguente digita una
NO
La riga precedente contiene il
Prendi un 1 di più
SE()
formula generale (usando SE()), che effettui il suo
valore massimo ( 4 )?
valore in base al valore della riga precedente. Un
SÌ
suggerimento troverai nel diagramma accanto. Siamo
non digitare
il numero 4
ordinati e prendiamo il valore massimo dalla cella nella
a mano!
Prendi 1
quale l'abbiamo precedentemente inserito (usa un
indirizzo assoluto).
Copia ed incolla la stessa formula nelle righe seguenti. Hai ottenuto la colonna “numero ordinato 2”?
Ora ci occupiamo della prima colonna (“numero ordinale 1”). Il primo valore (1) digita a mano.
I seguenti valori li calcola usando una formula, la quale inventa con l'auito del diagramma sotto.
Copia ed incolla la stessa formula nelle righe seguenti. Hai ottenuto la colonna “numero ordinato 1”?
NO
La cella accanto (nella
Ora cerchiamo di ottenere le colonne terza e quarta, che
Prendi il valore dalla
SE() seguente colonna) contiene
riga precedente
contengono i valori di capacità. Nota che per riempire la
1?
terza colonna è sufficiente prendere la i-esima capacità
SÌ
dall'elenco delle capacità, dove i indica il numero
ordinale dalla prima colonna. Allo stesso modo, per
Prendi il valore dalla riga
precedente più 1
riempire la quarta colonna è sufficiente prendere la
j- esima capacità dall'elenco delle capacità, dove j indica il numero ordinale dalla seconda colonna.
Laboratorio di Didattica di elaborazione dati
2008-2009, Jacek Dziedzic
Per fare questo useremo una funzione molto utile: CERCA.VERT(). La sua sintassi è la seguente:
CERCA.VERT(valore,tabella,indice,FALSO). La funzione cerca il valore nella prima colonna
della tabella (un raggio) e restituisce un valore dalla colonna numero indice, dalla riga in cui si
trova il valore. L'ultimo argomente (FALSO) significa che cerchiamo un valore esatto. Il modo in cui
funziona CERCA.VERT() è più facile comprendere usando
un esempio accanto. Scrivendo CERCA.VERT("Giorgio",
C2:D5,2,FALSO) possiamo ottenere il codice fiscale di
Giorgio. Qua “Giorgio” è il valore che cerchiamo, C2:D5
indica la tabella e 2 è il numero della colonna (indice)
nella tabela in cui si trovano i codici fiscali.
Occhio: È cruciale che i valori nella prima colonna siano disposti in ordine crescente, altrimenti
la funzione CERCA.VERT() può restituire una risposta sbagliata (!).
Allora, usa la funzione CERCA.VERT() per riempire le colonne terza e quarta. Ora abbiamo tutte le
coppie della capacità. Nella colonna seguente calcola la media per ciascuna coppia, e sotto la media
delle medie. Verifica se la media della distribuzione campionaria delle medie (  ) la quale hai
x
appena calcolato coincide con la media della popolazione (  ) la quale hai calcolato nel punto 1.
La deviazione standard della distribuzione campionaria delle medie (  ) deve invece essere uguale
x

a  x=
, dove  è la deviazione
n
standard della popolazione e n
significa l'ampiezza della campione
(2 nel nostro caso). Calcola la
deviazione standard della distribuzione campionaria delle medie per
verificare l'asserzione sopra. Usa
DEV.ST.POP() perché lavoriamo con
tutta la popolazione (abbiamo tutti i
campioni possibili).
Durante il nostro incontro seguente continueremo a lavorare colle distribuzioni campionarie
Laboratorio di Didattica di elaborazione dati
2008-2009, Jacek Dziedzic