Statistica 1 - Dipartimento di Matematica e Informatica

Transcript

Statistica 1 - Dipartimento di Matematica e Informatica
Matematica per psicologi
Docente: prof. Gabriella Caristi,
E-mail: [email protected]
http://www.dsm.univ.trieste.it/~caristi
Tel.: 040 558 2605
Testo: Statistical methods for the social
sciences, A. Agresti-B. Finlay, Prentice Hall
1
Acquisizione di dati attraverso osservazioni,
quali inchieste telefoniche, questionari,
interviste, esperimenti…..
La statistica è un insieme di metodi per
raccogliere e analizzare i dati raccolti.
I metodi della statistica sono volti:
• alla pianificazione della ricerca
• alla descrizione dei dati raccolti attraverso la
definizione di opportune quantità statistiche
• alla predizione e generalizzazione
2
descrizione
statistica descrittiva
inferenza
statistica inferenziale
3
Popolazione: l’insieme dei soggetti ai quali
viene applicato lo studio.
Campione: il sottoinsieme della
popolazione sul quale vengono raccolti i
dati.
Soggetto o unità statistica: elemento del
campione
Esempio: si vuole descrivere la famiglia
italiana tipo. Ovviamente non si possono
intervistare tutte le famiglie italiane
(popolazione). Se ne sceglierà un campione.
4
Usiamo la statistica descrittiva per raccogliere
i dati relativi alle dimensioni delle famiglie
appartenenti al campione e li riassumiamo ad
esempio calcolando la dimensione media.
Usiamo la statistica inferenziale per
prevedere la dimesione media delle famiglie
della intera popolazione.
Un importante aspetto della inferenza
statistica è la stima del grado di accuratezza
della previsione.
5
Esempio: se per condurre un esperimento si
usa un campione tratto da una classe di
studenti di psicologia, le conclusioni che se
ne deducono non possono essere
generalizzate alla popolazione di tutti gli
studenti della università, o a tutti i giovani di
età compresa fra i 18 e i 50 anni, ecc.
6
Le caratteristiche dei soggetti del campione
che si misurano sono chiamate variabili.
Esempio: il sesso, l’età, l’altezza, ecc.
I valori che una variabile può assumere
formano una scala di misura.
Classificazione delle variabili
Variabile qualitativa: la scala di misura è
un insieme di categorie non ordinato,
generalmente la misura non è espressa da
un numero. Esempio: il sesso: M o F, 0 o 1.
Si parla di scala nominale.
7
Variabile quantitativa: si esprime mediante
numeri. Ha senso confrontare i valori di una
variabile quantitativa. Spesso si considerano
insiemi di valori che possono essere assunti
da una variabile quantitativa, intervalli.
Si parla di scala a intervalli.
Scala ordinale: i valori sono ordinati, ma
non è definita la distanza fra due livelli.
Esempio: molto buono, buono, sufficiente,...
8
Un’altra classificazione
Variabile discreta: può assumere solo un
numero finito di valori. Es.:numero di
elementi di una famiglia,…
Variabile continua: es.: età, peso,…
Le variabili qualitative sono discrete, quelle
quantitative sono discrete o continue.
9
Campionamento casuale semplice:
una volta stabilita la dimensione (numero di
elementi) di un campione da estrarre da una
data popolazione, si procede a una scelta
casuale in modo che ogni campione della
medesima dimensione abbia la stessa
probabilità di essere estratto.
Per estrarre un campione casuale di 10
soggetti da una popolazione di 100 elementi si
inseriscono i 100 nominativi in un’urna e si
procede ad una estrazione a sorte.
10
Campionamento sistematico
Un altro modo di procedere consiste nel
creare una lista dei nomi degli elementi della
popolazione e quindi di procedere alla
estrazione utilizzando un passo n appropriato,
scegliendo l’elemento della lista da cui
iniziare in modo casuale.
Campionamento a più stadi
La popolazione è divisa in gruppi e viene estratto
un campione casuale da ogni gruppo, in modo
proporzionale alla importanza del gruppo stesso.
11
Quando la popolazione è molto grande, si può
procedere all’uso
- di una tabella di numeri casuali
- di un generatore di numeri casuali
per scegliere i soggetti.
Ad ogni modo pur prendendo un campione
casuale, la statistica è influenzata dal campione.
2 ricercatori che basino una statistica sulla
stessa popolazione usando 2 campioni casuali,
è possibile che ottengano risultati diversi.
12
Ha senso definire l’errore di campionamento
come la differenza fra il valore di un
parametro di una popolazione predetto da
una statistica ed il valore reale di tale
parametro. Ciò anche se il valore reale spesso
non è noto.
Altre fonti di errore:
errori sistematici (volontariato),
dati mancanti (alcuni soggetti non
rispondono, o non rispondono a tutte le
domande di un questionario)
13
Percentuali
Lilliput ha 1300 abitanti, il 30% dei quali sono donne.
Significa che (1300×30):100=390 sono donne.
Esercizi: Il prezzo di un bene aumenta del 7% nel
corso del primo anno e diminuisce del 5% nel corso
del secondo anno. Quale è la variazione di prezzo alla
fine dei 2 anni?
X+X ×7:100=1.07 ×X= prezzo alla fine del I
(1.07 ×X) ×0.95=1.0165 ×X=prezzo alla fine
del II
Variazione= +1.65%
14
Il I genn. ’03 ho messo in un libretto di risparmio
1000€. L’interesse è del 1% composto annualmente.
Quanti
euro avrò nel libretto alla fine del 10° anno?
10
10001.011100,...×=
In gruppo di 2000 studenti 324 sono residenti fuori
sede. Che percentuale rappresentano?
324/2000 =
=162/1000=0.162=
=16.2%
15