Diapositiva 1 - Dipartimento di Scienze Sociali ed Economiche

Transcript

Diapositiva 1 - Dipartimento di Scienze Sociali ed Economiche
STATISTICHESE
La popolazione o collettivo statistico è l’insieme
di individui o oggetti che si vogliono studiare.
Questi individui o oggetti vengono denominati
unità statistiche.
• Un campione è una parte di popolazione.
• Un censimento è lo studio dell’intera
popolazione.
Campione
Rilevazione parziale
Popolazione
Rilevazione totale
1
Carattere è l’aspetto che si intende studiare su un
determinato collettivo statistico
Modalità del carattere i diversi modi con cui il
carattere si presenta nelle varie unità
statistiche del collettivo.
Devono essere esaustive e non sovrapposte
Qualitativi
I caratteri si dividono in:
Quantitativi
2
Esempi di caratteri qualitativi e quantitativi
Dati estratti dal questionario della terza intervista
Si vogliono studiare le
caratteristiche
demografiche e sociali
(caratteri) della
popolazione del Lazio al 1°
gennaio 2012 (collettivo).
Un questionario potrebbe
raccogliere le seguenti
informazioni
Codice ident. intervista
3
Sesso Qualit
M
Età in anni compiuti Quantit
38
Stato civile Qualit
Provincia di residenza Qualit
Titolo di studio Qualit
Professione Qualit
Coniugato
LT
Laurea
Impiegato
Numero componenti Quant
della famiglia (oltre l’intervistato)
4
Reddito lordo annuo Quant
(in migliaia di euro)
40
3
MUTABILI
Qualitativi danno luogo a risposte non numeriche. Es:
sesso,stato civile, soddisfazione rispetto a qualche cosa,
livello d’istruzione
VARIABILI
-Quantitativi danno luogo a risposte numeriche
Continui: le risposte derivano da un
processo di misurazione.
Es: altezza, peso, età …
Discreti: le risposte derivano da un
processo di conteggio.
Es: n.figli in una famiglia, n. di autoveicoli, n.pezzi
prodotti da una macchina …
Quantitativi trasferibili (pacchetto azionario, reddito…) 4
Caratteri qualitativi
Caratteri sconnessi
• Dati nominali quando le diverse categorie possono
essere messe in un ordine qualsiasi (es. sesso M prima
di F o viceversa)
come posso trattare statisticamente tali caratteri?
Ad esempio associando a M il valore 0 e a F il valore 1
così potrò fare delle operazioni)
Caratteri rettilinei
• Dati ordinali quando le diverse categorie hanno un
ordine di assegnazione che ha un significato (es.livello
d’istruzione nessun titolo; licenza elem; licenza media
inf; licenza media sup; laurea; anche qui potrei
associare i valori da 0 a 5 oppure valori che
corrispondano al numero di anni necessari per
conseguire il titolo)
5
Carattere quantitativo
• Continuo
le modalità risultano da un confronto con un’unità di misura.
Spesso le modalità proprio per la loro continuità vengono
raggruppate in classi es. statura 150-160; 160-170;
170-180….e così via
 Ogni classe ha un estremo inferiore ed un estremo superiore
 Gli estremi possono essere inclusi nella classe (classe chiusa a destra e a
sinistra)
 Può essere incluso solo l’estremo inferiore (classe chiusa a sinistra)
 Può essere incluso solo l’estremo superiore (classe chiusa a destra)
n. di classi adeguato al problema
classi disgiunte
includere tutte le modalità del
carattere
abbiano se possibile stessa
ampiezza
intervalli aperti a destra o
a sinistra
6
Come avviene l’acquisizione dei dati?
Vedere autonomamente cap.1 par.1.5, 1.6 e 1.7
• Rilevazione sperimentale tipica delle Scienze fisiche,
biologiche, chimiche etc.
• Rilevazione osservazionale tipiche delle indagini
statistiche, delle indagini di mercato, delle rilevazioni
economiche, demografiche, sociali, etc.
7
Qual è in Italia l’Ente preposto all’acquisizione dei dati
tramite indagini statistiche?
ISTAT (Istituto Nazionale di Statistica)
• Istat è un Ente di ricerca pubblico con ordinamento autonomo,
sottoposto alla vigilanza della Presidenza del Consiglio
(attuale Presidente dell’Istat è Giorgio Alleva)
• Istat è al vertice del Sistema Statistico Nazionale (Sistan) che
comprende oltre all’Istat, gli uffici di statistica centrali e
periferici delle amministrazioni dello Stato, quelli delle Regioni,
delle Province e dei Comuni, delle Unità Sanitarie Locali, delle
Camere di Commercio e tutti gli uffici di statistica di enti e
amministrazioni pubbliche
http://www.istat.it/
http://www3.istat.it/servizi/studenti/valoredati/
8
Fasi dell’indagine
definizione degli obiettivi
definizione delle unità e delle variabili da rilevare
scelta del periodo di riferimento
individuazione della popolazione e della lista delle
unità statistiche
definizione del piano di campionamento
raccolta dei dati
scelta della tecnica di rilevazione
formulazione del questionario e pretest
rilevazione sul campo
registrazione dei dati
registrazione su supporto magnetico
controllo e correzione
elaborazione e analisi dei dati
9
L’ esempio precedente
Dati estratti dal questionario della terza intervista
Si vogliono studiare le
caratteristiche
demografiche e sociali
(caratteri) della
popolazione del Lazio al 1°
gennaio 2012 (collettivo).
Un questionario potrebbe
raccogliere le seguenti
informazioni
Codice ident. intervista
3
Sesso
M
Età in anni compiuti
38
Stato civile
Coniugato
Provincia di residenza
Titolo di studio
Professione
LT
Laurea
Impiegato
Numero componenti
della famiglia (oltre l’intervistato)
4
Reddito lordo annuo
(in migliaia di euro)
40
10
File originario dei dati
Cod.
Int.
Sesso
Età in
anni
compiu
ti
Stato
civile
Provincia
di resid.
1
2
F
F
29
40
Nubile
Nubile
RM
FR
3
M
38
4
F
42
Coniug
ato
Coniug
ata
5
M
48
Celibe
RI
6
M
59
RM
7
M
70
Coniug
ata
Celibe
n.
comp.
Fam.
Reddito
lordo annuo
(migl. Euro)
1
3
35000
10000
LT
Laurea Impiegato
Diplom Disoccupato
a
Laurea Impiegato
4
40000
FR
Laurea
3
90000
1
90000
4
15000
5
30000
8
9
F
F
25
35
Nubile
Coniug
ata
FR
FR
3
3
20000
50000
10
M
46
Celibe
RM
2
7000011
RM
Titolo
di
studio
Professione
Libero
professionis
ta
Laurea
Libero
professionis
ta
Diplom Casalinga
a
Lic.
Pensionato
Media
Laurea Disoccupato
Laurea
Libero
professionis
ta
Laurea Pensionato
Qualche osservazione
La stessa modalità può presentarsi ripetuta –
anche molte volte – nella stessa colonna
Ogni colonna corrisponde alla distribuzione
unitaria di un carattere
Scelto un carattere tra quelli di interesse,
dalla tabella è possibile individuare subito la
modalità assunta da ogni unità statistica del
collettivo. (COLONNA)
Viceversa, scelta un’unità, è possibile leggere
le modalità che questa unità presenta in
corrispondenza di ogni carattere considerato
(RIGA)
12
n
Sulla base del foglio dati precedente si costruisce la
Stato
civile
Provincia
Cod.
di resid.
Int.
iu
Titolo
Sesso Professione
Età in
Stato
n. Provincia
Reddito
Titolo
di
anni
civile
comp.di lordo
resid.annuo
di
studio
compiu
Fam.
(migl. Euro)
studio
ti
Nubile
Nubile
RM 1
FR 2
Coniug
ato
Coniug
ata
LT 3
Laurea
F
Diplom
F
a
Laurea
M
FR 4
Laurea
F
Celibe
RI 5
Laurea
M
Coniug
ata
Celibe
RM 6
Nubile
Coniug
ata
FR 8
FR 9
Diplom
M
a
Lic.M
Media
Laurea
F
Laurea
F
Celibe
RM10
Laurea
M
RM 7
Impiegato
29
Nubile
1
Disoccupato
40
Nubile
3
Professione
RM35000Laurea
Impiegato
FR10000
Diplom Disoccupato
Tabella di frequenza
a
Impiegato
38
Coniug
4distribuzione
LT 40000Laurea
Impiegato
secondo
il
ato
titolo di studio
Libero
42
Coniug
3 carattere
FR90000Laurea
Libero
professionis ata
professionis
ta
ta
Libero
48
Celibe
1
90000Laurea
Titolo
diRIstudio
niLibero
professionis
professionis
ta
ta
Licenza
media
1
Casalinga
59
Coniug
4
RM15000
Diplom
Casalinga
ata
a
Pensionato
70
Celibe
5 Diploma
RM30000 Lic.
Pensionato
2
Media
Disoccupato
25
Nubile
3
FR20000Laurea Disoccupato
7Libero
Libero
35
Coniug
3 Laurea
FR50000Laurea
professionis ata
professionis
ta
Tot
10 ta
Pensionato
46
Celibe
2
RM70000Laurea Pensionato
n.
comp.
Fam.
Reddito
lordo annu
(migl. Euro
1
3
35000
10000
4
40000
3
90000
1
90000
4
15000
5
30000
3
3
20000
50000
2
70000
13
Tabella statistica o tabella di frequenza
Si ottiene dalla distribuzione unitaria considerando
quante volte si presenta ciascuna modalità del
carattere
• Frequenze assolute (ni)
• Frequenze relative (fi = ni / n)
• Frequenze relative percentuale (pi = ni / n%)
14
Esempio
Titolo di studio
frequenza assoluta
Lic. Media
Diploma
Laurea
Totale
3
6
11
20
frequenza asso
cumulata
3
9
20
-
Titolo di studio
frequenza relativa
Frequenza percentuale
Lic. Media
Diploma
Laurea
Totale
0,15
0,3
0,55
1
15,0
30,0
55,0
100,0
15
Frequenza cumulata (modalità del carattere ordinate)
La frequenza cumulata di una classe è data dalla somma della frequenza
della classe con quella delle classi precedenti.
j
N j   ni
Frequenza assoluta cumulata:
i1
j
Fj   fi
Frequenza relativa cumulata:
i1
Quante sono le persone che hanno meno di 30 anni?
classi di età
ni
Nj
fi
Fj
0-5
17
17
0,17
0,17
5-15
40
57
0,40
0,57
15-30
37
94
0,37
0,94
30-35
6
100
0,06
1,00
Totale
100
1,00
16
classi di età
ni
0-5
17
5-15
40
15-30
37
30-35
6
Totale
100
Il simbolo di sommatoria
3
n
i
i 1
Proprietà che ci potranno servire
n
n
 kx  k  x
i
i 1
X
ni
X1
n1
X2
n2
…
…
Xi
ni
…
…
Xk
nk
Totale
n
 n1  n2  n3  17  40  37 94
i 1
i
Tabella generica relativa
alla vs X
Generica ima modalità
con rispettiva frequenza
k
n   ni
i 1
n
 k  nk
i 1