Statistica - Università degli Studi della Basilicata

Transcript

Statistica - Università degli Studi della Basilicata
02/03/2015
Statistica
(Dr. Elvira Di Nardo)
80 ore = 10 crediti
Orario: lun, mar,mer 9.30-11.30
Sede: AULA MAGNA (ex Fac. SMFN)
Ricevimento: mer. 11.30-13.30
Esame: prova scritta (+ eventuale prova orale)
Materiale didattico e altro:
http://oldwww.unibas.it/utenti/dinardo/stateconomia.html
E. Di Nardo, a.a. 15/16
1
Introduzione alla Statistica
E. Di Nardo, a.a. 15/16
2
1
02/03/2015
Che cosa è la Statistica?
La statistica indaga su fenomeni collettivi, ossia
fenomeni che coinvolgono un insieme di individui,
oggetti, beni. Tale indagine è condotta
raccogliendo informazioni relative a tali collettivi
e traducendo tali informazioni in un modello
numerico
che
possa
essere
analizzato
semplicemente.
Popolazione = il collettivo preso in esame
Unità statistica = il singolo elemento della popolazione
E. Di Nardo, a.a. 15/16
3
Che cosa è una variabile statistica?
Una variabile statistica è una caratteristica oggetto di indagine.
Esempio:
E. Di Nardo, a.a. 15/16
4
2
02/03/2015
Tipologie di analisi statistiche
Insieme di tecniche per organizzare,
riassumere e presentare i dati.
Ma non si tratta solo di grafici….
ESEMPI:
o Il 2% delle lavatrici vendute da un negozio X presenta difetti di funzionamento.
o In questa classe, il voto medio è 25/30.
o Lo studente più anziano in questa classe ha 27 anni.
o Tra le adolescenti il colore maggiormente diffuso degli abiti è il nero.
E. Di Nardo, a.a. 15/16
5
Insieme di tecniche che consentono di generalizzare all’intera popolazione
e con un certo margine di errore i risultati ottenuti da un sottoinsieme della
popolazione, detto campione.
Esempio: Se in questa classe l’altezza media è 172cm, è possibile asserire che 172 cm
è l’altezza media della popolazione costituita dagli studenti UNIBAS?
Qualora la risposta fosse positiva, sono sicuro al 100% della validità di questa asserzione?
E. Di Nardo, a.a. 15/16
6
3
02/03/2015
Esempi: A) Se gli studenti in questa classe si disponessero per altezza, come i signori di
questa fotografia, potremmo «proiettare» il profilo di questa curva su tutta la popolazione
di studenti UNIBAS?
B) Petrolio si o petrolio no?
E. Di Nardo, a.a. 15/16
7
Classificazione delle variabili statistiche
Variabili qualitative (o mutabili statistiche) : i valori
assunti sono non-numerici.
Esempi: il colore degli occhi; la nazionalità; lo stato civile;
l’affidabilità; l’attitudine ai lavori manuali; fasce di reddito…
Variabili (quantitative): i valori assunti sono numeri.
Esempi: la statura; il peso; il numero di stanze di un appartamento;
il numero di figli…
Sconnessi
(Nominali)
Qualitative
Modalità
Ordinali
Valori
Discreti
Classi di
Modalità
Continui
Quantitative
E. Di Nardo, a.a. 15/16
Modalità
Discreti
8
4
02/03/2015
*Elaborata dallo psicofisico
Stanley Smith Stevens
(1946)
Scala Nominale
I dati sono organizzati in categorie e non possono essere ordinati.
1. Indicare il genere
Maschio
Mutuamente esclusive
Femmina
Questo è un primo esempio di
RILEVAZIONE DEI DATI
2. Quale è il colore dei tuoi capelli?
Castani
Neri
Biondi
Esaustive
Bianchi
Non so
Schede
Questionari
Interviste (anche telefoniche)
Exit Poll
3. Dove abiti?
Centro città
Periferia città
Contrade
Totale (censimento)
Parziale (campionaria)
Occasionale (sondaggi)
Periodica
Tipo
E. Di Nardo, a.a. 15/16
9
Scala Ordinale
I dati sono organizzati in categorie che possiedono un criterio di
ordinamento.
Ogni categoria esprime un rango
(ossia una posizione)
La distanza tra ranghi non
necessariamente è quantificabile
Non sono possibili operazioni
numeriche tra ranghi, ma solo
confronti (relazioni di ordine)
1. Il tuo giudizio all’esame di III media è stato:
Sufficiente
Distinto
Buono
Ottimo
Eccellente
2. A quale fascia ISEE appartieni?
I (0-4.500,01)
II (4.500,01-7.000)
III (7.000,01-12.000)
IV (12.000,01-18.000)
…
Non sono in fascia ISEE
E. Di Nardo, a.a. 15/16
10
5
02/03/2015
L’istituto nazionale di statistica
(ISTAT: http://www.istat.it/it/ )
mette a disposizione banche
dati sulle indagini effettuate
sul territorio nazionale.
E. Di Nardo, a.a. 15/16
11
Scala Intervallare
La distanza tra ranghi è quantificabile
La distanza tra ranghi non
rispetto
ad un intervallo preso come unità
necessariamente è quantificabile
di misura.
Scale che misurano la stessa grandezza
ma con unità di misura diverse possono
associare allo stesso oggetto più numeri.
0 Celsius = 32 Fahrenheit
La temperatura
Nei test psicoattidunali non necessariamente
lo zero corrisponde a nessuna attitudine.
E. Di Nardo, a.a. 15/16
Operazioni di
Standardizzazione
12
6
02/03/2015
Scala Rapporto
Per questo tipo di misure, lo zero non è arbitrario e corrisponde all’elemento di
intensità nulla (assenza di proprietà) rispetto all’unità misurata.
L’altezza
Il peso
La velocità
Il tempo
E. Di Nardo, a.a. 15/16
13
Come rappresentare i dati?
Il modo più semplice ed immediato per rappresentare i dati è costituito da tabelle.
carattere
Colore capelli
(carattere)
Neri
modalità
N° persone
(frequenza assoluta)
10
Castani
6
Rossi
1
biondi
5
22
totale
Frequenze
assolute
La frequenza assoluta indica quante volte la MODALITÀ di un carattere
si ripete
7
02/03/2015
Come rappresentare i dati?
Seriazione statistica: Carattere quantitativo
Con classi di modalità
Frequenza assoluta: numero di
volte in cui si verifica la modalità i
# stanze
# appartamenti
1
300
2
500
3
2.000
4
3.000
5
150
6
100
7
300
Peso (in grammi)
# neonati
1.800-2.200
10
2.200-2.600
32
2.600-3.000
120
3.000-3.400
254
3.400-3.800
134
3.800-4.200
40
4.200-4.600
10
Con modalità
E. Di Nardo, a.a. 15/16
15
Dalle modalità alle classi di modalità
In caso di modalità numerose, è preferibile una rappresentazione in classi di
modalità.
Peso (kg)
Freq.Assoluta
52
1
54
1
Classi di Modalità
Freq.Assoluta
55
2
[50;60)
4
61
1
[60;70)
7
63
1
[70;80)
4
68
2
Totale
15
69
3
71
1
73
1
75
1
76
1
Totale
15
E. Di Nardo, a.a. 15/16
16
8
02/03/2015
Come rappresentare i dati?
Serie statistica: Carattere qualitativo
N.PERSONE
2
TITOLO DI
STUDIO
N.PERSONE
lic.elementare
2.000
3.000
lic. Media
6.000
4.000
diploma
10.000
7.000
laurea
2.000
11.000
La frequenza assoluta non consente di
confrontare due insiemi di dati anche
se si riferiscono alla stessa specie,
poiché il numero di casi complessivo è
diverso.
Frequenza relativa
ANNO
VENDITE AUTO
1996
10.000
1997
15.000
1998
20.000
1999
18.000
2000
17.000
2001
22.000
2002
23.000
2003
10.000
Serie storica: variabile quantitativa
rilevata per modalità temporale.
Taglia: è il numero di unità statistiche
esaminate
E. Di Nardo, a.a. 15/16
17
La frequenza relativa di una certa modalità è data dal rapporto tra la
frequenza assoluta di tale modalità ed il numero totale dei casi. Quando
moltiplicate per 100 si dicono percentuali.
Consideriamo i dati presenti nella seguente tabella
Colore capelli frequenze
(carattere)
assolute
neri
10
castani
6
rossi
1
biondi
5
TOTALE
22
E. Di Nardo, a.a. 15/16
Calcolo FREQUENZE RELATIVE
10
×100 = 45,45
22
6
×100 = 27,27
22
1
×100 = 4,54
22
5
×100 = 22,72
22
Colore
capelli
frequenze
assolute
frequenze
relative %
neri
10
45,46
castani
6
27,27
rossi
1
4,55
biondi
5
22,72
TOTALE
22
100
18
9
02/03/2015
# stanze
# appartamenti
1
300
300/6350=0,047 0,047*100=4,7%
2
500
500/6350=0,079
7,9%
3
2.000
0,315
31,5%
4
3.000
0,472
47,2%
5
150
0,024
2,4%
6
100
0,016
1,6%
7
300
0,047
4,7%
Freq.rel
Perc.
300+500+2000+3000+150+100+300= 6350 (taglia)
Peso (in grammi)
# neonati
Peso (in grammi)
# neonati
1.800-2.200
10
10/600=0,017
1,7%
2.200-2.600
32
32/600=0,053
5,3%
2.600-3.000
120
0,2
20%
3.000-3.400
254
0,423
…
3.400-3.800
134
0,223
…
3.800-4.200
40
0,067
…
4.200-4.600
10
0,017
..
Completare
la tabella
E. Di Nardo, a.a. 15/16
19
Frequenze cumulate
Talvolta può essere utile calcolare anche la frequenza cumulata (percentuale o relativa)
# stanze
# appartamenti
%Relativa
Freq.Cum.
Freq.Cum.%
1
300
4,7%
0,047
4,7%
2
500
7,9%
0,126
12,6%
3
2.000
31,5%
0,441
44,1%
4
3.000
47,2%
0,913
91,3%
5
150
2,4%
0,937
93,7%
6
100
1,6%
0,953
95,3%
7
300
4,7%
1,000
100,0%
Come si leggono i risultati in tabella relativi alla freq. cumulata?
Il 12,6% degli intervistati ha appartamenti con un massimo di 2 stanze.
Il 31,5% degli intervistati ha appartamenti con 3 stanze.
Meno del 3% degli intervistati ha appartamenti con 5 stanze.
Che percentuale di intervistati ha appartamenti con 5 stanze o più?
Che percentuale di intervistati ha 3 o 4 stanze?
E. Di Nardo, a.a. 15/16
20
10