S9_modelli di probabilità - Università degli Studi della Basilicata

Transcript

S9_modelli di probabilità - Università degli Studi della Basilicata
Modelli di probabilità
Corso di STATISTICA
Prof. Roberta Siciliano
Ordinario di Statistica, Università di Napoli Federico II
Professore supplente, Università della Basilicata
a.a. 2011/2012
Prof. Roberta Siciliano
Statistica
1
Obiettivo dell’unità didattica
• 
Definire i concetti di base sulla teoria delle
variabili casuali e dei modelli di
probabilità discreti e continui
Contenuti
•  Definizione di variabile casuale
•  Modelli discreti di probabilità
•  Modelli continui
Prof. Roberta Siciliano
Statistica
2
1
Variabile Casuale
Una Variabile Casuale è una regola (funzione reale) che associa ad
E (evento elementare di S) uno ed un solo numero reale
Per ogni Evento dello Spazio Campionario
la v.c. X assume il valore reale x
E2
E1
E3
E5
E6
Prof. Roberta Siciliano
R
E4
S
Statistica
x1
x2
3
x3
Il ruolo delle variabili casuali
La prova ha dato quel particolare risultato
La v.c. X ha generato quel particolare valore x
Sarà possibile associare una misura di probabilità
allo spazio numerico della v.c. utilizzando la misura
di probabilità definita sui sottoinsiemi dello spazio
campionario S.
"Si verifica l'evento E con probabilità P(E)"
"La v.c. X assume il valore x con probabilità P(x)"
Prof. Roberta Siciliano
Statistica
4
2
Le variabili discrete
Una v.c. X è una variabile che assume valori nello spazio
dei numeri reali secondo una funzione di probabilità P(X).
P[X(E)]
S
E
1
X(E)
!
Rappresentazione grafica dello schema
di costruzione di una v.c. discreta
Prof. Roberta Siciliano
0
Statistica
5
Esempio: estraendo casualmente una famiglia con 3 figli e
annotando il genere (Maschio, Femmina) dei 3 figli, i possibili
risultati della prova sono:
E1
E2
E3
E4
E5
E6 E7 E8
S={MMM,MMF,MFM,FMM,MFF,FMF,FFM,FFF}
1/8
1/8
1/8
1/8
1/8
1/8
1/8 1/8
Definiamo la variabile casuale X= numero dei figli maschi
{E8 }
{E5 ∪ E6 ∪ E7 }
{E2 ∪ E3 ∪ E4 }
{E1}
Prof. Roberta Siciliano
Statistica
X
0
1
2
3
pi
1/8
3/8
3/8
1/8
6
3
Schematicamente
Esempi di prove: lancio di un dado, di una moneta, estrazione di un
numero al lotto. Ai k eventi possibili risultati di una prova, si
associano k valori della v.c. a cui sono associate le corrispondenti
probabilità.
Eventi v.c.X P(X)
E1
E2
x1
x2
p1
p2
E3
x3
p3

Ek

xk

pk
Prof. Roberta Siciliano
Statistica
7
Tipi di variabili casuali
Il modello di probabilità è una esemplificazione della realtà
e può essere descritto da una v.c.
v.c.
Discrete
In natura
Prof. Roberta Siciliano
Continue
discretizzate
Statistica
8
4
variabili casuali discrete
Una Variabile Casuale è nota se
conosciamo la sua distribuzione di probabilità
I valori della v.c. possono essere arbitrari,
mentre le probabilità
non possono essere arbitrarie perché:
# p !0
i = 1,!, k
% i
$
" pi = 1
%&
Prof. Roberta Siciliano
Statistica
9
Una variabile casuale discreta può essere
rappresentata graficamente
pi
x1
Prof. Roberta Siciliano
x2
Statistica
x3
xi
10
5
Valore atteso e varianza di una v.c. discreta
Si definisce valore atteso di una v.c. X discreta:
k
E(X) = ! xi pi
i=1
Si definisce varianza di una v.c. X discreta:
k
2
var(X) = " ( xi ! E ( X )) pi
i=1
Prof. Roberta Siciliano
Statistica
11
v.c Uniforme discreta
La prova che genera una v.c. Uniforme discreta si può assimilare all’estrazione
di una pallina da un’urna che contiene k palline identiche e numerate da 1 a k.
Ogni pallina ha la stessa probabilità di essere estratta.
Esempi di prove: lancio di un dado , estrazione di una carta da un mazzo
Si definisce quindi v.c. Uniforme discreta, la variabile X che assume valori
x=1,2,…,k con probabilità costante pari a 1/k.
Essa si indica con X~Ud(k)
con P(X=x)=1/k per ogni x=1,2,…,k.
La v.c. Ud è simmetrica, non presenta moda e possiede media e varianza pari a:
E(X)=(k+1)/2
Prof. Roberta Siciliano
Var(X)=(n2-1)/12
Statistica
12
6
Esempio
Prof. Roberta Siciliano
Statistica
13
v.c. Bernoulliana
La v.c. di Bernoulli trae origine da una prova nella quale interessa verificare
esclusivamente se un evento E si verifica (successo) oppure no (insuccesso).
Si è in presenza di un modello bernoulliano ogni qual volta è possibile
dicotomizzare (suddividere in due) i possibili esiti di una prova:
Esempi: il verificarsi di testa o di “croce” nel lancio di una moneta, l’estrazione
di una pallina bianca o nera da un’urna che ne contiene di bianche e nere, il
verificarsi di un punteggio superiore al 5 nel lancio di un dado oppure inferiore o
uguale a 5, etc.
La v.c. di Bernoulli X assume valore 1 (il successo ) con probabilità π (pi greco)
e valore 0 (l insuccesso ) con probabilità 1- π, quale possibili esiti di una prova
Essa si indica con X~B(1,π)
con P(X=x)= πx(1- π)1-x
per x=0,1.
La v.c. di Bernoulli possiede media e varianza pari a:
E(X)= π (la media coincide con la probabilità di successo)
Var(X)= π(1- π) (può assumere valori compresi tra 0 e 0,25, questo ultimo nel caso
di massima incertezza)
Prof. Roberta Siciliano
Statistica
14
7
Esempio
Prof. Roberta Siciliano
Statistica
15
v.c. Binomiale
Se si ripete, per n volte e nelle medesime condizioni, lo schema successo-insuccesso della
v.c. di Bernoulli, si genera una sequenza di n sottoprove indipendenti a ciascuna delle quali
si può associare una v.c. di Bernoulli. Tale modello prende il nome di v.c. Binomiale e può
essere intesa come una somma di n v.c. bernoulliane.
Esempio: nel lancio n volte di una moneta si è interessati al numero di volte in cui esce testa.
La v.c. Binomiale rappresenta il numero di successi che si verificano in una sequenza di n
sottoprove indipendenti nelle quali è costante la probabilità π di successo.
La v.c. binomiale dipende da due parametri, il numero n delle sottoprove e la probabilità π.
! n $ x
n'x
& ! (1' ! )
Essa si indica con X~B (n,π) con P ( X = x ) = #
per x=0,1,2,…,n.
" x %
La v.c. Binomiale possiede media e varianza pari a:
E(X)= n π
Var(X)= n π(1- π)
(n volte la media della bernoulliana)
(n volte la varianza della bernoulliana)
Prof. Roberta Siciliano
Statistica
16
8
Esempio
Prof. Roberta Siciliano
Statistica
17
Condizioni di applicazione del modello binomiale
La v.c. binomiale trova applicazione in prove dove sono verificate le
seguenti condizioni:
•  la prova è composta da n sottoprove indipendenti
ovvero, il risultato di una sottoprova non modifica la probabilità della
successiva.
•  ogni sottoprova è svolta sempre nelle medesime condizioni
ovvero, la probabilità π del successo (in una singola sottoprova
bernoulliana) è costante in tutte le n sottoprove.
Prof. Roberta Siciliano
Statistica
18
9
Variabili Casuali continue
•  Ammette infiniti valori, quindi non è
possibile attribuire le singole probabilità ad
ogni x.
•  Si associa ad ogni intervallo una funzione f(x)
detta funzione di densità.
Prof. Roberta Siciliano
Statistica
f(x)
19
Attenzione, f(x) non è
la probabilità!!!!!!
X
f(x) è proporzionale (a meno di un infinitesimo) alla
probabilità di un intervallo sufficientemente piccolo
Prof. Roberta Siciliano
Statistica
20
10
Se X è una variabile casuale che assume valori in
[a,b], essa è definita se:
Esiste la f (x ) tale che per ogni x 0 ∈ (a, b )
P(x0 ≤ X ≤ xo + dx ) = f (x0 )dx
⎧ f (x ) ≥ 0
Per ogni x tale che a < x < b
⎪ b
⎨
⎪∫ f (x )dx = 1
⎩ a
Prof. Roberta Siciliano
Statistica
21
Calcolo delle probabilità per v.c. continue
P( x0 ! X ! x1 ) = P( X ≤ x1 ) − P( X ≤ x0 ) =
= F ( x1 ) − F ( x0 )
f (x)
Prof. Roberta Siciliano
x0 x1
Statistica
x
22
11
Valore atteso e varianza di una v.c. continua
Si definisce valore atteso di una v.c. X continua:
b
E(X) =
! x f ( x ) dx
a
Si definisce varianza di una v.c. X continua:
b
var(X) =
2
" ( x ! E(X)) f ( x ) dx
a
Prof. Roberta Siciliano
Statistica
23
Molti fenomeni della realtà si distribuiscono
secondo il modello della curva Normale X~ N (µ, ! 2 )
f ( M e − c) = f ( M e − c)
-c
c
⇓
f è simmetrica
M0 = Me = µ
M 0 < M e < µ ! asimmetria positiva (destra)
µ < M e < M 0 ! asimmetria negativa (sinistra)
Prof. Roberta Siciliano
Statistica
24
12
Equazione della funzione Normale o
di Gauss
1
f ( x; µ ; σ ) =
e
σ 2Π
2
−
1 ⎛ X − µ ⎞ 2
⎜
⎟
⎠
2σ 2 ⎝
per ogni x tale che − ∞ < x < +∞
Prof. Roberta Siciliano
Statistica
25
Una curva Normale è completamente rappresentata
da µ e σ
Gode si simmetria rispetto a
µ
Ha forma campanulare
Le ascisse dei punti di flesso sono in
µ ±σ
Gli estremi della curva sono asintotici
Prof. Roberta Siciliano
Statistica
26
13
La conoscenza di un modello teorico corrispondente ad una
distribuzione empirica consente:
• Regolarizzare un istogramma
• Ricostruire dati mancanti
• Confrontare istogrammi basati su classi di diversa ampiezza
• Descrivere sinteticamente i dati con i parametri del modello
E possibile ricostruire le frequenze teoriche n̂i relative ad
Una certa classe xi , xi +1 semplicemente integrando la funzione
Normale su detto intervallo
Prof. Roberta Siciliano
Statistica
27
v.c. Normale Standardizzata X~N(0,1)
(
)
Se µ = 0 e σ 2 = 1 ⇒ N µ , σ 2 = Z (0,1)
1
1 − 2 z2
f (z ) =
e
2Π
Relazione tra
Z=
X −µ
σ
Prof. Roberta Siciliano
− ∞ ≤ z ≤ +∞
(
N µ,σ 2
) e Z (0,1)
X = µ + Zσ
Statistica
28
14
X ≈ distribuzione normale → Z =
X −µ
σ
1 1,5 2 2,5 3 3,5 4
Distribuzi one normale standardiz zata → X = µ + Zσ
N (0,1)
Prof. Roberta Siciliano2
0
2
Statistica
29
z
P(Z < z ) = φ (z ) =
∫ f ( y )dy
−∞
Esistono le tavole dei valori di probabilità!!
φ (z ) = 1 − φ (− z ) ⇒ φ (− z ) = 1 − φ (z )
φ (0) = 0.5
φz − φz
φ0 = 0.5
2
0
Prof. Roberta Siciliano
Statistica
z1
z2
1
z
30
15
⎡ X − µ x − µ ⎤
P( X ≤ x ) = P ⎢
≤
=
⎥
σ
σ
⎣
⎦
x − µ ⎞
⎛
⎛ x − µ ⎞
P⎜ Z ≤
=
φ
⎟
⎜
⎟
σ ⎠ ⎝ σ ⎠
⎝
Prof. Roberta Siciliano
Statistica
σ
31
σ
Me = M0 = µ
1) Se σ
Se
↑ la curva si appiattisce
σ ↓la curva si allunga
2) M e ≡ M 0 ≡ µ
Prof. Roberta Siciliano
Statistica
32
16
3)
µ − σ e µ + σ sono due flessi
4)
f (µ − x) = f (µ + x)
5) L
2
3
2
3
intervalloµ − σ , µ + σ comprende il 50% delle osservazioni
L intervallo µ − σ , µ + σ
comprende il 68%
delle osservazioni
L intervallo µ − 2σ , µ + 2σ comprende il 95% delle osservazioni
L intervallo µ − 3σ , µ + 3σ comprende il 99.7% delle osservazioni
Prof. Roberta Siciliano
Statistica
6) Per x = µ ⇒ f (µ ) =
7)Per
x → +∞
(
33
1
2Πσ
2
= max
e x → −∞ f (x ) = 0
2
)
(
⇒ ax + b ~ N aµ + b, a
8) Se X ~ N µ , σ
con a,b costanti reali.
Cioè ogni trasformazione lineare di X sarà
ancora Normale
Prof. Roberta Siciliano
Statistica
σ 2)
2
34
17
Trasformazioni della v.c. Normale
§  v.c. Chi-quadrato con g gradi di libertà:
La somma dei quadrati di g v.c. normali standardizzate e
indipendenti
§  v.c. F-Snedecor Fisher con g e h gradi di libertà:
Il rapporto tra due v.c. Chi-quadrato, indipendenti tra loro, ciascuna
rapportata ai propri gradi di libertà, g ed h.
§  v.c. t-Student con g gradi di libertà:
Il rapporto tra una v.c. normale standardizzata ed un Chi-quadrato
con g gradi di libertà, tra loro indipendenti.
Prof. Roberta Siciliano
Statistica
35
Diseguaglianza di Cebicev
La disuguaglianza di Cebicev è uno dei risultati più notevoli del calcolo delle
probabilità. La disuguaglianza afferma che, per ogni v.c. X che E(X)=µ e Var(X)
=σ2<+∞, si ha:
P(|X- µ|)<є)≥1-(1/ є2)
per ogni є>0.
Ponendo є σ=k, la disuguaglianza si può esprimere nel seguente modo:
P(|X- µ|)<k)≥1-(σ2 / k2)
per ogni k>0.
In altre parole, l’importanza di questo risultato risiede nel fatto che, noti i momenti
primo e secondo di una v.c. X, è sempre possibile trovare un limite inferiore alla
probabilità che la variabile assuma valori compresi in un intervallo [µ-є σ; µ+є σ].
Ciò anche quando è ignota la funzione di probabilità della variabile casuale!!!
Prof. Roberta Siciliano
Statistica
36
18
Prof. Roberta Siciliano
Statistica
37
19