Ricorsione e gettoni di due colori - Prima parte.nb

Transcript

Ricorsione e gettoni di due colori - Prima parte.nb
Utilizzo della Funzione Generatrice di Probabilita’
in un processo di Bernoulli in cui ogni sequenza termina con una
successione prefissata
Riflessioni di Carlo
Perche’ di queste riflessioni
gnugnu ha proposto sul blog un suo quesito supplementare sui mazzi di carte ben mescolati,
”… L’altro ( decisamente più tosto: qual è la probabilità che ogni carta di un colore sia vicina ad almeno una
dell’altro?”
Nel cercare un soluzione, ho fatto molte affermazioni inesatte, approssimate e comunque non
dimostrate. La bravura di gnugnu è stata quella di rilevare puntualmente i punti oscuri o deboli dei
miei ragionamenti.
Ho approfondito seriamente l’argomento e riporto qui le conclusioni, un po’ piu’ strutturate...
Definizione di base
Se X e' una variabile casuale che assume i valori interi positivi si ha;
ki
F X HsL = EAs X ] = Ú¥
i=1 s p(k)
dove le xi sono in generale numeri interi positivi.
La funzione F X (s) viene detta Funzione Generatrice della Probabilita’.
La serie che definisce F X HsL converge solo se |s |£ 1 perche’ cosi’ e’ maggiorata dalla serie di
probabilita’ p(k) che converge a 1.
Il raggio di convergenza puo’ essere maggiore nel caso che X abbia un numero finito di valori.
La funzione F X (s) individua univocamente la distribuzione discreta della X
Derivazione delle p(k)
pHkL =
1 ¶k F X HsL
k!
¶sk
I valori p HkL sono i coefficienti dello sviluppo in serie di potenze di FX HsL.
FX HsL = s0 p H0L + s1 p H1L + s2 p H2L + ... + sn p HnL + ...
2
Ricorsione e gettoni di due colori - Prima parte.nb
es.
p H3L =
1 ¶3 FX HsL
3!
¶s3
6
s=0
=
3!
p H3L
Perche’ sono utili
Le funzioni generatrici consentono di ottenere risposte precise a domande che coinvolgono la
funzione di distribuzione discreta di probabilita’ e che sarebbe molto difficile ottenere per altra via
(es. calcolo combinatorio) o con elaborazioni al computer ( impossibilita’ di trattamento per k relativamente grande).
Vediamo alcune domande che sono emerse nel blog “Mazzi di carte ben mescolati”nella discussione partendo dalla variante proposta da gnugnu “:... L’altro decisamente più tosto: qual è la
probabilità che ogni carta di un colore sia vicina ad almeno una dell’altro? ...”
N.B. Modifico le domande per adattarle al processo Bernouilliano del lancio del gettone {R,N} che
mi era venuto in mente quando ho affrontato la variante.
- Lunghezza media della successione di lanci che termina con la sequenza di tre carte uguali.
- Varianza della distribuzione delle lunghezze.
- Data una sequenza di lanci, trovare la probabilita’ che la sequenza di arresti al lancio k.mo.
Nella forma piu’ generale, associamo ad ogni evento x di X le probabilita’ p e q=1-p per designare
le caratteristiche del gettone, equilibrato o meno.
Definizioni e relazioni da tener presenti
P{X = k} = p(k)
Q(k) =P{X >k}
Le funzioni generatrici di p(k) e q(k) saranno:
P(s) = p(0)+p(1) s+ p(2) s2 + p(3) s3 ...
Q(s) = q(0)+q(1) s+ q(2) s2 + q(3) s3 ...
Dimostriamo ora che Q(s) =
1 - P HsL
1-s
(1- s) Q(s) = q(n) -q(n-1) = - p(n) quando n ³ 1 e q(0) = p(1)+p(2)+p(3)+ ....=1-p(0) quando n=0.
da cui
(1-s) Q(s) = 1 - P(s)
E’ una relazione importante che utilizzo per ricavare la funzione generatrice.
Per verificare che quello che si ottiene sia veramente una distribuzione di probabilita’:
PH0L = 1.
E’ una relazione importante che utilizzo per ricavare la funzione generatrice.
Ricorsione e gettoni di due colori - Prima parte.nb
3
Per verificare che quello che si ottiene sia veramente una distribuzione di probabilita’:
PH0L = 1.
Media e Varianza di X
¥
Μ = E(X) = Ú¥
k=1 k pHkL = Úk=0 qHkL
in termini di funzione generatrice,
E(X) = P`(1) = Q(1)
per la varianza,
Σ2 = EIX 2) -E HxL2 = P``(1) + p`H1L - p`H1L2 = 2 Q` H1L + Q H1L - QH1L2
Generazione di una sequenza di Bernoulli
Consideriamo una successione di lanci di un gettone, una faccia rossa "R" e una faccia nera "N".
Sia “p” la probabilita’ che si presenti R e “q” la probabilita’ che si presenti N ; se il gettone e’ equilibrato sara’ p = q =
1
2
, altrimenti sara’ q = 1 - p, Questa successione e’ detta processo di Bernoulli.
I lanci vengono ripetuti fino a quando non si presenti per la prima volta una successione determinata, ad esempio “RRNRR”.
Definizioni
Sia g(k) la probabilita’ che la sequenza sia stata completata per la prima volta al lancio k (uso g
per evitare confusione con la probabilita’ p associata, diciamo al “R”).;
Sia z(k) la probabilita’ di completare la nostra sequenza al lancio n, ma teniamo presente che
potrebbe essere la k.ma volta in cui questo avviene.
La somma delle probabilita’ g(k) deve essere 1, mentre la somma delle z(k) tende all’infinito in
quanto n tende all’infinito.
Una precisazione: nella definizione di z(k) si assume che le occorrenze successive del pattern non
possono sovrapporsi. Ad esempio, la successione “RRNRRNRRN” contiene solo un completamento di “RRNRR” e non due.
La probabilita' z(k)
Assumiamo che al risultato R sia associata la probabilita’ p e al risultato N sia associata la probabilita’ q = (1-p). Per trovare la probabilita' z(k), supponiamo che siano gia' stati effettuati k lanci e
dobbiamo calcolare la probabilita’ che gli ultimi 5 lanci siano proprio “RRNRR”.
Osserviamo lo schema
seguente:
k-4
k-3
k-2
k-1
k
RRNRRxxxx RRNRRxxx RRNRRxx RRNRRx RRNRR
xxxxRRNRR xxxRRNRR xxRRNRR xRRNRR RRNRR
OK
OK
NO
NO
OK
Al lancio k-1 e k-2 non si sono verificate coincidenze tra i risultati fino a quel momento e la
sequenza di riferimento. Prima, pero’, al lancio k-3 e k-4 si sono avute le corrispondenze RR-RR e
4
Assumiamo che al risultato R sia associata la probabilita’ p e al risultato N sia associata la probabilita’ q = (1-p). Per trovare la probabilita' z(k), supponiamo che siano gia' stati effettuati k lanci e
dobbiamo calcolare la probabilita’ che gli ultimi 5 lanci siano proprio “RRNRR”.
Ricorsione e gettoni di due colori - Prima parte.nb
Osserviamo lo schema
seguente:
k-4
k-3
k-2
k-1
k
RRNRRxxxx RRNRRxxx RRNRRxx RRNRRx RRNRR
xxxxRRNRR xxxRRNRR xxRRNRR xRRNRR RRNRR
OK
OK
NO
NO
OK
Al lancio k-1 e k-2 non si sono verificate coincidenze tra i risultati fino a quel momento e la
sequenza di riferimento. Prima, pero’, al lancio k-3 e k-4 si sono avute le corrispondenze RR-RR e
R-R, rispettivamente.
La probabilita’ di questo evento e’ espressa come
p4 q = z HkL + z Hk - 3L p2 q + z Hk - 4L p3 q
in quanto la probabilita’ di “RRNRR” e’ di p4 q che deve essere la z(k), per ora ignota, sommata
alla probabilita’ di z(k-3) moltiplicata alla probabilita’ di “RRN” pari a p2 q e quella di z(k-4) moltiplicata per la probabilita’ di “RRNR” , p3 q.
Un programma abbastanza semplice struttura la funzione generatrice isolando i blocchi che sono
comuni per ogni soluzione dell’equazione ricorsiva. Qui Mathematica con la sua funzione RSolve ha
aiutato moltissimo !)
i Blocchi sono:
Q(s) =
NumHsL
Den@sD
Num(s) = parte destra dell’equazione, cambiando u[k-i] con si .
Den(s) = parte sinistra dell’equazione moltiplicata per sn dove n e’ la lunghezza della sequenza
finale.
Fatto questo, abbiamo finito:
PGF =
z HsL-1
1
=
zHsL
1+H1-sL Q
Caratteristiche per sequenze finali di dimensioni 2
Seq.Terminale
PGF
RR
1
1+
H1-sL H1+p sL
1+
1-s
H1-pL p s2
1
NR
1+
1-s
H1-pL p s2
1
NN
1+
6
22
4
4
4
4
6
22
p2 s2
1
RN
Lunghezza media Varianza Lunghezza
H1-sL H1+H1-pL sL
H1-pL2 s2
Ricorsione e gettoni di due colori - Prima parte.nb
Caratteristiche per sequenze finali di dimensioni 3
Seq. Terminale
RRR
RRN
RNR
RNN
1 ‘ I1 +
PGF
IH1 - sL I1 + p s +
Ip3
s3 MM
1+
s2 MM
‘
1-s
H1-pL p2 s3
I1 + H1 - pL p
1
s2 MM
‘
1-s
H1-pL2 p s3
1
1+
1-s
H1-pL p2 s3
1 ‘ I1 + IH1 - sL
I1 + H1 - pL p
IH1 -
pL2
1+
NNN
1
IH1 - pL p2 s3 MM
NRR
NNR
p2
1 ‘ I1 + IH1 - sL
1+
NRN
Lunghezza media Varianza Lunghezza
p
1
1-s
s3 MM
H1-pL2 p s3
s2 MM
‘
1 ‘ I1 + IH1 - sL I1 + H1 - pL s +
IH1 -
H1 pL3
pL2
s2 MM
s3 MM
‘
14
142
8
24
10
58
8
24
8
24
10
58
8
24
14
142
5
6
Ricorsione e gettoni di due colori - Prima parte.nb
Caratteristiche per sequenze finali di dimensioni 4
Ricorsione e gettoni di due colori - Prima parte.nb
Seq. Terminale
RRRR
1‘
PGF
I1 + IH1 - sL I1 + p s +
p3
1+
RRNN
RNRN
RNNR
RNNN
NNRR
I1 + H1 - pL
IH1 - pL
NNNR
1 ‘ I1 + IH1 - sL
s4 MM
I1 + H1 - pL p
s2 MM
I1 + H1 -
s3 MM
IH1 -
pL2
p2
1 ‘ I1 + IH1 - sL
IH1 -
pL2
1-s
s4 MM
pL2
p2
1
p
s4 MM
‘
‘
‘
H1-pL3 p s4
1
1-s
H1-pL p3 s4
1 ‘ I1 + IH1 - sL
I1 + H1 - pL
p2
IH1 - pL2 p2 s4 MM
1 ‘ I1 + IH1 - sL
s3 MM
‘
I1 + H1 - pL p s2 MM ‘
IH1 - pL2 p2 s4 MM
1 ‘ I1 + IH1 - sL
I1 + H1 -
IH1 -
pL3
p
1
1-s
1 ‘ I1 + IH1 - sL
I1 + H1 -
IH1 -
pL2
p
s4 MM
H1-pL2 p2 s4
pL3
1+
NNNN
p3
s3 MM
p2
p
1
1-s
pL2
p
s4 MM
s3 MM
s3 MM
‘
‘
H1-pL3 p s4
1 ‘ I1 + IH1 - sL
I1 + H1 - pL s + H1 -
pL2
s2 + H1 - pL3 s3 MM ‘
HH1 - pL4 s4 LM
30
734
16
144
18
210
16
144
18
210
20
276
18
210
16
144
16
144
18
210
20
276
18
210
16
144
18
210
16
144
30
734
+
1-s
H1-pL2 p2 s4
1 ‘ I1 + IH1 - sL
1+
NNRN
s4 LM
1
1+
NRNN
s2
IH1 - pL p3 s4 MM
NRRR
NRNR
Hp4
p2
I1 + H1 - pL p2 s3 MM ‘
1+
NRRN
1-s
‘
H1-pL p3 s4
1 ‘ I1 + IH1 - sL
1+
RNRR
s3 MM
1
RRRN
RRNR
Lunghezza media Varianza Lunghezza
7
8
Ricorsione e gettoni di due colori - Prima parte.nb
Caratteristiche per sequenze finali di dimensioni 5
Seq. Terminale
RRRRR
PGF
1‘
I1 + IH1 - sL I1 + p s +
p3
s3
Hp5 s5 LM
RRRRN
1+
RRRNR
1 ‘ I1 +
RNNRN
1-s
s5 LM
s4 MM
p3
p2
s4 MM
‘
‘
s3
1-s
1 ‘ I1 + IH1 - sL
I1 + H1 - pL2 p2 s4 MM ‘
IH1 - pL2 p3 s5 MM
1
1-s
1 ‘ I1 + IH1 - sL
I1 + H1 - pL
HH1 - pL
p4
1 ‘ I1 + IH1 - sL
1‘
s5 LM
I1 + H1 - pL
IH1 -
pL2
p3
p3
p2
s5 MM
s4 MM
‘
s3 MM
‘
I1 + IH1 - sL I1 + H1 - pL p
H1 - pL2 p2 s4 MM ‘
s2
1
1-s
H1-pL3 p2 s5
1 ‘ I1 + IH1 - sL
I1 + H1 - pL2 p2 s4 MM ‘
1 ‘ I1 + IH1 - sL
I1 + H1 -
IH1 -
pL3
pL2
p2
p
s5 MM
s3 MM
32
736
34
866
32
736
38
1142
32
736
34
866
32
736
34
866
36
996
42
1434
32
736
34
866
36
996
+
IH1 - pL2 p3 s5 MM
IH1 - pL2 p3 s5 MM
3390
+
H1-pL2 p3 s5
H1-pL3 p2 s5
62
+
H1-pL2 p3 s5
1
1+
RNNRR
1
H1 - pL
1+
RNRNN
p4
p3
HH1 - pL p4 s5 LM
RRNNN
RNRNR
‘
s2
1-s
IH1 - sL I1 + H1 - pL
1+
RNRRN
1
p2
s4 MM
H1-pL p4 s5
HH1 - pL
RRNRN
RNRRR
p4
I1 + H1 - pL
1+
RRNNR
+
1 ‘ I1 + IH1 - sL
RRRNN
RRNRR
Lunghezza media Varianza Lunghezza
‘
Ricorsione e gettoni di due colori - Prima parte.nb
RNNNR
1 ‘ I1 + IH1 - sL
I1 + H1 - pL3 p s4 MM ‘
IH1 - pL3 p2 s5 MM
1
RNNNN
1+
1
NRRRR
1+
NRRRN
NRRNR
NRRNN
NRNNR
NRNNN
NNRRR
I1 + H1 - pL
IH1 -
pL2
NNRNR
IH1 -
pL2
NNNRR
1 ‘ I1 + IH1 - sL
I1 + H1 -
IH1 -
1‘
pL3
NNNNR
p2
s5 MM
pL2
p2
s5 MM
p2
1
1+
1-s
s4 MM
‘
s3 MM
‘
s4 MM
‘
H1-pL2 p3 s5
I1 + IH1 - sL I1 + H1 - pL p s2 +
H1 - pL2 p2 s4 MM ‘
IH1 - pL3 p2 s5 MM
1 ‘ I1 + IH1 - sL
I1 + H1 -
IH1 -
pL3
I1 + H1 -
HH1 -
pL2
p2
1 ‘ I1 + IH1 - sL
pL4
p
1
1-s
p
s5 MM
pL3
p
s5 LM
H1-pL2 p3 s5
1 ‘ I1 + IH1 - sL
I1 + H1 -
pL2
p2
IH1 - pL3 p2 s5 MM
1
1 ‘ I1 +
s3 MM
‘
s4 MM
‘
s4 MM
‘
1-s
H1-pL3 p2 s5
IH1 - sL I1 + H1 - pL2 p s3 +
866
32
736
32
736
34
866
36
996
34
866
32
736
42
1434
36
996
34
866
32
736
34
866
32
736
38
1142
32
736
34
866
32
736
H1 - pL3 p s4 MM ‘
HH1 - pL4 p s5 LM
1
1+
NNNRN
p3
p3
s5 MM
I1 + H1 - pL
1+
NNRNN
p3
1 ‘ I1 + IH1 - sL
1+
NNRRN
1-s
H1-pL p4 s5
1 ‘ I1 + IH1 - sL
NRNRR
NRNRN
1-s
H1-pL4 p s5
34
1-s
H1-pL3 p2 s5
1 ‘ I1 + IH1 - sL
I1 + H1 -
HH1 -
pL4
1+
p
1
1-s
pL3
p
s5 LM
H1-pL4 p s5
s4 MM
‘
9
10
Ricorsione e gettoni di due colori - Prima parte.nb
NNNNN
1 ‘ I1 + IH1 - sL
I1 + H1 - pL s + H1 - pL2
s2 + H1 - pL3 s3 +
H1 - pL4 s4 MM ‘
HH1 - pL5 s5 LM
62
3390