Ricorsione e gettoni di due colori - Prima parte.nb
Transcript
Ricorsione e gettoni di due colori - Prima parte.nb
Utilizzo della Funzione Generatrice di Probabilita’ in un processo di Bernoulli in cui ogni sequenza termina con una successione prefissata Riflessioni di Carlo Perche’ di queste riflessioni gnugnu ha proposto sul blog un suo quesito supplementare sui mazzi di carte ben mescolati, ”… L’altro ( decisamente più tosto: qual è la probabilità che ogni carta di un colore sia vicina ad almeno una dell’altro?” Nel cercare un soluzione, ho fatto molte affermazioni inesatte, approssimate e comunque non dimostrate. La bravura di gnugnu è stata quella di rilevare puntualmente i punti oscuri o deboli dei miei ragionamenti. Ho approfondito seriamente l’argomento e riporto qui le conclusioni, un po’ piu’ strutturate... Definizione di base Se X e' una variabile casuale che assume i valori interi positivi si ha; ki F X HsL = EAs X ] = Ú¥ i=1 s p(k) dove le xi sono in generale numeri interi positivi. La funzione F X (s) viene detta Funzione Generatrice della Probabilita’. La serie che definisce F X HsL converge solo se |s |£ 1 perche’ cosi’ e’ maggiorata dalla serie di probabilita’ p(k) che converge a 1. Il raggio di convergenza puo’ essere maggiore nel caso che X abbia un numero finito di valori. La funzione F X (s) individua univocamente la distribuzione discreta della X Derivazione delle p(k) pHkL = 1 ¶k F X HsL k! ¶sk I valori p HkL sono i coefficienti dello sviluppo in serie di potenze di FX HsL. FX HsL = s0 p H0L + s1 p H1L + s2 p H2L + ... + sn p HnL + ... 2 Ricorsione e gettoni di due colori - Prima parte.nb es. p H3L = 1 ¶3 FX HsL 3! ¶s3 6 s=0 = 3! p H3L Perche’ sono utili Le funzioni generatrici consentono di ottenere risposte precise a domande che coinvolgono la funzione di distribuzione discreta di probabilita’ e che sarebbe molto difficile ottenere per altra via (es. calcolo combinatorio) o con elaborazioni al computer ( impossibilita’ di trattamento per k relativamente grande). Vediamo alcune domande che sono emerse nel blog “Mazzi di carte ben mescolati”nella discussione partendo dalla variante proposta da gnugnu “:... L’altro decisamente più tosto: qual è la probabilità che ogni carta di un colore sia vicina ad almeno una dell’altro? ...” N.B. Modifico le domande per adattarle al processo Bernouilliano del lancio del gettone {R,N} che mi era venuto in mente quando ho affrontato la variante. - Lunghezza media della successione di lanci che termina con la sequenza di tre carte uguali. - Varianza della distribuzione delle lunghezze. - Data una sequenza di lanci, trovare la probabilita’ che la sequenza di arresti al lancio k.mo. Nella forma piu’ generale, associamo ad ogni evento x di X le probabilita’ p e q=1-p per designare le caratteristiche del gettone, equilibrato o meno. Definizioni e relazioni da tener presenti P{X = k} = p(k) Q(k) =P{X >k} Le funzioni generatrici di p(k) e q(k) saranno: P(s) = p(0)+p(1) s+ p(2) s2 + p(3) s3 ... Q(s) = q(0)+q(1) s+ q(2) s2 + q(3) s3 ... Dimostriamo ora che Q(s) = 1 - P HsL 1-s (1- s) Q(s) = q(n) -q(n-1) = - p(n) quando n ³ 1 e q(0) = p(1)+p(2)+p(3)+ ....=1-p(0) quando n=0. da cui (1-s) Q(s) = 1 - P(s) E’ una relazione importante che utilizzo per ricavare la funzione generatrice. Per verificare che quello che si ottiene sia veramente una distribuzione di probabilita’: PH0L = 1. E’ una relazione importante che utilizzo per ricavare la funzione generatrice. Ricorsione e gettoni di due colori - Prima parte.nb 3 Per verificare che quello che si ottiene sia veramente una distribuzione di probabilita’: PH0L = 1. Media e Varianza di X ¥ Μ = E(X) = Ú¥ k=1 k pHkL = Úk=0 qHkL in termini di funzione generatrice, E(X) = P`(1) = Q(1) per la varianza, Σ2 = EIX 2) -E HxL2 = P``(1) + p`H1L - p`H1L2 = 2 Q` H1L + Q H1L - QH1L2 Generazione di una sequenza di Bernoulli Consideriamo una successione di lanci di un gettone, una faccia rossa "R" e una faccia nera "N". Sia “p” la probabilita’ che si presenti R e “q” la probabilita’ che si presenti N ; se il gettone e’ equilibrato sara’ p = q = 1 2 , altrimenti sara’ q = 1 - p, Questa successione e’ detta processo di Bernoulli. I lanci vengono ripetuti fino a quando non si presenti per la prima volta una successione determinata, ad esempio “RRNRR”. Definizioni Sia g(k) la probabilita’ che la sequenza sia stata completata per la prima volta al lancio k (uso g per evitare confusione con la probabilita’ p associata, diciamo al “R”).; Sia z(k) la probabilita’ di completare la nostra sequenza al lancio n, ma teniamo presente che potrebbe essere la k.ma volta in cui questo avviene. La somma delle probabilita’ g(k) deve essere 1, mentre la somma delle z(k) tende all’infinito in quanto n tende all’infinito. Una precisazione: nella definizione di z(k) si assume che le occorrenze successive del pattern non possono sovrapporsi. Ad esempio, la successione “RRNRRNRRN” contiene solo un completamento di “RRNRR” e non due. La probabilita' z(k) Assumiamo che al risultato R sia associata la probabilita’ p e al risultato N sia associata la probabilita’ q = (1-p). Per trovare la probabilita' z(k), supponiamo che siano gia' stati effettuati k lanci e dobbiamo calcolare la probabilita’ che gli ultimi 5 lanci siano proprio “RRNRR”. Osserviamo lo schema seguente: k-4 k-3 k-2 k-1 k RRNRRxxxx RRNRRxxx RRNRRxx RRNRRx RRNRR xxxxRRNRR xxxRRNRR xxRRNRR xRRNRR RRNRR OK OK NO NO OK Al lancio k-1 e k-2 non si sono verificate coincidenze tra i risultati fino a quel momento e la sequenza di riferimento. Prima, pero’, al lancio k-3 e k-4 si sono avute le corrispondenze RR-RR e 4 Assumiamo che al risultato R sia associata la probabilita’ p e al risultato N sia associata la probabilita’ q = (1-p). Per trovare la probabilita' z(k), supponiamo che siano gia' stati effettuati k lanci e dobbiamo calcolare la probabilita’ che gli ultimi 5 lanci siano proprio “RRNRR”. Ricorsione e gettoni di due colori - Prima parte.nb Osserviamo lo schema seguente: k-4 k-3 k-2 k-1 k RRNRRxxxx RRNRRxxx RRNRRxx RRNRRx RRNRR xxxxRRNRR xxxRRNRR xxRRNRR xRRNRR RRNRR OK OK NO NO OK Al lancio k-1 e k-2 non si sono verificate coincidenze tra i risultati fino a quel momento e la sequenza di riferimento. Prima, pero’, al lancio k-3 e k-4 si sono avute le corrispondenze RR-RR e R-R, rispettivamente. La probabilita’ di questo evento e’ espressa come p4 q = z HkL + z Hk - 3L p2 q + z Hk - 4L p3 q in quanto la probabilita’ di “RRNRR” e’ di p4 q che deve essere la z(k), per ora ignota, sommata alla probabilita’ di z(k-3) moltiplicata alla probabilita’ di “RRN” pari a p2 q e quella di z(k-4) moltiplicata per la probabilita’ di “RRNR” , p3 q. Un programma abbastanza semplice struttura la funzione generatrice isolando i blocchi che sono comuni per ogni soluzione dell’equazione ricorsiva. Qui Mathematica con la sua funzione RSolve ha aiutato moltissimo !) i Blocchi sono: Q(s) = NumHsL Den@sD Num(s) = parte destra dell’equazione, cambiando u[k-i] con si . Den(s) = parte sinistra dell’equazione moltiplicata per sn dove n e’ la lunghezza della sequenza finale. Fatto questo, abbiamo finito: PGF = z HsL-1 1 = zHsL 1+H1-sL Q Caratteristiche per sequenze finali di dimensioni 2 Seq.Terminale PGF RR 1 1+ H1-sL H1+p sL 1+ 1-s H1-pL p s2 1 NR 1+ 1-s H1-pL p s2 1 NN 1+ 6 22 4 4 4 4 6 22 p2 s2 1 RN Lunghezza media Varianza Lunghezza H1-sL H1+H1-pL sL H1-pL2 s2 Ricorsione e gettoni di due colori - Prima parte.nb Caratteristiche per sequenze finali di dimensioni 3 Seq. Terminale RRR RRN RNR RNN 1 I1 + PGF IH1 - sL I1 + p s + Ip3 s3 MM 1+ s2 MM 1-s H1-pL p2 s3 I1 + H1 - pL p 1 s2 MM 1-s H1-pL2 p s3 1 1+ 1-s H1-pL p2 s3 1 I1 + IH1 - sL I1 + H1 - pL p IH1 - pL2 1+ NNN 1 IH1 - pL p2 s3 MM NRR NNR p2 1 I1 + IH1 - sL 1+ NRN Lunghezza media Varianza Lunghezza p 1 1-s s3 MM H1-pL2 p s3 s2 MM 1 I1 + IH1 - sL I1 + H1 - pL s + IH1 - H1 pL3 pL2 s2 MM s3 MM 14 142 8 24 10 58 8 24 8 24 10 58 8 24 14 142 5 6 Ricorsione e gettoni di due colori - Prima parte.nb Caratteristiche per sequenze finali di dimensioni 4 Ricorsione e gettoni di due colori - Prima parte.nb Seq. Terminale RRRR 1 PGF I1 + IH1 - sL I1 + p s + p3 1+ RRNN RNRN RNNR RNNN NNRR I1 + H1 - pL IH1 - pL NNNR 1 I1 + IH1 - sL s4 MM I1 + H1 - pL p s2 MM I1 + H1 - s3 MM IH1 - pL2 p2 1 I1 + IH1 - sL IH1 - pL2 1-s s4 MM pL2 p2 1 p s4 MM H1-pL3 p s4 1 1-s H1-pL p3 s4 1 I1 + IH1 - sL I1 + H1 - pL p2 IH1 - pL2 p2 s4 MM 1 I1 + IH1 - sL s3 MM I1 + H1 - pL p s2 MM IH1 - pL2 p2 s4 MM 1 I1 + IH1 - sL I1 + H1 - IH1 - pL3 p 1 1-s 1 I1 + IH1 - sL I1 + H1 - IH1 - pL2 p s4 MM H1-pL2 p2 s4 pL3 1+ NNNN p3 s3 MM p2 p 1 1-s pL2 p s4 MM s3 MM s3 MM H1-pL3 p s4 1 I1 + IH1 - sL I1 + H1 - pL s + H1 - pL2 s2 + H1 - pL3 s3 MM HH1 - pL4 s4 LM 30 734 16 144 18 210 16 144 18 210 20 276 18 210 16 144 16 144 18 210 20 276 18 210 16 144 18 210 16 144 30 734 + 1-s H1-pL2 p2 s4 1 I1 + IH1 - sL 1+ NNRN s4 LM 1 1+ NRNN s2 IH1 - pL p3 s4 MM NRRR NRNR Hp4 p2 I1 + H1 - pL p2 s3 MM 1+ NRRN 1-s H1-pL p3 s4 1 I1 + IH1 - sL 1+ RNRR s3 MM 1 RRRN RRNR Lunghezza media Varianza Lunghezza 7 8 Ricorsione e gettoni di due colori - Prima parte.nb Caratteristiche per sequenze finali di dimensioni 5 Seq. Terminale RRRRR PGF 1 I1 + IH1 - sL I1 + p s + p3 s3 Hp5 s5 LM RRRRN 1+ RRRNR 1 I1 + RNNRN 1-s s5 LM s4 MM p3 p2 s4 MM s3 1-s 1 I1 + IH1 - sL I1 + H1 - pL2 p2 s4 MM IH1 - pL2 p3 s5 MM 1 1-s 1 I1 + IH1 - sL I1 + H1 - pL HH1 - pL p4 1 I1 + IH1 - sL 1 s5 LM I1 + H1 - pL IH1 - pL2 p3 p3 p2 s5 MM s4 MM s3 MM I1 + IH1 - sL I1 + H1 - pL p H1 - pL2 p2 s4 MM s2 1 1-s H1-pL3 p2 s5 1 I1 + IH1 - sL I1 + H1 - pL2 p2 s4 MM 1 I1 + IH1 - sL I1 + H1 - IH1 - pL3 pL2 p2 p s5 MM s3 MM 32 736 34 866 32 736 38 1142 32 736 34 866 32 736 34 866 36 996 42 1434 32 736 34 866 36 996 + IH1 - pL2 p3 s5 MM IH1 - pL2 p3 s5 MM 3390 + H1-pL2 p3 s5 H1-pL3 p2 s5 62 + H1-pL2 p3 s5 1 1+ RNNRR 1 H1 - pL 1+ RNRNN p4 p3 HH1 - pL p4 s5 LM RRNNN RNRNR s2 1-s IH1 - sL I1 + H1 - pL 1+ RNRRN 1 p2 s4 MM H1-pL p4 s5 HH1 - pL RRNRN RNRRR p4 I1 + H1 - pL 1+ RRNNR + 1 I1 + IH1 - sL RRRNN RRNRR Lunghezza media Varianza Lunghezza Ricorsione e gettoni di due colori - Prima parte.nb RNNNR 1 I1 + IH1 - sL I1 + H1 - pL3 p s4 MM IH1 - pL3 p2 s5 MM 1 RNNNN 1+ 1 NRRRR 1+ NRRRN NRRNR NRRNN NRNNR NRNNN NNRRR I1 + H1 - pL IH1 - pL2 NNRNR IH1 - pL2 NNNRR 1 I1 + IH1 - sL I1 + H1 - IH1 - 1 pL3 NNNNR p2 s5 MM pL2 p2 s5 MM p2 1 1+ 1-s s4 MM s3 MM s4 MM H1-pL2 p3 s5 I1 + IH1 - sL I1 + H1 - pL p s2 + H1 - pL2 p2 s4 MM IH1 - pL3 p2 s5 MM 1 I1 + IH1 - sL I1 + H1 - IH1 - pL3 I1 + H1 - HH1 - pL2 p2 1 I1 + IH1 - sL pL4 p 1 1-s p s5 MM pL3 p s5 LM H1-pL2 p3 s5 1 I1 + IH1 - sL I1 + H1 - pL2 p2 IH1 - pL3 p2 s5 MM 1 1 I1 + s3 MM s4 MM s4 MM 1-s H1-pL3 p2 s5 IH1 - sL I1 + H1 - pL2 p s3 + 866 32 736 32 736 34 866 36 996 34 866 32 736 42 1434 36 996 34 866 32 736 34 866 32 736 38 1142 32 736 34 866 32 736 H1 - pL3 p s4 MM HH1 - pL4 p s5 LM 1 1+ NNNRN p3 p3 s5 MM I1 + H1 - pL 1+ NNRNN p3 1 I1 + IH1 - sL 1+ NNRRN 1-s H1-pL p4 s5 1 I1 + IH1 - sL NRNRR NRNRN 1-s H1-pL4 p s5 34 1-s H1-pL3 p2 s5 1 I1 + IH1 - sL I1 + H1 - HH1 - pL4 1+ p 1 1-s pL3 p s5 LM H1-pL4 p s5 s4 MM 9 10 Ricorsione e gettoni di due colori - Prima parte.nb NNNNN 1 I1 + IH1 - sL I1 + H1 - pL s + H1 - pL2 s2 + H1 - pL3 s3 + H1 - pL4 s4 MM HH1 - pL5 s5 LM 62 3390