Todennäköisyydet generoiva funktio

Todennäköisyydet generoiva funktio (lyhennetään joskus tgf) on todennäköisyyslaskennassa ja tilastotieteessä satunnaismuuttujan todennäköisyysjakaumasta määritelty funktio, jonka avulla voidaan laskea jakauman todennäköisyyksiä ja tekijämomentteja.[1]

Todennäköisyydet generoiva funktio voidaan määritellä sekä diskreeteille- että jatkuville satunnaismuuttujille. Se on kuitenkin käytännöllisempi diskreeteille satunnaismuuttujille, jonka tuloksia esitellään tässä.

Määritelmä

Todennäköisyydet generoiva funktio on odotusarvo

G ( t ) = E ( t X ) . {\displaystyle G(t)=E(t^{X}).} [2]

Diskreetti satunnaismuuttuja

Diskreetille satunnaismuuttujalle generoiva funktio on potenssisarja

G ( t ) = i = 0 f ( x i ) t x i , {\displaystyle G(t)=\sum _{i=0}^{\infty }f(x_{i})t^{x_{i}},}

jonka eri asteisten potenssien kertoimet ovat pistetodennäköisyysfunktion arvoja eri satunnaismuuttujan X {\displaystyle X} arvoille x i {\displaystyle x_{i}} . Muuttuja t {\displaystyle t} on usein reaaliluku, mutta se voi olla myös kompleksiluku, sillä kaikki tarvittavat matemaattiset ominaisuudet periytyvät myös sille. Laittamalla muuttujan t {\displaystyle t} arvoksi nolla, voidaan funktion derivaatoista poimia esille todennäköisyydet ja arvolla yksi, laskea niistä erilaisia summia.

Potenssisarja suppenee yleisesti reaaliluvuilla vain, jos 1 < t < 1 {\displaystyle -1<t<1} . Siten arvo t = 0 {\displaystyle t=0} on sallittu arvo. Sen sijaan arvo t = 1 {\displaystyle t=1} ei välttämättä käy, sillä sarja ei silloin suppene yleisessä tapauksessa. Potenssisarjalla saattaa kuitenkin olla olemassa sarjan raja-arvo, kun ykköstä lähestytään vasemmalta päin. Jos näin on, niin raja-arvoa voidaan ilmaista miinus-merkillä

lim t 1 G ( t ) = G ( 1 ) . {\displaystyle \lim _{t\to 1-}G(t)=G(1-).}

Todennäköisyyslaskennassa alueen voi laajentaa 1 t 1 {\displaystyle -1\leq t\leq 1} , sillä summassa olevien todennäköisyyksien summa on aina yksi. Monissa teksteissä G ( 1 ) {\displaystyle G(1-)} merkitään siksi G ( 1 ) {\displaystyle G(1)} . Merkintää sovelletaan tässä myös derivaatoille.

Jatkuva satunnaismuuttuja

Jatkuvalle satunnaismuuttujalle generoiva funktio määritetään

G ( t ) = + t x f X ( x ) d x . {\displaystyle G(t)=\int _{-\infty }^{+\infty }t^{x}f_{X}(x)\,dx.} [3]

Ominaisuuksia

Funktion arvo: G(0)

Yleisessä tapauksessa, missä X = { x 0 , x 1 , x 2 , } {\displaystyle X=\{x_{0},x_{1},x_{2},\dots \}} , saadaan

G ( 0 ) = i = 0 f ( x i ) 0 x i = 0. {\displaystyle G(0)=\sum _{i=0}^{\infty }f(x_{i})\cdot 0^{x_{i}}=0.} [4]

Erityistapauksessa, jossa Y = { i | i = 0 , 1 , 2 , 3 } = { 0 , 1 , 2 , 3 , } {\displaystyle Y=\{i|i=0,1,2,3\dots \}=\{0,1,2,3,\dots \}} ja niiden todennäköisyydet vastaavasti f ( x i ) = f i = p i = P ( X = i ) {\displaystyle f(x_{i})=f_{i}=p_{i}=P(X=i)} , tulee generoivasta funktiosta

G ( t ) = i = 0 p i t y i = p 0 t 0 + p 1 t 1 + p 2 t 2 + , {\displaystyle G(t)=\sum _{i=0}^{\infty }p_{i}\cdot t^{y_{i}}=p_{0}t^{0}+p_{1}t^{1}+p_{2}t^{2}+\dots ,} [2]

josta saadaan

G ( 0 ) = i = 0 p i 0 y i = p 0 , {\displaystyle G(0)=\sum _{i=0}^{\infty }p_{i}\cdot 0^{y_{i}}=p_{0},} [4]

kunhan lim t 0 p 0 t y 0 = lim t 0 p 0 t 0 = p 0 . {\displaystyle \lim _{t\to 0}p_{0}\cdot t^{y_{0}}=\lim _{t\to 0}p_{0}\cdot t^{0}=p_{0}.} [4]

Funktion arvo: G(1-)

Yleisessä tapauksessa, missä X = { x 0 , x 1 , x 2 , } {\displaystyle X=\{x_{0},x_{1},x_{2},\dots \}} , saadaan

G ( 1 ) = lim t 1 G ( t ) = lim t 1 ( i = 0 f ( x i ) t x i ) = i = 0 f ( x i ) 1 x i = i = 0 f ( x i ) = 1 , {\displaystyle G(1-)=\lim _{t\to 1-}G(t)=\lim _{t\to 1-}\left(\sum _{i=0}^{\infty }f(x_{i})\cdot t^{x_{i}}\right)=\sum _{i=0}^{\infty }f(x_{i})\cdot 1^{x_{i}}=\sum _{i=0}^{\infty }f(x_{i})=1,}

sillä satunnaismuuttujan kaikkien arvojen todennäköisyyksien summa on aina yksi.[4]

Riippumattomat satunnaismuuttujat

Jos muodostetaan uusi satunnaismuuttuja Y {\displaystyle Y} kahdesta riippumattomasta satunnaismuuttujasta X 1 {\displaystyle X_{1}} ja X 2 {\displaystyle X_{2}} merkitsemällä Y = X 1 + X 2 {\displaystyle Y=X_{1}+X_{2}} , voidaan uusi generoiva funktio muodostaa vanhojen avulla

G Y ( t ) = G X 1 ( t ) G X 2 ( t ) . {\displaystyle G_{Y}(t)=G_{X_{1}}(t)G_{X_{2}}(t).} [2]

Momentit generoiva funktio

Satunnaismuuttujan momentit generoiva funktio on odotusarvo

M ( t ) = E [ e t X ] . {\displaystyle M(t)=E[e^{tX}].} [2]

Momenttifunktio voidaan kirjoittaa todennäköisyydet generoivan funktion avulla

M ( t ) = G ( e t ) . {\displaystyle M(t)=G(e^{t}).} [2]

Tekijämomentit

Sarjan derivointi suoritetaan jokaiselle sarjan termille yksittäin seuraavasti: [4]

G ( t ) = E ( t X ) = i = 1 f ( x i ) t x i {\displaystyle G(t)=E(t^{X})=\sum _{i=1}^{\infty }f(x_{i})t^{x_{i}}}
G ( t ) = D ( i = 1 f ( x i ) t x i ) = x 1 f ( x 1 ) t x 1 1 + x 2 f ( x 2 ) t x 2 1 + x 3 f ( x 3 ) t x 3 1 + {\displaystyle G'(t)=D\left(\sum _{i=1}^{\infty }f(x_{i})t^{x_{i}}\right)=x_{1}f(x_{1})t^{x_{1}-1}+x_{2}f(x_{2})t^{x_{2}-1}+x_{3}f(x_{3})t^{x_{3}-1}+\dots }
G ( t ) = D 2 ( i = 1 f ( x i ) t x i ) = x 1 ( x 1 1 ) f ( x 1 ) t x 1 2 + x 2 ( x 2 1 ) f ( x 2 ) t x 2 2 + x 3 ( x 3 1 ) f ( x 3 ) t x 3 2 + {\displaystyle G''(t)=D^{2}\left(\sum _{i=1}^{\infty }f(x_{i})t^{x_{i}}\right)=x_{1}(x_{1}-1)f(x_{1})t^{x_{1}-2}+x_{2}(x_{2}-1)f(x_{2})t^{x_{2}-2}+x_{3}(x_{3}-1)f(x_{3})t^{x_{3}-2}+\dots }

Ensimmäisen derivoinnin tulokset voidaan kirjoittaa

G ( t ) = i = 1 x i f ( x i ) t x i 1 {\displaystyle G'(t)=\sum _{i=1}^{\infty }x_{i}f(x_{i})t^{x_{i}-1}}

ja sen arvo ykkösessä antaa

G ( 1 ) = lim t 1 G ( t ) = i = 1 x i f ( x i ) 1 x i 1 = i = 1 x i f ( x i ) = E [ X ] {\displaystyle G'(1-)=\lim _{t\to 1-}G(t)=\sum _{i=1}^{\infty }x_{i}f(x_{i})1^{x_{i}-1}=\sum _{i=1}^{\infty }x_{i}f(x_{i})=E[X]} [2]

eli tuloksena on satunnaismuuttujan odotusarvo. Toisen derivoinnin tulokset voidaan kirjoittaa

G ( t ) = G ( 2 ) ( t ) = i = 1 x i ( x i 1 ) f ( x i ) t x i 2 {\displaystyle G''(t)=G^{(2)}(t)=\sum _{i=1}^{\infty }x_{i}(x_{i}-1)f(x_{i})t^{x_{i}-2}}

ja sen arvo ykkösessä on

G ( 1 ) = lim t 1 G ( 2 ) ( t ) = lim t 1 ( i = 1 x i ( x i 1 ) f ( x i ) t x i 2 ) {\displaystyle G''(1-)=\lim _{t\to 1-}G^{(2)}(t)=\lim _{t\to 1-}\left(\sum _{i=1}^{\infty }x_{i}(x_{i}-1)f(x_{i})t^{x_{i}-2}\right)}
= i = 1 x i ( x i 1 ) f ( x i ) 1 x i 2 = i = 1 x i ( x i 1 ) f ( x i ) = E [ X ( X 1 ) ] {\displaystyle =\sum _{i=1}^{\infty }x_{i}(x_{i}-1)f(x_{i})1^{x_{i}-2}=\sum _{i=1}^{\infty }x_{i}(x_{i}-1)f(x_{i})=E[X(X-1)]}

eli satunnaismuuttujan toinen tekijämomentti. Odotusarvo voidaan tulkita siten ensimmäiseksi tekijämomentiksi. Yleisesti, kun on otettu r:s derivaatta, saadaan

G ( r ) ( 1 ) = E [ X ( r ) ] = E [ X ( X 1 ) ( X 2 ) ( X r + 1 ) ] {\displaystyle G^{(r)}(1)=E[X^{(r)}]=E[X(X-1)(X-2)\dots (X-r+1)]} [4][2]

eli r:s tekijämomentti.

Todennäköisyysarvot

Erityistapauksessa, jossa Y = { 0 , 1 , 2 , 3 , } {\displaystyle Y=\{0,1,2,3,\dots \}} ja niiden todennäköisyydet vastaavasti f ( x i ) = p i = P ( Y = i ) {\displaystyle f(x_{i})=p_{i}=P(Y=i)} , saadaan derivaatoista määritetty pistetodennäköisyydet p i {\displaystyle p_{i}} . Generoiva funktio on nyt

G ( t ) = i = 0 p i t y i = p 0 t 0 + p 1 t 1 + p 2 t 2 + {\displaystyle G(t)=\sum _{i=0}^{\infty }p_{i}\cdot t^{y_{i}}=p_{0}t^{0}+p_{1}t^{1}+p_{2}t^{2}+\dots } [2]

ja sen ensimmäinen derivaatta on

G ( t ) = i = 1 y i p i t y i 1 = 0 p 0 t 1 + 1 p 1 t 0 + 2 p 2 t 1 + 3 p 3 t 2 = p 1 t 0 + 2 p 2 t 1 + 3 p 3 t 2 + . {\displaystyle G'(t)=\sum _{i=1}^{\infty }y_{i}p_{i}t^{y_{i}-1}=0\cdot p_{0}t^{-1}+1\cdot p_{1}t^{0}+2p_{2}t^{1}+3p_{3}t^{2}\dots =p_{1}t^{0}+2p_{2}t^{1}+3p_{3}t^{2}+\dots .}

Sijoittamalla siihen t = 0 {\displaystyle t=0} saadaan

G ( 0 ) = p 1 0 0 + 2 p 2 0 1 + 3 p 3 0 2 + = p 1 , {\displaystyle G'(0)=p_{1}0^{0}+2p_{2}0^{1}+3p_{3}0^{2}+\dots =p_{1},}

kun tilanteessa " 0 0 {\displaystyle 0^{0}} " huomataan lim t 0 t 0 = 1. {\displaystyle \lim _{t\to 0}t^{0}=1.} Toinen derivaatta antaa

G ( t ) = i = 1 y i ( y i 1 ) p i t y i 2 = 1 0 p 1 t 1 + 2 1 p 2 t 0 + 3 2 p 3 t 1 + 4 3 p 4 t 3 + = 2 p 2 t 0 + 6 p 3 t 1 + 12 p 4 t 2 + {\displaystyle G''(t)=\sum _{i=1}^{\infty }y_{i}({y_{i}-1})p_{i}t^{y_{i}-2}=1\cdot 0\cdot p_{1}t^{-1}+2\cdot 1p_{2}t^{0}+3\cdot 2p_{3}t^{1}+4\cdot 3p_{4}t^{3}+\dots =2p_{2}t^{0}+6p_{3}t^{1}+12p_{4}t^{2}+\dots }

ja sijoittamalla taas t = 0 {\displaystyle t=0} saadaan

G ( 0 ) = 2 p 2 0 0 + 6 p 3 0 1 + 12 p 4 0 2 + = 2 p 2 . {\displaystyle G''(0)=2p_{2}0^{0}+6p_{3}0^{1}+12p_{4}0^{2}+\dots =2p_{2}.}

Pienellä päättelyllä saadaan todennäköisyydet laskettua

p k = G ( k ) ( 0 ) k ! . {\displaystyle p_{k}={\frac {G^{(k)}(0)}{k!}}.} [2]

Tästä lausekkeesta voidaan ymmärtää funktion nimi: todennäköisyydet generoiva funktio.

Esimerkki: noppa

Noppapeleissä käytetään arpakuutiota, jolla arvotaan kuusi lukua 1−6 ja jonka eri lukujen todennäköisyydet ovat yhtä todennäköisiä (eli noppa antaa luvun i {\displaystyle i} todennäköisyydellä P ( X = i ) = 1 6 {\displaystyle P(X=i)={\tfrac {1}{6}}} . Muodostetaan todennäköisyydet generoiva funktio

G ( t ) = i = 1 f ( x i ) t x i = P ( X = 1 ) t 1 + P ( X = 2 ) t 2 + P ( X = 3 ) t 3 + P ( X = 4 ) t 4 + , {\displaystyle G(t)=\sum _{i=1}^{\infty }f(x_{i})t^{x_{i}}=P(X=1)t^{1}+P(X=2)t^{2}+P(X=3)t^{3}+P(X=4)t^{4}+\dots ,}

jolla on ominaisuus

G ( 1 ) = 1 6 1 1 + 1 6 1 2 + 1 6 1 3 + 1 6 1 4 + = 1 6 + 1 6 + 1 6 + 1 6 + 1 6 + 1 6 + 0 + 0 + = 1 {\displaystyle G(1)={\tfrac {1}{6}}\cdot 1^{1}+{\tfrac {1}{6}}\cdot 1^{2}+{\tfrac {1}{6}}\cdot 1^{3}+{\tfrac {1}{6}}\cdot 1^{4}+\dots ={\tfrac {1}{6}}+{\tfrac {1}{6}}+{\tfrac {1}{6}}+{\tfrac {1}{6}}+{\tfrac {1}{6}}+{\tfrac {1}{6}}+0+0+\dots =1}

eli todennäköisyyksien summa on yksi.[5]

Koska todennäköisyydet ovat samat ja muualla nolla, on sarja itse asiassa summa:

G ( t ) = 1 6 t 1 + 1 6 t 2 + 1 6 t 3 + 1 6 t 4 + 1 6 t 5 + 1 6 t 6 {\displaystyle G(t)={\tfrac {1}{6}}t^{1}+{\tfrac {1}{6}}t^{2}+{\tfrac {1}{6}}t^{3}+{\tfrac {1}{6}}t^{4}+{\tfrac {1}{6}}t^{5}+{\tfrac {1}{6}}t^{6}}
= 1 6 ( t 1 + t 2 + t 3 + t 4 + t 5 + t 6 ) . {\displaystyle ={\tfrac {1}{6}}\left(t^{1}+t^{2}+t^{3}+t^{4}+t^{5}+t^{6}\right).}

Tekijämomentit ja varianssi

Derivaatta kohdassa yksi on

G ( t ) = 1 P ( X = 1 ) + 2 P ( X = 2 ) t 1 + 3 P ( X = 3 ) t 2 + 4 P ( X = 4 ) t 3 + {\displaystyle G'(t)=1\cdot P(X=1)+2P(X=2)t^{1}+3P(X=3)t^{2}+4P(X=4)t^{3}+\dots } [5]

ja

G ( 1 ) = 1 P ( X = 1 ) + 2 P ( X = 2 ) + 3 P ( X = 3 ) + 4 P ( X = 4 ) + {\displaystyle G'(1)=1\cdot P(X=1)+2P(X=2)+3P(X=3)+4P(X=4)+\dots }
= 1 1 6 + 2 1 6 + 3 1 6 + 4 1 6 + 5 1 6 + 6 1 6 + 0 + 0 + = 7 2 = E [ X ] . {\displaystyle =1\cdot {\tfrac {1}{6}}+2\cdot {\tfrac {1}{6}}+3\cdot {\tfrac {1}{6}}+4\cdot {\tfrac {1}{6}}+5\cdot {\tfrac {1}{6}}+6\cdot {\tfrac {1}{6}}+0+0+\dots ={\tfrac {7}{2}}=E[X].} [5] (odotusarvo)

Toinen derivaatta kohdassa yksi on

G ( t ) = 2 1 P ( X = 2 ) t 0 + 3 2 P ( X = 3 ) t 1 + 4 3 P ( X = 4 ) t 2 + {\displaystyle G''(t)=2\cdot 1P(X=2)t^{0}+3\cdot 2P(X=3)t^{1}+4\cdot 3P(X=4)t^{2}+\dots } [5]

ja

G ( 1 ) = 2 1 1 6 + 3 2 1 6 + 4 3 1 6 + = 35 3 = E [ X ( X 1 ) ] . {\displaystyle G''(1)=2\cdot 1\cdot {\tfrac {1}{6}}+3\cdot 2\cdot {\tfrac {1}{6}}+4\cdot 3\cdot {\tfrac {1}{6}}+\dots ={\tfrac {35}{3}}=E[X(X-1)].} [5] (ensimmäinen tekijämomentti)

Huomaa, miten saadaan varianssi näistä kahdesta tuloksesta

G ( 1 ) + G ( 1 ) ( G ( 1 ) ) 2 = 35 3 + 7 2 ( 7 2 ) 2 = 35 12 = V a r ( X ) . {\displaystyle G''(1)+G'(1)-(G'(1))^{2}={\tfrac {35}{3}}+{\tfrac {7}{2}}-\left({\tfrac {7}{2}}\right)^{2}={\tfrac {35}{12}}=Var(X).} [4][5]

Lähteet

  1. Liski, Erkki: Luku 3 Satunnaismuuttujat, ehdollistaminen ja riippumattomuus, s.91−92, luennosta Matemaattinen tilastotiede, Tampereen yliopisto, 2005
  2. a b c d e f g h i Matematika Intézet: Ch4: Generating functions, Budapesti, Unkari
  3. Esquível, Manuel L.: Probability Generating Functions for Discrete Real Valued Random Variables, 2011, Universidade Nova de Lisboa, Portugali
  4. a b c d e f g Gribakin, Gleb: Ch 3.: Probability Generating Functions, s.39−41, kurssin Probability and Distribution Theory luentomoniste, 2002, Queen’s University, Belfast, Irlanti
  5. a b c d e f King, Frank:Ch 6: Probability Generating Functions, kurssin Probability luentomoniste, 2007-08, University of Cambridge, Englanti

Aiheesta muualla

  • Cut the Knot's: Probability generating functions