Distribució multinomial

De testwiki
Salta a la navegació Salta a la cerca

Plantilla:Distribució de probabilitat

En probabilitat i estadística la distribució multinomial és una extensió de la distribució binomial quan en un experiment aleatori hi ha més de dos resultats possibles. Concretament, fem n repeticions d'un experiment que té k resultats diferents possibles i comptem el nombre de vegades que es produeix cadascun dels resultats possibles. Entre les nombroses aplicacions d'aquesta distribució en Estadística destaca el test de Pearson de la χ2.

Definició

Considerem un experiment aleatori que pot tenir k resultats diferents, que designarem per R1,,Rk, mútuament excloents, amb probabilitats respectives p1,,pk(0,1) tals que p1++pk=1. Fem n repeticions independents i denotem per X1 el nombre de vegades que obtenim el resultat R1, per X2 el nombre de vegades que obtenim el resultat R2, i així successivament. Aleshores la probabilitat d'obtenir x1 vegades el resultat R1, x2 vegades el resultat R2, etc., amb x1++xk=n, ésP(X1=x1,,Xk=xk)=n!x1!xk!p1x1pkxk.Cal recordar que a l'expressió de l'esquerra, les comes indiquen interseccions, així,P(X1=x1,,Xk=xk)=P({X1=x1}{Xk=xk}).Es diu que el vector 𝑿=(X1,,Xk) segueix una distribució multinomialPlantilla:SfnPlantilla:Sfn de paràmetres n,p1,,pk, i s'escriu 𝑿(n;p1,,pk). Cal notar que cada component Xi té una distribució binomial de paràmetres n i pi, XiB(n,pi). De fet, una distribució multinomial és una extensió de la distribució binomial quan hi ha més de dos resultats possibles.

Exemple. Tenim una urna amb 4 boles blanques, 3 vermelles i 3 grogues. Traiem n=4 boles amb reemplaçament, és a dir, traiem una bola, anotem el color, la retornem a l'urna, en traiem una altra, la retornem, i així successivament fins que hem tret quatre boles. Designem per:

X1: nombre de boles blanques que traiem.
X2: nombre de boles vermelles que traiem.
X3: el nombre de boles grogues que traiem.

Tenim que p1=04, p2=03 i p3=03. Llavors, la probabilitat de treure 1 bola blanca, 1 vermella i 2 grogues ésP(X1=1,X2=1,X3=2)=(4!1!1!2!)041031032=01296.Coeficients multinomials. Recordem que(nx,,xk)=n!x1!xk!s'anomena coeficient multinomial.[1] Aquest coeficient intervé en generalització de la fórmula del binomi de Newton quan hi ha més de dos sumands:(a1+a2++ak)n=(nx1,,xk)a1x1akxk,(*)on la suma es fa sobre totes les k-ples (x1,,xk){0,1,,n}k tals que x1++xk=n. La fórmula (*) intervé a l'estudi de moltes propietats d'aquesta distribució.

Comentari sobre la nomenclatura. Atès que X1++Xk=n i que els paràmetres són redundants, ja que p1++pk=1, alguns autors, per exemple Wilks,[2] proposen una notació alternativa: diuen que un vector (X1,,Xk) segueix una distribució multinomial de paràmetres n,p1,,pk, on p1,,pk(0,1), amb p1++pk<1, si la funció de probabilitat ésP(X1=x1,,Xk=xk)=n!x1!xk!(ni=1kxi)!p1x1pkxk(1i=1kpi)ni=1kxi,on i=1kxin. Seber,[3] quan i=1kpi=1, diu que és la forma singular de la distribució multinomial, mentre que si i=1kpi<1 és la formulació no singular. La notació que utilitzem en aquest article és la més habitual, però és recomanable comprovar quina definició de distribució multinomial s'està utilitzant.

Propietats

Esperança, variància i covariància

L'esperança de cada component ésE[Xj]=npj, j=1,,k.La variància ésVar(Xj)=npj(1pj), j=1,,k.Ambdues propietats es dedueixen del fet que Xj té una distribució binomial B(n,pj).

Per a ij, la covariància és (vegeu la demostració després de la funció característica)Cov(Xi,Xj)=npipj.D'aquí resulta que el coeficient de correlació entre Xi i Xj ésρ(Xi,Xj)=Cov(Xi,Xj)Var(Xi)Var(Xj)=pipj(1pi)(1pj),que és independent de n.

La matriu de variàncies-covariàncies és nΣ, onΣ=(p1(1p1)p1p2p1pkp1p2p2(1p2)p2pkp1pkp2pkpk(1pk))que té rang k1.

Escriptura compacta de la matriu Σ

La matriu Σ es pot escriure de la següent forma:Σ=Diag (𝒑)𝒑𝒑,on 𝒑=(p1,,pk) (en aquest article escriurem tots els vectors en fila), Diag (𝒑) és una matriu diagonal amb els elements p1,,pk, i per una matriu (o vector) 𝑩, denotarem per 𝑩 la seva transposada.Plantilla:Caixa desplegable

Funció característica i funció generatriu de moments

La funció característica del vector 𝑿=(X1,,Xk) ésφ(t1,,tk)=E[ei(t1X1++tkXk)]=(p1eit1++pkeitk)n, t1,,tk.La funció generatriu de moments ésL(t1,,tk)==E[et1X1++tkXk]=(p1et1++pketk)n, t1,,tk.La funció generatriu de probabilitats ésG(z1,,zk)=E[z1eX1zkXk]=(p1z1++pkzk), z1,,zk.Plantilla:Caixa desplegable


Plantilla:Caixa desplegable

Caràcter reproductiu

Siguin 𝑿=(X1,,Xd)M(n;p1,,pd) i 𝒀=(Y1,,Yd)M(m;p1,,pd) independents. Aleshores 𝑿+𝒀M(n+m;p1,,pk). Es diu que la distribució multinomial és reproductiva respecte de n.[2] També s'escriuM(n;p1,,pk)*M(m;p1,,pk)=M(n+m;p1,,pk),on * designa la convolució de probabilitats.Plantilla:Caixa desplegable

Comportament asimptòtic

La distribució multinomial és asimptòticament normal

Com a conseqüència del teorema central del límit multidimensional, si considerem una successió 𝑿n=(Xn1,,Xnk)(n;p1,,pk), n1, aleshores1n(𝑿nn𝒑)\limits n𝒟𝒩(0,Σ),on 𝒑=(p1,,pk), Σ és la matriu que hem introduït abans i 𝒩(0,Σ) és una distribució normal multidimensional centrada amb matriu de variàncies covariàncies Σ. Normalment, aquesta propietat s'escriu en components suprimint el subíndex n de les variables Xn1,,Xnk:1n(X1np1,,Xknpk)\limits n𝒟𝒩(0,Σ).(**)Plantilla:Caixa desplegable

La distribució χ² entra en escena

Tenim la convergència:i=1k(Xinpi)2npi\limits n𝒟χ2(k1),on χ2(k1) és una distribució χ2-quadrat amb k1 graus de llibertat. Aquest resultat és molt important ja que en ell es basa el test de la χ2de Pearson i va ser demostrar per Pearson l'any 1900.[4][5]Plantilla:Caixa desplegable

Relació amb la distribució de Poisson

Siguin Y1,,Yk variables independents, amb distribucions de Poisson Y1Pois(λ1),,YkPois(λk). Aleshores la distribució de (Y1,,Yk) condicionada a Y1++Yk=n és una distribució multinomial (n,λ1/λ*,,λk/λ*) on λ*=i=1kλiPlantilla:Sfn.

Vegeu també

Prova de la χ2 de Pearson

Referències

Plantilla:Referències

Bibliografia

Plantilla:Distribucions de probabilitat Plantilla:Autoritat

  1. Plantilla:Ref-llibre
  2. 2,0 2,1 Plantilla:Ref-llibre
  3. Plantilla:Ref-llibre
  4. Plantilla:Ref-publicació
  5. Vegeu l'interessant treball de W. G. Cochran on explica de forma molt clara l'article de Pearson: Plantilla:Ref-publicació