Distribució multinomial
Plantilla:Distribució de probabilitat
En probabilitat i estadística la distribució multinomial és una extensió de la distribució binomial quan en un experiment aleatori hi ha més de dos resultats possibles. Concretament, fem repeticions d'un experiment que té resultats diferents possibles i comptem el nombre de vegades que es produeix cadascun dels resultats possibles. Entre les nombroses aplicacions d'aquesta distribució en Estadística destaca el test de Pearson de la .
Definició
Considerem un experiment aleatori que pot tenir resultats diferents, que designarem per , mútuament excloents, amb probabilitats respectives tals que . Fem repeticions independents i denotem per el nombre de vegades que obtenim el resultat , per el nombre de vegades que obtenim el resultat , i així successivament. Aleshores la probabilitat d'obtenir vegades el resultat , vegades el resultat , etc., amb , ésCal recordar que a l'expressió de l'esquerra, les comes indiquen interseccions, així,Es diu que el vector segueix una distribució multinomialPlantilla:SfnPlantilla:Sfn de paràmetres , i s'escriu . Cal notar que cada component té una distribució binomial de paràmetres i , . De fet, una distribució multinomial és una extensió de la distribució binomial quan hi ha més de dos resultats possibles.
Exemple. Tenim una urna amb 4 boles blanques, 3 vermelles i 3 grogues. Traiem boles amb reemplaçament, és a dir, traiem una bola, anotem el color, la retornem a l'urna, en traiem una altra, la retornem, i així successivament fins que hem tret quatre boles. Designem per:
- : nombre de boles blanques que traiem.
- : nombre de boles vermelles que traiem.
- : el nombre de boles grogues que traiem.
Tenim que , i . Llavors, la probabilitat de treure 1 bola blanca, 1 vermella i 2 grogues ésCoeficients multinomials. Recordem ques'anomena coeficient multinomial.[1] Aquest coeficient intervé en generalització de la fórmula del binomi de Newton quan hi ha més de dos sumands:on la suma es fa sobre totes les -ples tals que . La fórmula (*) intervé a l'estudi de moltes propietats d'aquesta distribució.
Comentari sobre la nomenclatura. Atès que i que els paràmetres són redundants, ja que , alguns autors, per exemple Wilks,[2] proposen una notació alternativa: diuen que un vector segueix una distribució multinomial de paràmetres , on , si la funció de probabilitat éson . Seber,[3] quan , diu que és la forma singular de la distribució multinomial, mentre que si és la formulació no singular. La notació que utilitzem en aquest article és la més habitual, però és recomanable comprovar quina definició de distribució multinomial s'està utilitzant.
Propietats
Esperança, variància i covariància
L'esperança de cada component ésLa variància ésAmbdues propietats es dedueixen del fet que té una distribució binomial .
Per a , la covariància és (vegeu la demostració després de la funció característica)D'aquí resulta que el coeficient de correlació entre i ésque és independent de .
La matriu de variàncies-covariàncies és , onque té rang .
Escriptura compacta de la matriu
La matriu es pot escriure de la següent forma:on (en aquest article escriurem tots els vectors en fila), és una matriu diagonal amb els elements , i per una matriu (o vector) , denotarem per la seva transposada.Plantilla:Caixa desplegable
Funció característica i funció generatriu de moments
La funció característica del vector ésLa funció generatriu de moments ésLa funció generatriu de probabilitats ésPlantilla:Caixa desplegable
Caràcter reproductiu
Siguin i independents. Aleshores . Es diu que la distribució multinomial és reproductiva respecte de .[2] També s'escriuon designa la convolució de probabilitats.Plantilla:Caixa desplegable
Comportament asimptòtic
La distribució multinomial és asimptòticament normal
Com a conseqüència del teorema central del límit multidimensional, si considerem una successió , , aleshoreson , és la matriu que hem introduït abans i és una distribució normal multidimensional centrada amb matriu de variàncies covariàncies . Normalment, aquesta propietat s'escriu en components suprimint el subíndex de les variables :Plantilla:Caixa desplegable
La distribució χ² entra en escena
Tenim la convergència:on és una distribució -quadrat amb graus de llibertat. Aquest resultat és molt important ja que en ell es basa el test de la de Pearson i va ser demostrar per Pearson l'any 1900.[4][5]Plantilla:Caixa desplegable
Relació amb la distribució de Poisson
Siguin variables independents, amb distribucions de Poisson . Aleshores la distribució de condicionada a és una distribució multinomial on Plantilla:Sfn.
Vegeu també
Referències
Bibliografia
Plantilla:Distribucions de probabilitat Plantilla:Autoritat
- ↑ Plantilla:Ref-llibre
- ↑ 2,0 2,1 Plantilla:Ref-llibre
- ↑ Plantilla:Ref-llibre
- ↑ Plantilla:Ref-publicació
- ↑ Vegeu l'interessant treball de W. G. Cochran on explica de forma molt clara l'article de Pearson: Plantilla:Ref-publicació