Distribució hipergeomètrica negativa

De testwiki
Salta a la navegació Salta a la cerca

Plantilla:Infotaula distribució de probabilitat En la teoria de la probabilitat i l'estadística, la distribució hipergeomètrica negativa descriu probabilitats per al mostreig d'una població finita sense substitució en la qual cada mostra es pot classificar en dues categories mútuament excloents com Aprovat/No o Ocupat/Desocupat. A mesura que es fan seleccions aleatòries a partir de la població, cada sorteig posterior disminueix la població fent que la probabilitat d'èxit canviï amb cada sorteig. A diferència de la distribució hipergeomètrica estàndard, que descriu el nombre d'èxits en una mida de mostra fixa, en la distribució hipergeomètrica negativa, les mostres es treuen fins que r s'han trobat errors i la distribució descriu la probabilitat de trobar-los k èxits en aquesta mostra. En altres paraules, la distribució hipergeomètrica negativa descriu la probabilitat de k èxits en una mostra amb exactament r fracassos.[1]

Definició

N'hi ha N elements, dels quals K es defineixen com a "èxits" i la resta són "fracassos".

Els elements es dibuixen un darrere l'altre, sense substitucions, fins que r es troben fracassos. Aleshores, el dibuix s'atura i el número k d'èxits es comptabilitzen. La distribució hipergeomètrica negativa, NHGN,K,r(k) és la distribució discreta d'aquesta k.[2]

La distribució hipergeomètrica negativa és un cas especial de la distribució binomial beta amb paràmetres α=r i β=NKr+1 tots dos són nombres enters (i n=K).

El resultat requereix que observem k èxits en (k+r1) sorteja i el (k+r)-th bit ha de ser un fracàs. La probabilitat de la primera es pot trobar mitjançant l'aplicació directa de la distribució hipergeomètrica (HGN,K,k+r1(k)) i la probabilitat d'aquest últim és simplement el nombre de fallades restants (=NK(r1)) dividit per la mida de la població restant (=N(k+r1). La probabilitat de tenir exactament k èxits fins al r-th fallada (és a dir, el dibuix s'atura tan bon punt la mostra inclou el nombre predefinit de r fallades) és aleshores el producte d'aquestes dues probabilitats: [3]

(Kk)(NKk+r1k)(Nk+r1)NK(r1)N(k+r1)=(k+r1k)(NrkKk)(NK).

Per tant, una variable aleatòria X segueix la distribució hipergeomètrica negativa si la seva funció de massa de probabilitat (pmf) ve donada per [4]

f(k;N,K,r)Pr(X=k)=(k+r1k)(NrkKk)(NK)for k=0,1,2,,K

on

  • és la mida de la població,
  • és el nombre d'estats d'èxit a la població,
  • és el nombre de fallades,
  • és el nombre d'èxits observats,
  • és un coeficient binomial

Referències

Plantilla:Referències