Distribució conjugada

De testwiki
Salta a la navegació Salta a la cerca

Plantilla:Infotaula distribució de probabilitatEn la teoria de la probabilitat bayesiana, si la distribució posterior p(θx) es troba a la mateixa família de distribució de probabilitat que la distribució de probabilitat anterior p(θ), l'anterior i el posterior s'anomenen distribucions conjugades, i l'anterior s'anomena a priori conjugat per a la funció de versemblança p(xθ).[1]

Un a priori conjugat és una conveniència algebraica, que dona una expressió de forma tancada per a la posterior; en cas contrari, pot ser necessària la integració numèrica. A més, els priors conjugats poden donar intuïció mostrant de manera més transparent com una funció de probabilitat actualitza una distribució prèvia.[2]

El concepte, així com el terme "conjugat anterior", van ser introduïts per Howard Raiffa i Robert Schlaifer en el seu treball sobre la teoria de la decisió bayesiana.[3] Un concepte similar havia estat descobert independentment per George Alfred Barnard.

Exemple

La forma del prior conjugat es pot determinar generalment mitjançant la inspecció de la densitat de probabilitat o la funció de massa de probabilitat d'una distribució. Per exemple, considerem una variable aleatòria que consisteix en el nombre d'èxits s en n Assajos de Bernoulli amb probabilitat d'èxit desconeguda q en [0,1]. Aquesta variable aleatòria seguirà la distribució binomial, amb una funció de massa de probabilitat de la forma

p(s)=(ns)qs(1q)ns

L'a priori conjugat habitual és la distribució beta amb paràmetres (α, β):

p(q)=qα1(1q)β1B(α,β)

on α i β es trien per reflectir qualsevol creença o informació existent (α=1 i β=1 donaria una distribució uniforme) i B(α,β) és la funció Beta que actua com a constant normalitzadora.

En aquest context, α i β s'anomenen hiperparàmetres (paràmetres de l'anterior), per distingir-los dels paràmetres del model subjacent (aquí q). Una característica típica dels priors conjugats és que la dimensionalitat dels hiperparàmetres és un més gran que la dels paràmetres de la distribució original. Si tots els paràmetres són valors escalars, hi haurà un hiperparàmetre més que un paràmetre; però això també s'aplica als paràmetres de valors vectorials i matricials. (Vegeu l'article general sobre la família exponencial, i també considereu la distribució de Wishart, anterior conjugada de la matriu de covariància d'una distribució normal multivariada, per exemple on hi ha una gran dimensionalitat).

Taula de distribucions conjugades

Sigui n el nombre d'observacions. En tots els casos següents, se suposa que les dades consten de n punts x1,,xn (que seran vectors aleatoris en els casos multivariants).

Si la funció de versemblança pertany a la família exponencial, llavors existeix un a priori conjugat, sovint també a la família exponencial; vegeu Família exponencial: distribucions conjugues.

Quan la funció de versemblança és una distribució discreta

Confiança Paràmetres Distribució conjugada Hiperparàmetres anteriors Hiperparàmetres posteriors
Bernoulli p (probabilitat) Beta α,β α+i=1nxi,β+ni=1nxi
Binomial amb nombre conegut d'intents, m p (probabilitat) Beta α,β α+i=1nxi,β+i=1nNii=1nxi
Negative binomial amb nombre conegut de fallides, r p (probabilitat) Beta α,β α+rn,β+i=1nxi
Poisson λ (ràtio) Gamma k,θ k+i=1nxi, θnθ+1
α,β α+i=1nxi, β+n
Categorical p (vector probabilitat), k (nombre de categories) Dirichlet αk α+(c1,,ck), on ci és el nombre d'obserbacions en categoria i
Multinomial p (vector probabilitat), k (nombre de categories) Dirichlet αk α+i=1n𝐱i
Hypergeometric amb mostres totals conegudes, N M (nombre de blancs) Beta-binomial n=N,α,β α+i=1nxi,β+i=1nNii=1nxi
Geometric p0 (probabilitat) Beta α,β α+n,β+i=1nxi

Referències

Plantilla:Referències

  1. Plantilla:Ref-web
  2. Plantilla:Ref-web
  3. Howard Raiffa and Robert Schlaifer. Applied Statistical Decision Theory. Division of Research, Graduate School of Business Administration, Harvard University, 1961.