Distribució de Wishart

De testwiki
Salta a la navegació Salta a la cerca

Plantilla:Infotaula distribució de probabilitat En estadística, la distribució de Wishart és una generalització de la distribució khi quadrat a múltiples dimensions, o en el cas dels graus de llibertat no sencers de la distribució gamma. S'anomena així en honor de John Wishart, qui va formular per primera vegada la distribució l'any 1928.[1]

És una família de distribucions de probabilitat definides sobre matrius simètriques, definides no negatives amb valors de variables aleatòries ("matrius aleatòries"). Aquestes distribucions són de gran importància en l'estimació de matrius de covariància en estadística multivariant.

Definició

Suposem que X és una matriu n × p, de la que cada fila s'obté de forma independent d'una distribució normal p-variada amb mitjana zero:

X(i)=(xi1,,xip)Np(0,V).

La distribució de Wishart és la distribució de probabilitat de la matriu p × p aleatòria S = XT X coneguda com la matriu de dispersió. Hom indica que S té aquesta distribució de probabilitat escrivint:

SWp(V,n).

El nombre enter positiu n és el nombre de graus de llibertat. En certes ocasions això s'escriu com W(V, p, n). Per n ≥ p la matriu S és invertible amb probabilitat 1 si V és invertible.

Si p = V = 1 llavors aquesta distribució és una distribució khi-quadrat amb n graus de llibertat.

Ocurrència

La distribució de Wishart correspon a la distribució de la matriu de covariància d'una mostra de la distribució normal multivariada. Apareix amb freqüència en les proves de la raó de versemblança en l'anàlisi estadística multivariada. També es dona en la teoria espectral de matrius aleatòries i en l'anàlisi bayesiana multidimensional.[2] També apareix en telecomunicacions en l'anàlisi de les característiques de l'esvaniment de Rayleigh en canals MIMO.[3]

Funció densitat de probabilitat

La distribució de Wishart es pot caracteritzar per la seva funció de densitat de probabilitat de la següent manera:

Sigui X una matriu simètrica p × p de variables aleatòries definida positiva.

Sigui V una matriu (fixada) definida positiva de mida p × p.

Llavors, si np, X segueix una distribució de Wishart amb n graus de llibertat si té una funció de densitat de probabilitat donada per:

12np2|𝐕|n2Γp(n2)|𝐗|np12e12tr(𝐕1𝐗)

on |𝐗| és el determinant i Γp (·) és la funció gamma multivariant definida com:

Γp(n2)=πp(p1)4Πj=1pΓ(n2+1j2)

De fet, aquesta definició es pot estendre a qualsevol valor real n > p – 1. Si np – 1 llavors ja no segueix una distribució de Wishart sinó que en lloc seu representa una distribució singular que pren valors en un subespai de dimensió inferior a l'espai de les matrius p × p.[4]

Ús en Estadística Bayesiana

En estadística bayesiana i en el context de la distribució normal multivariable, la distribució de Wishart és el conjugat previ de la matriu de precisió Ω = Σ -1, on Σ és la matriu de covariància.

Selecció dels paràmetres

L'adequada distribució de Wishart prèvia s'obté fixant n = p. La mitjana prèvia de Wp (V, n) és nV, el que suggereix que una opció raonable per a V – 1 seria n Σ0, on Σ0 és una estimació prèvia de la matriu de covariància.

Propietats

Esperança matemàtica del logaritme de X

Considerem la següent expressió:[5]

E[ln|𝐗|]=ψp(n/2)+pln(2)+ln|𝐕|

on ψp és la funció digamma multivariada (la derivada del logaritme de la funció gamma multivariant).

Això té un paper important en les derivacions variacionals bayesianes per a xarxes de Bayes que involucren la distribució de Wishart.

Entropia

L'entropia d'informació de la distribució té la següent expressió:[5]

H[𝐗]=ln(B(𝐕,n))np12E[ln|𝐗|]+np2

on B(V, n) és la constant de normalització de la distribució:

B(𝐕,n)=1|𝐕|n22np2Γp(n2)

Això es pot expandir com:

H[𝐗]=n2ln|𝐕|+np2ln(2)+lnΓp(n2)np12E[ln|𝐗|]+np2=n2ln|𝐕|+np2ln(2)+lnΓp(n2)np12(ψp(n2)+pln(2)+ln|𝐕|)+np2=n2ln|𝐕|+np2ln(2)+lnΓp(n2)np12ψp(n2)np12(pln(2)+ln|𝐕|)+np2=p+12ln|𝐕|+12p(p+1)ln(2)+lnΓp(n2)np12ψp(n2)+np2

Entropia creuada

L'entropia creuada de dues distribucions de Wishart amb els paràmetres p0, n0, V0 i p1, n1, V1 és:

H(p0,p1)=Ep0[logp1]=Ep0[log|𝐗|n1p12etr(𝐕11𝐗)22n1p2|𝐕1|n12Γp(n12)]=n1p2log2+n12log|𝐕1|+logΓp(n12)n1p12Ep0[log|𝐗|]+12Ep0[tr(𝐕11𝐗)]=n1p2log2+n12log|𝐕1|+logΓp(n12)n1p12(ψp(n02)+plog2+log|𝐕0|)+12tr(𝐕11n0𝐕0)=n12log|𝐕11𝐕0|+p+12log|𝐕0|+n02tr(𝐕11𝐕0)+logΓp(n12)n1p12ψp(n02)+p(p+1)2log2

Que quan p0 = p1 equival a l'entropia.

Divergència K-L

La divergència de Kullback-Leibler de p1 donat p0 és

DKL(p0p1)=H(p0,p1)H(p0)=n12log|𝐕11𝐕0|+n02(tr(𝐕11𝐕0)p)+logΓp(n12)Γp(n02)+n0n12ψp(n02)

Funció característica

La funció característica de la distribució de Wishart és

Θ|𝐈2iΘ𝐕|n2.

En altres paraules:

ΘE[exp(itr(𝐗Θ))]=|𝐈2iΘ𝐕|n2

on E[⋅] indica l'esperança matemàtica. (Aquí Θ i I són matrius de la mateixa mida que V (I és la matriu identitat), i i és l'arrel quadrada de -1).[6]

Teorema

Si una matriu p × p aleatòria X té una distribució Wishart amb m graus de llibertat i la matriu de variància V – escrita com 𝐗𝒲p(𝐕,m) - i C és una matriu q × p de rang q, llavors,[7]

𝐂𝐗𝐂T𝒲q(𝐂𝐕𝐂T,m).

Corol·lari 1

Si z és un vector constant diferent de zero p × 1, llavors:[7]

𝐳T𝐗𝐳σz2χm2.

En aquest cas, χm2 és la distribució de khi-quadrat i σz2=𝐳T𝐕𝐳 (σz2 és una constant, és positiu perquè V és definida positiva).

Corol·lari 2

Considerem el cas en zT = (0, ..., 0, 1, 0, ..., 0) (és a dir, l'element j-èsim és 1 i tots els altres zero). Llavors el corol·lari 1 mostra que:

wjjσjjχm2

dona la distribució marginal de cada un dels elements de la matriu diagonal.

L' estadístic George Seber assenyala que la distribució de Wishart no es diu la "distribució chi quadrat multivariant" perquè la distribució marginal dels elements fora de la diagonal no és de chi-quadrat. Seber prefereix reservar el terme multivariant per al cas en què tots els distribucions marginals univariades pertanyen a la mateixa família.[8]

Estimació de la distribució normal multivariada

La distribució Wishart és la distribució mostral de l'estimador de màxima versemblança (MLE) de la matriu de covariància d'una distribució normal multivariada.[9] Una derivació de la MLE utilitza el teorema espectral.

Descomposició de Barlett

La descomposició de Bartlett d'una matriu X d'una distribució Wishart de p-variables amb matriu d'escala V i n graus de llibertat és la factorització:

𝐗=<mi fromhbox="1">L</mi><mi fromhbox="1">A</mi><mi fromhbox="1">A</mi>T<mi fromhbox="1">L</mi>T,

on L és el factor de Cholesky de V, i:

𝐀=(c1000n21c200n31n32c30np1np2np3cp)

on ci2χni+12 i Plantilla:Math de manera independent.[10] Això proporciona un mètode útil per a l'obtenció de mostres a l'atzar d'una distribució de Wishart.[11]

Distribució marginal dels elements de la matriu

Sigui V una matriu de variància 2 × 2 caracteritzada pel coeficient de correlació -1 < ρ < 1 i L el seu factor de Cholesky més petit:

𝐕=(σ12ρσ1σ2ρσ1σ2σ22),𝐋=(σ10ρσ21ρ2σ2)

Multiplicant per l'anterior descomposició de Bartlett, trobem que una mostra aleatòria de la distribució de Wishart 2 × 2 és:

𝐗=(σ12c12σ1σ2(ρc12+1ρ2c1n21)σ1σ2(ρc12+1ρ2c1n21)σ22((1ρ2)c22+(1ρ2n21+ρc1)2))

Els elements de la diagonal, com és evident en el primer element, segueixen, com era d'esperar, la distribució χ2 amb n graus de llibertat (escalada per σ²). L'element de fora de la diagonal és menys familiar però pot ser identificat com una barreja normal de variància-mitja on la densitat de la mescla és una distribució χ2. Per tant, la corresponent densitat de probabilitat marginal per a l'element de fora de la diagonal és la distribució de variància-gamma

f(x12)=|x12|n12Γ(n2)2n1π(1ρ2)(σ1σ2)n+1Kn12(|x12|σ1σ2(1ρ2))exp(ρx12σ1σ2(1ρ2))

on Kν(z) és la funció de Bessel modificada de segona classe.[12] Resultats similars es poden trobar per les dimensions superiors, però la interdependència de les correlacions fora de la diagonal es fa cada vegada més complicada. També és possible escriure la funció generadora de moments fins i tot en el cas no central (essencialment l'enèsima potència de Craig[13]) tot i que la densitat de probabilitat es converteix en una suma infinita de funcions de Bessel.

Possible rang del paràmetre de forma

Es pot demostrar[14] que la distribució de Wishart es pot definir si, i només si, el paràmetre de forma n pertany al conjunt

Λp:={0,,p1}(p1,).

Aquest conjunt porta el nom de conjunt de Gindikin, que va ser qui el va introduir en els anys setanta dins el context de les distribucions gamma sobre cons homogenis.[15] No obstant això, per als nous paràmetres en l'espectre discret del conjunt Gindikin, és a dir:

Λp*:={0,,p1},

la corresponent distribució Wishart no té la densitat de Lebesgue.

Relació amb altres distribucions

  • La distribució de Wishart està relacionada amb la distribució Inversa de Wishart, Wp1, com segueix: Si Plantilla:Math i si fem el canvi de variables Plantilla:Math, llavors 𝐂Wp1(𝐕1,n). Aquesta relació es pot derivar tenint present que el valor absolut del determinant jacobià d'aquest canvi de variable és Plantilla:Math.[16]
  • En estadística bayesiana, la distribució Wishart és un conjugat previ per al paràmetre de precisió de la distribució normal multivariada quan el paràmetre mitja és conegut.[5]
  • Una generalització és la distribució gamma multivariant.
  • Un tipus diferent de generalització és la distribució normal de Wishart, essencialment el producte d'una distribució normal multivariada i una distribució de Wishart.

Vegeu també

Referències

Plantilla:Referències

Enllaços externs

Plantilla:Distribucions de probabilitat Plantilla:Autoritat