Distribució t multivariant

De testwiki
Salta a la navegació Salta a la cerca


Plantilla:Infotaula distribució de probabilitat En Teoria de la probabilitat i Estadística, la distribució t mutivariable o multivariant és una extensió vectorial de la distribució t de Student. Aquesta distribució és una alternativa a la distribució normal multivariable quan apareixen dades atípiques (outliers) o cues pesades, com passa sovint en l'anàlisi de dades financeres. D'altra banda, també és molt utilitzada en estadística bayesiana multivariant com a distribució a priori.[1]

Definició

Escriurem tots els vectors en columna i per una matriu o vector 𝑨 , escriurem 𝑨 per designar la seva transposada.

El cas més senzill

Siguin Z1,,Zp variables aleatòries independents , totes amb distribució normal estàndard 𝒩(0,1), i sigui Q una variable aleatòria amb distribució hki quadrat amb ν>0 graus de llibertat, Qχν2 , independent de Z1,,Zp. Definim el vector

𝑻=(T1,,Tp)=1Q/ν(Z1,,Zp).Es diu que 𝑻 té té una distribució t multivariable amb ν graus de llibertat.[2] Noteu que Tj=ZjQ/ν, j=1,,p,tenen distribució t de Student amb ν graus de llibertat, Tjt(ν), però no són independents ja que totes tenen el factor Q.

En notació vectorial, si escrivim 𝒁=(Z1,,Zp), que és un vector normal multivariable 𝒩p(0,𝑰p), on 𝑰p és la matriu identitat de dimensió p, tenim𝑻=1Q/ν𝒁.(1) Notació: S'escriu 𝑻𝒕p(ν,0,𝑰p). La funció de densitat de 𝑻 és [2]

f𝑻(x1,,xp)=Γ[(ν+p)/2]Γ(ν/2)νp/2πp/2(1+1νj=1pxj2)(ν+p)/2.(2)

Aquest densitat es troba exactament igual que la de la funció de densitat de la distribució t de Student, però fent el canvi de variables(Z1,,Zp,Q)(T1,,Tp,Q) i calculant la densitat marginal de (T1,,Tp).

Per a p=1, l'expressió (2) es redueix a la funció de densitat de la distribució t de Student amb ν graus de llibertat.
Estudiem el cas p=2 . Tenim fT1,T2(x1,x2)=Γ[(ν+2)/2]Γ(ν/2)νπ(1+1ν(x12+x22))(ν+2)/2.Per construcció, les densitats marginals de T1 i T2 són fT1(x)=fT2(x)=Γ((ν+1)/2)Γ(ν/2)πν(1+x2ν)(ν+1)/2.

Per tant, fT1(x1)fT2(x2)fT1,T2(x1,x2),que és coherent amb el fet que T1 i T2 no són independents. Però també implica que si S1 i S2 són dues variables aleatòries independents ambdues amb distribució tν , llavors el vector (S1,S2) no té una distribució t bivariable, en contrast amb allò que passa amb les variables normals independents. Finalment, noteu que si ν>2, llavors T1 i T2 tindran moment de segon ordre i E[T1]=E[T2]=0, i E[T1T2]=νE[1Q]E[Z1]E[Z2]=0,amb la qual cosa T1 i T2 estan incorrelacionades

Cas general

Sigui 𝒀𝒩p(0,Σ), on Σ és una matriu definida positiva (en particular, simètrica i amb determinant diferent de 0) , μp , i Qχν2 , independent de 𝒀. Aleshores el vector aleatori𝑿=1Q/ν𝒀+μ(3)es diu que té una distribució t multivariable amb ν graus de llibertat, amb paràmetres μ i Σ (també es diu que μ és el vector de posició i Σ el paràmetre d'escala ), i s'escriu 𝑿𝒕p(ν,μ,Σ). La funció de densitat és [2]

Plantilla:Equation box 1

on detΣ és el determinant de la matriu Σ. Quan p=1, llavors s'obté una distribució t amb tres paràmetres.

De les propietats de les distribucions normals multivariables 𝒀=Σ1/2𝒁, en distribució,on Σ1/2 és l'arrel quadrada de la matriu Σ,[3] tindrem que 𝑿=Σ1/2𝑻+μ, en distribució.(5)D'on es dedueix l'expressió de la densitat (4) a partir de (2) mitjançant la formula de canvi de variables per a vectors aleatoris.

Es important remarcar que aquesta distribució pertany a la família de les distribucions amb simetria el·líptica [4]

Propietats

La distribució t multivariable comparteix amb la distribució normal multivariable diverses propietats importants.

Distribucions marginals

Sigui 𝑿𝒕p(ν,μ,Σ). Aleshores qualsevol subvector també té una distribució t multivariable. Més concretament, per q=1,,p1 i (per simplificar les notacions) prenem 𝑿q=(X1,,Xq). Llavors 𝑿q𝒕q(ν,μq,Σqq), on μq=(μ1,,μq) i Σqq és la submatriu de Σ obtinguda eliminant les files q+1,,p i les columnes q+1,,p. Aquesta propietat es dedueix de la representació (3) del vector 𝑿.

Transformacions afins

Sigui 𝑿𝒕p(ν,μ,Σ), 𝑩 una matriu p×p definida positiva (en particular, simètrica) i 𝒃p. Aleshores 𝑩𝑿+𝒃𝒕p(ν,𝑩μ+𝒃,𝑩Σ𝑩).Aquesta propietat es dedueix de la representació (3) i de les propietats dels vectors normals multivariables.

Combinacions lineals de les components

Sigui 𝑿𝒕p(ν,μ,Σ). Considerem una combinació lineal de les seves components S=𝒂𝑿=j=1pajXj,on 𝒂=(a1,,ap) . AleshoresSt(ν,𝒂μ,𝒂Σ𝒂),on aquesta última és una distribució t de Student amb 3 paràmetres (graus de llibertat, paràmetre de posició i quadrat del paràmetre d'escala) .


Aquesta propietat també es demostra a partir de les propietats de la distribució normal multivariable.

Distribucions condicionades

Sigui 𝑿𝒕p(ν,μ,Σ) i separem-lo en dues parts 𝑿1 i 𝑿2 de dimensions p1 i p2 respectivament, amb p1+p2=p , 𝑿=(𝑿1𝑿2) Partim de la mateixa manera μ ,

μ=(μ1μ2),

i la matriu Σ de la forma Σ=(Σ11Σ12Σ21Σ22)Aleshores la distribució de 𝑿2 condicionada a 𝑿1 és una distribució t multivariable: 𝑿2|𝑿1𝒕p2(ν+p1,μ2|1,ν+d1ν+p1Σ22|1),on

d1=(𝑿1μ1)Σ111(𝑿1μ1) és el quadrat de la distància de Mahalanobis de 𝑿1 a μ1 amb matriu d'escala

Σ11.

Σ22|1=Σ22Σ21Σ111Σ12 és el complement de Schur de la matriu Σ11 en Σ.
μ2|1=μ2+Σ21Σ111(𝑿1μ1) és la regressió lineal de 𝑿2 sobre 𝑿1.
Per a la demostració vegeu.[5]

Convergència a la distribució normal multivariable

Quan ν, la distribució 𝒕p(ν,μ,Σ) s'aproxima a una distribució normal multivariable 𝒩(μ,Σ). Concretament, si 𝑿ν𝒕p(ν,μ,Σ) (suposem ν un nombre natural), i 𝑿𝒩(μ,Σ) llavors limν𝑿ν=𝑿,en distribució. Aquesta propietat es demostra utilitzant la tècnica de Cramer-Wold, juntament amb la propietat que hem vist sobre les combinacions lineals de les components d'un vector amb distribució t multivariable i la convergència de la distribució t de Student a la distribució normal.

Moments

Sigui 𝑿𝒕p(ν,μ,Σ). Les següents dues propietats es demostren a partir de la representació (3).

Esperança

Si ν>1 , llavors el vector 𝑿 té esperança i E[𝑿]=μ.

Matriu de variàncies-covariàncies.

Si ν>2, aleshores la matriu de variàncies-covariàncies del vector 𝑿 és:𝑽(𝑿)=νν2Σ.Moments d'ordre superior. [4]

Ens restringirem al cas que μ=0 i Σ=𝑰p. Sigui 𝑻𝒕p(ν,0,𝑰p) i n10,,np0 nombres naturals tals que n1++np=n<ν . Aleshores E[|T1n1Tpnp|]< i si n1,,np són parells, aleshores E[T1n1Tpnp]=νn/2Γ(νn2)2n/2Γ(ν2)j=1pnj!2nj/2(nj/2)!.Si algun dels n1,,np és senar, aleshores l'esperança anterior és 0.

Aquesta propietat es demostra a partir de la representació (1), de la independència de Z1,,Zp i Q, i les fórmules per als moments d'una distribució 𝒩(0,1) i dels d'una distribució khi quadrat.

Funció característica

La funció característica no té una expressió senzilla. Vegeu [1] o.[6][7]

Simulació

La definició constructiva d'una distribució t multivariant serveix simultàniament com a algorisme de mostreig:

  1. Generar uχν2 i 𝐲N(𝟎,Σ), independentment.
  2. Calcular 𝐱ν/u𝐲+μ .

Mixtura

Aquesta formulació dona lloc a la representació jeràrquica d'una distribució t multivariant com una mixtura d'escala de normals: SiuGa(ν/2,ν/2) on Ga(a,b) indica una distribució gamma amb densitat proporcional a xa1ebx, i 𝐱u condicionalment segueix N(μ,u1Σ) .


Referències

Plantilla:Referències