Vector aleatori

De testwiki
La revisió el 17:11, 26 nov 2024 per imported>Freutci (Funció generatriu de probabilitats: Correcció)
(dif.) ← Versió més antiga | Versió actual (dif.) | Versió més nova → (dif.)
Salta a la navegació Salta a la cerca

En Probabilitat i Estadística, molt sovint al resultat que s'obté en un experiment aleatori o un estudi estadístic se li associem diversos nombres; per exemple, triem una persona a l'atzar i en mesurem el pes i l'alçada: tenim així dues mesures, X1 i X2, que considerades conjuntament (X1,X2) constitueixen un vector aleatori. Formalment, un vector aleatori d-dimensional és un vector 𝑿=(X1,,Xd) tal que cada component Xi, i=1,,d, és una variable aleatòria.

Definició

Nota. A la secció Exemples al final de l'article hi ha desenvolupats dos exemples amb vectors aleatoris bidimensionals que poden ser útils a les persones que prefereixin començar analitzant casos concrets.


Considerem un espai de probabilitat (Ω,𝒜,P). Un vector aleatori d-dimensional [1] és una aplicació 𝑿=(X1,,Xd):Ωd tal que cada component Xi, i=1,,d és una variable aleatòria. També s'anomena variable aleatòria d-dimensional.

Comentaris sobre les notacions.

  1. Hem escrit el vector en fila,[1] però en Estadística multivariant és molt freqüent escriure els vectors en columna,[2] ja que es fan moltes operacions amb matrius i és més convenient seguir les normes estàndard de l'àlgebra lineal. En aquest article escriurem els vectors en fila, excepte a les seccions dedicades a l'esperança d'un vector aleatori i a la matriu de variàncies-covariàncies, i als exemples que tractem de lleis normals multidimensionals.
  2. Per alleugerir les fórmules, s'utilitzen 'comes' com a interseccions; així, donats uns conjunts A1,,Ad de , P(X1A1,,XdAd)=P({X1A1}{XdAd}).O bé, en el cas discret que veurem a continuació, per x1,,xd s'escriu P((X1,,Xd)=(x1,,xd))=P(X1=x1,,Xd=xd)=P({X1=x1}{Xd=xd}).

Vectors aleatoris discrets

Un vector aleatori 𝑿=(X1,,Xd) es diu que es discret si només pot prendre un nombre finit o numerable de valors; en altres paraules, si existeix un conjunt finit o infinit numerable Sd tal que P(𝑿S)=1.

S'anomena funció de probabilitat (a vegades s'afegeix conjunta) del vector o funció de repartiment de massa a la funció

p𝑿(x1,,xd)=P(X1=x1,,Xd=xd),(x1,,,xd)S.

Les distribucions de probabilitat de cadascuna de les components dels vector, X1,,Xd, o dels vectors (Xi1,,Xir), 1i1<<ird, 1rd1, s'anomenen distribucions marginals.

A partir de la funció de probabilitat del vector podem calcular totes les distribucions marginals sumant respecte les altres components: per exemple, per simplificar la notació, la funció de probabilitat de (X1,,Xr), on rd1, és p(X1,,Xr)(x1,,xr)=xr+1,,xdp𝑿(x1,,xd).

Exemple: Distribució multinomial

Plantilla:Article principal

Considerem un experiment que pot tenir d resultats diferents, que designarem per R1,,Rd, amb probabilitats p1,,pd(0,1), p1++pd=1. Fem n repeticions independents i denotem per X1 el nombre de vegades que obtenim el resultat R1, per X2 el nombre de vegades que obtenim el resultat R2, i així successivament. Aleshores la probabilitat d'obtenir x1 vegades el resultat R1, x2 vegades el resultat R2, etc. amb x1++xd=n ésp(X1,,Xd)(x1,,xd)=P(X1=x1,,Xd=xd)=n!x1!xd!p1x1pdxd.

Es diu que el vector 𝑿=(X1,,Xd) segueix una distribució multinomial [3] de paràmetres n,p1,,pd, i s'escriu 𝑿(n;p1,,pd). Cal notar que cada component Xi té una distribució binomial de paràmetres n i pi, XiB(n,pi). De fet, una distribució multinomial és una extensió de la distribució binomial quan hi ha més de dos resultats possibles.

Per exemple, tenim una urna amb 4 boles blanques, 3 vermelles i 3 grogues. Traiem n=4 boles amb reemplaçament, és a dir, traiem una bola, anotem el color, la retornem a l'urna, en traiem una altra, etc. Designem per:

X1: nombre de boles blanques que traiem.
X2: nombre de boles vermelles que traiem.
X3: el nombre de boles grogues que traiem.

Aquí, p1=04, p2=03 i p3=03. Llavors, la probabilitat de treure 1 bola blanca, 1 vermella i 2 grogues és p(X1,X2,X3)(1,1,2)=P(X1=1,X2=1,X3=2)=4!1!1!2!041031032=01296.A partir d'aquí, podem calcular, per exemple, la distribució marginal del vector aleatori (X1,X3) o la de la variable aleatòria X3

Vectors aleatoris absolutament continus o amb funció de densitat

Es diu que un vector aleatori 𝑿=(X1,,Xd) és absolutament continu, o senzillament continu, si existeix una funció f𝑿:d, anomenada funció de densitat (conjunta), que compleix

1. f(x1,,xd)0,  (x1,,xd)d.
2. f𝑿(x1,,xd)dx1dxd=1.
3. Per a qualsevol Bd (en rigor B ha de ser un conjunt de Borel de d), tenim P((X1,,Xd)B)=Bf𝑿(x1,,xd)dx1dxd.
En particular, si a1<b1,,ad<bd, tenim

P((X1,,Xd)(a1,b1)××(ad,bd))=a1b1adbdf𝑿(x1,,xd)dx1dxd. A partir de la funció de densitat conjunta pot calcular-se la funció de densitat de qualsevol vector (Xi1,,Xir), 1i1<<ird, 1rd1, que s'anomena la densitat marginal; per exemple, la densitat marginal de (X1,,Xr), amb 1rd1 és

f(X1,,Xr)(x1,,xr)=dr integralsf𝑿(x1,,xd)dxr+1dxd.


Exemple: distribució normal multidimensional

Un vector aleatori d-dimensional amb funció de densitatf(x1,,xd)=1(2π)d/2e(x12++xd2)/2,x1,,xd,es diu que té una llei normal multidimensional o multivariada, 𝒩d(0,𝑰d) on 𝑰d és la matriu identitat. Cada component del vector té una distribució normal estàndard 𝒩(0,1) .

Vegeu els vectors aleatoris normals multidimensionals generals 𝒩d(μ,Σ) als exemples de la secció Funcions d'un vector aleatori amb densitat.

Funcions de distribució multidimensional

Plantilla:Article principal La funció de distribució d'un vector aleatori[1] 𝑿=(X1,,Xd) és la funció F:d[0,1] definida per F(x1,,xd)=P(X1x1,,Xdxd).

Si el vector aleatori 𝑿 té funció de densitat f, aleshores la funció de distribució del vector és F(x1,,xd)=x1xdf(t1,,td)dt1dtd.

Si la funció de densitat f és contínua en el punt (x1,,xd), aleshores [4] f(x1,,xd)=dF(x1,,xd)x1xd.

Variables aleatòries independents

Recordem que es diu que les variables aleatòries X1,,Xk són independents si per a qualsevol conjunts B1,,Bk (en rigor, conjunts de Borel de ), P(X1B1,,XkBk)=P(X1B1)P(XkBk).


Designem per F(X1,,Xk) la funció de distribució del vector (X1,,Xk), i per FX1,,FXk les funcions de distribució de les variables aleatòries X1,,Xk (marginals). Aleshores X1,,Xk són independents si i només si F(X1,,Xk)(x1,,xk)=FX1(x1)FXk(xk), (x1,,xk)k.


En el cas discret la independència equival a que la funció de probabilitat conjunta sigui igual al producte de marginals: X1,,Xk són independents si i només si p(X1,,Xk)(x1,,xk)=pX1(x1)pXk(xk), (x1,,xk)S.


En el cas absolutament continu, la propietat d'independència equival a que la densitat conjunta sigui igual al producte de marginals: X1,,Xk són independents si i només si f(X1,,Xk)(x1,,xk)=fX1(x1)fXk(xk), (x1,,xk)k.

Per exemple, en el cas de la distribució normal multidimensional que hem comentat, les distribucions marginals de les diferents components són lleis normals estàndard: tenim que per a j=1,,d, fXj(x)=12πex2/2, x.Llavors és clar que es compleix la condició anterior i, per tant, les variables X1,,Xd són independents.

Vectors aleatoris independents

Considerem k vectors aleatoris, que poden ser de dimensions diferents: 𝑿1=(X11,,X1j1),,𝑿k=(Xk1,,Xkjk). Es diu que són independents si per qualsevol B1(j1),,Bk(jk), on (r) és la σ-àlgebra de Borel sobre r, P(𝑿1B1,,𝑿kBk)=P(𝑿1B1)P(𝑿kBk).Les caracteritzacions de la independència de variables aleatòries en els casos discret i continus es trasllada al cas de vectors aleatoris.

Esperança d'una funció d'un vector aleatori

Sigui 𝑿=(X1,,Xd) un vector aleatori i h:d una funció (mesurable), tenim que h(𝑿) és una variable aleatòria de la qual podrem calcular l'esperança quan E[|h(𝑿)]<. Si 𝑿 és discret, aleshores E[h(𝑿)]=x1,,xdh(x1,,xd)p𝑿(x1,,xd),sempre que x1,,xd|h(x1,,xd)|p𝑿(x1,,xd)<.Si 𝑿 és absolutament continu, aleshores E[h(𝑿)]=h(x1,,xd)f𝑿(x1,,xd)dx1dxd,sempre que |h(x1,,xd)|f𝑿(x1,,xd)dx1dxp<.Naturalment, si tenim una funció h:r que només fa intervenir una part de 𝑿, posem (Xi1,,Xir), amb, 1i1<<irr, 1rd1, aleshores l'esperança de h(Xi1,,Xir) es calcula utilitzant la distribució marginal d'aquest vector.

Moments d'un vector aleatori

Considerem un vector aleatori 𝑿=(X1,,Xd) i siguin n10,,nd0. Es diu que 𝑿moment d'ordre (n1,,nd) si E[|X1n1Xdnd|]<, i, en aquest cas, es defineix el moment d'ordre (n1,,nd) (alguns autors diuen moment mixt)[5] per mn1,,nd=E[X1n1Xdnd]. D'acord amb les fórmules que hem vist abans, si el vector és discret, aleshores E[X1n1Xdnd]=x1,,xdSx1n1xdndp𝑿(x1,,xd).Si el vector aleatori és absolutament continu,E[X1n1Xdnd]=x1n1xdndf𝑿(x1,,xd)dx1dxd.Tenim la següent propietat: Si E[|Xj|m]<,pera j=1,,d, aleshores per a n10,,nd0, n1++ndm, tenim que 𝑿=(X1,,Xd) té moment d'ordre (n1,,nd).[6]

Vegeu els moments factorials en la secció de la funció generatriu de probabilitats.

Esperança d'un vector aleatori

Totes les propietats d'aquesta secció i la següent es troben demostrades a Seber.[7] Atès que farem operacions matricials, en aquesta secció i la següent escriurem tots els vectors en columna; en particular, escriurem en columna els elements de d. Donada una matriu (o vector) 𝑼 designarem per 𝑼 la seva transposada. Considerem un vector aleatori 𝑿=(X1,,Xd) tal que totes les seves components tinguin esperança. Aleshores es defineix l'esperança de 𝑿 per E[𝑿]=(E[X1],,E[Xd]).


Propietats

  1. Si 𝒂=(a1,,ad)d, aleshores E[𝒂]=𝒂.
  2. Siguin 𝑿 i 𝒀 dos vectors aleatoris d -dimensionals amb esperances finites, i 𝑨 i 𝑩 dues matrius d'ordre k×d. Aleshores E[𝑨𝑿+𝑩𝒀]=𝑨E[𝑿]+𝑩E[𝒀].

Matriu de variàncies-covariàncies

Continuem escrivint tots els vectors en columna. Si totes les components del vector 𝑿 tenen variància, aleshores es defineix la seva matriu de variàncies-covariàncies o matriu de dispersió: 𝑽(𝑿)=(Var(X1)Cov(X1,X2)Cov(X1,Xd)Cov(X2,X1)Var(X2)Cov(X2,Xd)Cov(Xd,X1)Cov(Xd,X2)Var(Xd))Atès que Var(Xj)=Cov(Xj,Xj), aquesta matriu també s'escriu 𝑽(𝑿)=(Cov(Xi,Xj))i=1,,dj=1,,d

Propietats

1. Donat que Cov(Xi,Xj)=Cov(Xj,Xi), la matriu 𝑽(𝑿) es simètrica.
2. La matriu 𝑽(𝑿) és semidefinida positiva, ja que per qualsevol 𝒙=(x1,,xd)d,

𝒙𝑽(𝑿)𝒙=i,j=1dxixjCov(Xi,Xj)=Var(i=1dXi)0.A més, el determinant de la matriu 𝑽(𝑿) és 0 si i només si hi ha una relació lineal entre les variables X1,,Xd, això és, existeixen escalars λ1,,λd+1, no tots nuls, tals que λ1X1++λdXd=λd+1,q.s.

3. Si 𝑿 és un vector d -dimensional, 𝑨 una matriu k×d i 𝒃k, aleshores 𝑽(𝑨𝑿+𝒃)=𝑨𝑽(𝑿)𝑨.

Exemples

1. Sigui 𝑿=(X1,,Xd)(n;p1,,pd). Aleshores, donat que cada component Xj té una distribució binomial B(n,pj),

E[𝑿]=(np1,,npd). També tenim que Var(Xj)=npj(1pj). Per calcular les covariàncies cal utilitzar la marginal de (Xi,Xj) i s'obté que Cov(Xi,Xj)=npipj,ij. (vegeu els exemples de la secció Funció característica). Així, 𝑽(𝑿)=(np1(1p1)np1p2np1pdnp1p2np2(1p2)np2pdnp1pdnp2pdnpd(1pd))

2. En el cas del vector normal multidimensional E[𝑿]=0. D'altra banda, Var(Xj)=1 i, atès que les variables són independents, Cov(Xi,Xj)=0,ij. Llavors𝑽(𝑿)=𝑰d.

Ampliació: Matriu de covariàncies entre dos vectors

En el que segueix és convenient introduir les matrius aleatòries que són matrius tals que les seves components són variables aleatòries. Sigui 𝒁 una d'aquestes matrius, de dimensions n×m: 𝒁=(Zij)i=1,,nj=1,,m. S'anomena esperança de la matriu aleatòria 𝒁 a la matriu 𝑬[Z]=(E[Zij])i=1,,nj=1,,m.Sigui 𝑿 un vector aleatori d -dimensional i 𝒀 un vector aleatori k -dimensional ambdós amb moments de segon ordre. S'anomena matriu de covariàncies de 𝑿 i 𝒀 a la matriu de dimensions d×k 𝑪(𝑿,𝒀)=(Cov(Xi,Yj))i=1,,dj=1,,kPropietats.

  1. Si 𝑿=𝒀 aleshores la matriu de covariàncies coincideix amb la matriu de variàncies-covariàncies: 𝑪(𝑿,𝑿)=𝑽(𝑿).
  2. Si E[𝑿]=α i E[𝒀]=β, aleshores 𝑪(𝑿,𝒀)=E[(𝑿α)(𝒀β)].
  3. En particular, 𝑽(𝑿)=E[(𝑿α)(𝑿α)]=E[𝑿𝑿]αα.
  4. Siguin 𝑿 i 𝒀 dos vectors aleatoris de dimensions d i k respectivament i 𝑨 i 𝑩 matrius de dimensions n×d i m×k respectivament, aleshores 𝑪(𝑨X,𝑩Y)=𝑨𝑪(𝑿,𝒀)𝑩.

Funció característica i altres transformades

Plantilla:Article principal

Funció característica

La funció característica d'un vector aleatori 𝑿=(X1,,Xd) és la funció φ:d definida per φ𝑿(t1,,td)=E[ei(t1X1++tdXd)],(t1,,td)d. Les funcions característiques de les distribucions marginals es dedueixen fàcilment de la funció característica conjunta; per exemple, per simplificar les notacions, per a r=1,,d1, φ(X1,,Xr)(t1,,tr)=φ(X1,,Xd)(t1,,tr,0,0),t1,,tr.

Propietats.[8]

Unicitat. La funció característica determina la distribució del vector 𝑿; concretament, si 𝑿 i 𝒀 són dos vectors aleatoris, amb funcions característiques φ𝑿 i φ𝒀 respectivament, tals que φ𝑿(t1,,td)=φ𝒀(t1,,td),(t1,,td)d,aleshores 𝑿 i 𝒀 tenen la mateixa distribució (tenen la mateixa funció de distribució, o si són discrets tenen la mateixa funció de probabilitat, o si són absolutament continus tenen la mateix funció de densitat). La propietat recíproca evidentment també és certa.

Funció característica i independència. Els vectors aleatoris d-dimensionals 𝑿1,,𝑿k són independents si i només si φ(𝑿1,,𝑿k)(𝒕1,,𝒕k)=φ𝑿1(𝒕1)φ𝑿k(𝒕k),𝒕1,,𝒕kd.Funció característica i suma de vectors aleatoris independents. Siguin 𝑿1,,𝑿k vectors aleatoris d-dimensionals independents i posem 𝒀=𝑿1++𝑿k.Aleshores φ𝒀(𝒕)=φ𝑿1(𝒕)φ𝑿k(𝒕),𝒕d.

Funció característica i moments. La següent propietat és especialment útil per a calcular els moments d'un vector aleatori: Si el vector aleatori 𝑿=(X1,,Xd) compleix E[𝑿m]<, on X=X12++Xd2, aleshores la funció característica φ𝑿 és de classe 𝒞m i per a n1,,nd0, j=1dnjm, E(X1n1Xdnd)=1in1++ndn1++ndt1n1tdndφ𝑿(t1,td)|t1=0,,td=0.Recíprocament, si la funció característica φ𝑿 és de classe 𝒞m per a m parell, aleshores el vector 𝑿 té moments d'ordre (n1,,nd) per qualsevol n1,,nd0, j=1dnjmExemple. Vector multinomial. Retornem al vector multinomial 𝑿=(X1,,Xd)(n;p1,,pd). La seva funció característica és φ(t1,,td)=(p1eit1+pdeitd)n, t1,,td.El vector 𝑿 té moments de tots els ordres perquè les seves components són variables aleatòries positives i afitades per n. Podem calcular E[X1X2] de la següent manera: 2t1t2φ(t1,,tk)=n(n1)(p1eit1++pkeitk)n2p1p2eit1eit2,d'on E(X1X2)=n(n1)p1p2.Exemple: Vector normal multidimensional. El vector 𝑿𝒩(0,𝑰d) té funció característica φ(t1,,td)=e(t12++td2)/2, t1,,td.

Funció generatriu de moments

Sigui 𝑿=(X1,,Xd) un vector aleatori. La funció M𝑿(s1,,sd)=E[es1X1++sdXd], definida en aquells punts(s1,,sd)d on l'esperança de la dreta és finita, s'anomena funció generatriu de moments [9] de 𝑿. Atès que per qualsevol nombre real a, ea>0, sempre es pot calcular l'esperança de exp{s1X1++sdXd}, però pot donar infinit. Evidentment, sempre està definida en 0=(0,,0) i M𝐗(0)=1. Quan està definida (o existeix) en un entorn de (0,,0), aleshores té molt bones propietats i pot substituir la funció característica, amb l'avantatge que és una funció real i, per tant, més fàcil d'utilitzar; d'altra banda, en aquest cas, es pot estendre el domini de definició a un subconjunt de n.[10]

Afortunadament, molts vectors aleatoris que apareixen habitualment en l'Anàlisi de la variància i en l'Anàlisi estadística multivariant tenen funció generatriu de moments,[11] però no tots, tal com després veurem.

Alguns autors [10] anomenen transformada de Laplace la funció generatriu de moments; si el vector aleatori 𝑿 només pren valors positius i té funció de densitat f𝑿, aleshores M𝑿(s1,,sd)=00es1x1++sdxdf𝑿(x1,,xd)dx1dxd,que, a part del signe de s1,,sd, és la transformada de Laplace (multidimensional) de la funció f𝑿.[12]

Les tres propietats següents són especialment útils:

Unicitat.[11] Si la funció generatriu de moments d'un vector aleatori està definida en un entorn de (0,,0), aleshores determina unívocament la distribució d'aquest vector.

Independència.[11] Siguin 𝑿=(X1,,Xd) i 𝒀=(Y1,,Yr) dos vectors aleatoris tal que el vector (𝑿,𝒀) té funció generatriu de moments definida en un entorn de zero. Aleshores 𝑿 i 𝒀 són independents si i només si

M(𝑿,𝒀)(s1,,sd,t1,,tr)=M𝑿(s1,,sd)M𝒀(t1,,tr).Moments.[9] Si un vector aleatori 𝑿=(X1,,Xd) té funció generatriu de moments en un entorn de (0,,0), aleshores té moments de tots els ordres i E(X1n1Xdnd)=n1++nds1n1sdndM𝑿(s1,sd)|s1=0,,sd=0.

Exemples

  1. Vector multinomial 𝑿(n;p1,,pd). La funció generatriu és M𝑿(s1,,sd)=(p1es1+pdesd)n, s1,,sd.
  2. Vector normal multidimensional 𝑿𝒩(0,𝑰d). M𝑿(s1,,sd)=e(s12++sd2)/2, s1,,sd.
  3. Vectors aleatoris sense funció generatriu de moments. Segons hem comentat, un vector aleatori amb funció generatriu de moments en un entorn de (0,,0) té moments de tots els ordres. Per tant, qualsevol vector que contingui alguna component que no tingui moments de qualsevol ordre no tindrà funció generatriu de moments. Per exemple, una distribució t-multidimensional.[13]

Funció generatriu de probabilitats

Sigui 𝑿=(X1,,Xd) un vector aleatori que només prengui valors naturals (zero inclòs), amb funció de probabilitats p𝑿. S'anomena funció generatriu de probabilitats [5] a la funció G𝑿(s1,,sd)=E[s1X1sdXd]=x10,,xd0s1x1sdxdp𝑿(x1,,xd).(Amb el conveni 00=1). La sèrie de la dreta és una sèrie de potències multidimensional, que és absolutament convergent per a (s1,,sd)[1,1]d, ja que0x1,,xd|s1x1sdxdp𝑿(x1,,xd)|x1,,xdp𝑿(x1,,xd)=1,. A vegades la regió de convergència és més gran que [1,1]d. Alguns autors defineixen aquesta funció per al camp complex, ja que la sèrie és absolutament convergent per a 𝒛=(z1,,zd)d, amb |z1|1,,|zd|1 i potser en conjunts més grans de d.

La funció generatriu de probabilitats està relacionada amb la funció generatriu de moments per la fórmula: M𝑿(s1,,sd)=G𝑿(es1,,esd).Aquesta funció s'utilitza molt en situacions on intervenen vectors aleatoris que només prenen valors naturals, com els processos de ramificació.[14]

Propietats.[14]

1. La funció G𝑿 és contínua i infinitament diferenciable en (1,1)d.
2. Fórmula d'inversió i unicitat. La funció de probabilitat del vector 𝑿 es pot recuperar a partir de la funció generatriu de probabilitat: p𝑿(x1,,xd)=1x1!xd!x1++xdG𝑿(s1,,sd)s1x1sdxd|s1=0,,sd=0,(x1,,xd)d.

En conseqüència, la funció generatriu de probabilitats determina la distribució del vector 𝑿.

3. Moments factorials. Per a x i k, designem per xk_ el factorial decreixent:[15]xk_=x(x1)(xk+1).

Noteu que si x i kx+1, llavors xk_=0. S'anomena moment factorial [16] d'ordre (n1,,nd) del vector𝑿=(X1,,Xd) a μ'(n1,,nd)=E[X1n_1Xdn_d]. Aleshores, aquesta esperança és finita si i només si[14] lim(s1,,sd)(1,,1)n1++ndG(s1,,sd)s1n1s1n1<,i en aquest cas, μ'(n1,,nd)=lim(s1,,sd)1n1++ndG(s1,,sd)s1n1s1n1.

4. Suma de vectors aleatoris independents. Siguin 𝑿=(X1,,Xd) i 𝒀=(Y1,,Yd) dos vectors aleatoris independents que només prenen valors naturals. Aleshores G𝑿+𝒀(𝒔)=G𝑿(𝒔)G𝒀(𝒔).

Exemple. Vector multinomial 𝑿(n;p1,,pd). La funció generatriu de probabilitat és G𝑿(s1,,sd)=(p1s1+pdsd)n, s1,,sd.

Funcions d'un vector aleatori amb densitat

Les transformacions d'un vector aleatori són especialment importants tant en la teoria com en les aplicacions, i és molt convenient disposar d'eines per determinar la distribució del vector transformat a partir de l'inicial. Si 𝑿 és un vector aleatori d-dimensional amb funció de densitat i h:dd és una bona funció, aleshores 𝒀=h(𝑿) també té funció de densitat i hi ha fórmules per calcular-la. De fet, si el vector 𝑿 està concentrat en un subconjunt U, és a dir, si P(𝑿U)=1, aleshores la funció 𝒉 només ha d'estar definida en aquest conjunt.

Propietat.[17] Sigui 𝑿 un vector aleatori amb funció de densitat conjunta f𝑿(𝒙). Suposem que P(𝑿U)=1 on U és un conjunt obert de d. Sigui h=(h(1),,h(d)):UV, on V és un obert de d, h bijectiva de classe 𝒞1, amb determinant jacobià no nul sobre U: J𝒉(x1,,xd):=det(h(i)xj)i,j=1,,d0, (x1,,xd)U. Designem la inversa de h per g=(g(1),,g(d)). Aleshores el vector aleatori 𝒀=h(𝑿) és absolutament continu amb densitat f𝒀(𝒚)={fX(g(𝒚))|Jg(𝒚)|, si 𝒚V,0,en cas contrari.

Exemple. Vector aleatori normal multidimensional. En aquest exemple escriurem tots els vectors en columna. Sigui 𝑿=(X1,,Xd)𝒩(0,𝑰d) un vector aleatori normal multidimensional com el que hem introduït anteriorment. Considerem una matriu d×d definida positiva Σ i un vector μd. Existeix [18] una única matriu definida positiva[19] Σ1/2 tal que (Σ1/2)2=Σ. Definim el vector 𝒀 per 𝒀=Σ1/2𝑿+μ. Així, l'aplicació que estem considerant és h:dd donada per h(𝒙)=Σ1/2𝒙+μ. Noteu que U=V=d.

L'aplicació inversa és g(𝒚)=h1(𝒚)=Σ1/2(𝒚μ),on Σ1/2 és la matriu inversa de Σ1/2. La matriu jacobiana de g és Σ1/2, que té determinant diferent de zero a tot d. La densitat de 𝑿 és f(𝒙)=1(2π)d/2e(x12++xd2)/2=1(2π)d/2e𝒙𝒙/2. Llavors, la densitat de 𝒀 és f𝒀(𝒚)=1(2π)d/2e12(𝒚μ)Σ1/2Σ1/2(𝒚μ)|detΣ1/2|=1(2π)d/2(detΣ)1/2e12(𝒚μ)Σ1(𝒚μ).

Es diu que 𝒀 té una llei normal multidimensional 𝒀𝒩d(μ,Σ). D'acord amb les propietats que hem vist sobre el vector d'esperances i la matriu de variàncies-covariàncies tenim que E[𝒀]=Σ1/2E[𝑿]+μ=μ i 𝑽(𝒀)=Σ1/2𝑽(𝑿)Σ1/2=Σ.

Extensió. La propietat anterior es pot estendre al cas que la funció h es pugui descompondre en una funció bijectiva a trossos. Concretament tenim:[20] Sigui 𝑿 un vector aleatori d-dimensional, amb funció de densitat conjunta f𝑿(𝒙). Suposem que P{𝑿U}=1 amb U=U1Uk, on Ui són oberts de d disjunts dos a dos. Sigui h:Ud, tal que les restriccions hi:UiVi són bijectives de classe 𝒞1 amb determinant jacobià no nul (els conjunts V1,,Vk no cal que siguin disjunts dos a dos i, de fet, poden ser iguals). Designem per gi:ViUi la inversa de hi. Aleshores el vector aleatori 𝒀=h(𝑿) és absolutament continu amb densitatf𝒀(𝒚)=i=1kf𝑿(gi(𝒚)|Jgi(𝒚)|1Vi(𝒚), on, 1Vi és la funció indicador del conjunt Vi: 1Vi(y)={1,si yVi,0,en cas contrari.

Distribucions condicionades

Cas discret

Sigui 𝑿=(X1,,Xd) un vector aleatori discret amb funció de probabilitat p𝑿. Considerem una de les components del vector, per exemple, per simplificar les notacions, l'última, Xd, amb funció de probabilitat marginal pXd, i fixem xd tal que pXd(xd)>0. S'anomena distribució de (X1,,Xd1) condicionada per Xd=xd a la probabilitat donada per la funció de probabilitat pX1,,Xd1|Xd(x1,,xd1|xd)=p𝑿(x1,,xd)pXd(xd).Més generalment, per a 2rd, podem considerar el vector (Xr,,Xd) (per simplificar les notacions); fixat (xr,,xd) tal que pXr,,Xd(xr,,xd)>0, definim la distribució de (X1,,Xr1) condicionada per Xr=xr,,Xd=xd a la probabilitat donada per la funció de probabilitat pX1,,Xr1|Xr,,Xd(x1,,xr1|Xr=xr,,xd)=p𝑿(x1,,xd)pXr,,Xd(xr,,xd).Exemple. Considerem un vector multinomial 𝑿=(X1,,Xd)(n;p1,,pd). Aleshores, fixat k{0,,n}, la distribució de (X1,,Xd1) condicionada per Xd=k és p(X1,,Xd1)|Xd(x1,,xd1|k)=(nk)!x1!xd1!(p11pk)x1(pd11pk)xd1,x10,,xd10,amb x1++xd1=nk.Per tant, (X1,,Xd1) condicionat a Xd=k té una distribució multinomial (nk;p1/(1pk),,pd1/(1pk)).

En general,[21] fixats xr0,,xd0, tals que xr++xdn, el vector (X1,,Xr1) condicionat per Xr=xr,,Xd=xd té una distribució multinomial (nm;p1*,,pr1*), on m=xr++xdipj*=pjp1++pr1,j=1,,r1.

Cas absolutament continu

Sigui 𝑿=(X1,,Xd) un vector aleatori amb funció de densitat conjunta f𝑿(x1,,xd). Per a 2rd, fixats xr,,xd tals que fXr,,xd(xr,,xd)>0, definim la densitat condicionada de (X1,,Xr1) condicionada per Xr=xr,,Xd=xd fX1,,Xr1|Xr,,Xd(x1,,xr1|xr,,xd)=f𝑿(x1,,xd)fXr,,Xd(xr,,xd).

Exemple. Vector normal multidimensional.. Sigui 𝑿=(X1,,Xd)𝒩d(μ,Σ) un vector normal multidimensional (de nou aquí escriurem tots els vectors en columna), i 2rd. Escrivim 𝑿1=(X1,,Xr1)i𝑿2=(Xr,,Xd)μ1=E[𝑿1]=(μ1,,μr1)iμ2=E[𝑿2]=(μr,,μd).D'altra banda, partim la matriu Σ de la següent manera: Σ=(Σ11Σ12Σ21Σ22),on Σij=𝑪(𝑿i,𝑿j). Noteu que Σ21=Σ12. Aleshores,[22] la distribució (X1,,Xr1) condicionada per Xr=xr,,Xd=xd (escrivim 𝒙2=(xr,,xd)) és normal mutidimensional 𝒩r1(μ*,Σ*) on μ*=μ1+Σ12Σ221(𝒙2μ2)iΣ*=Σ11Σ12Σ221Σ21.En particular, per a d=2, si posemVar(X1)=σ12, Var(X2)=σ22  i  Cov(X1,X2)=σ12, tenim que X1 condicionada per X2=x2 té una distribució normal 𝒩(μ,σ2) on μ=μ1+σ12σ22(x2μ2)iσ2=σ12σ122σ22.

Exemples

Aquests exemples tracten de vectors aleatoris bidimensionals, que habitualment és denoten per (X,Y) en lloc de (X1,X2).

Exemple 1. Vector aleatori bidimensional discret

Tirem una moneda tres cops. El model probabilístic que prendrem és Ω={(cara,cara,cara), (creu, cara, cara),...}, que té 8 elements; 𝒜 és la col·lecció de tots els subconjunts de Ω, i P assigna a tots els resultats la mateixa probabilitat 1/8. Siguin

X: nombre de cares que surt.
Y: diferència, en valor absolut, entre el nombre de cares i de creus.

Aleshores X pot prendre els valors 0, 1, 2 o 3, i Y pot valer 1 o 3. Llavors, el vector (X,Y) pot prendre els valors (0,1), (0,3), (2,1), (2,3), (3,1) o (3,3). El conjunt S={(0,1),(0,3),(2,1),(2,3),(3,1),(3,3)} s'anomena el suport de la distribució del vector. Notem que P((X,Y)S)=1. Calculem les probabilitats que prengui cadascun dels valors del suport. Recordem que per alleugerir les fórmules s'utilitzen 'comes' en lloc d'interseccions):

P((X,Y)=(0,1))=P(X=0,Y=1)=P({X=0}{Y=1})=P()=0.
P((X,Y)=(0,3))=P((creu,creu,creu))=1/8
P((X,Y)=(1,1))=P((cara,creu,creu), (creu,cara,creu), (creu,creu,cara))=3/8, (noteu que l'ordre en què surten els resultats s'ha de tenir en compte).

I així successivament. De fet, els punts (0,1), (1,3), (2,3) i (3,1) es poden treure del suport, ja que tenen probabilitat zero, i per a certes fórmules és convenient fer-ho per evitar expressions sense sentit. La funció p(X,Y)(x,y)=P(X=x,Y=y), (x,y)S s'anomena funció de probabilitat conjunta o funció de repartiment de massa del vector (X,Y) . Quan hi ha un nombre petit de casos, com en aquest exemple, la funció de probabilitat s'acostuma a posar en una taula, anomenada taula de probabilitats conjuntes del vector i que determina la llei o distribució del vector.

X0123103/83/80Y31/8001/8

Distribucions marginals

A partir d'aquesta taula, sumant per files o columnes, es dedueixen les funcions de probabilitat de les variables X i Y, que denotem per pX i pY i que s'anomenen distribucions marginals de X i de Y respectivament, o taules de probabilitats marginals:

x0123pX(x)1/8001/8y13pY(y)3/41/4Independència de variables aleatòries Recordem que dues variables aleatòries X i Y es diu que són independents si per a qualsevol A,B (en rigor, conjunts de Borel A,B()), els esdeveniments {XA} i {YB} són independents, això és,P(XA,YB)=P(XA)P(YB).Quan ambdues variables són discretes, aquesta condició es redueix a una sobre la funció de probabilitat conjunta: Les variables X i Y són independents si i només si p(X,Y)(x,y)=pX(x)pY(y),(x,y)S.A l'exemple és evident que aquesta propietat no es compleix: per exemple, p(X,Y)(0,1)=0pX(0)pY(1)=332.

Distribucions condicionades

Atès que l'esdeveniment {Y=1} (obtenir exactament una cara) té probabilitat estrictament positiva, podem calcular les probabilitat condicionada: P(X=0|Y=1)=P(X=0,Y=1)P(Y=1)=0.

Anàlogament, P(X=1|Y=1)=1/2,P(X=2|Y=1)=1/2iP(X=3|Y=1)=0. Per tant, fixat Y=1, tenim definida una probabilitat sobre el conjunt {0,1,2,3}, de fet, només cal considerar el conjunt {1,2}, que s'anomena la distribució de X condicionada per Y=1, per a la qual es dona la funció de probabilitat condicionada pX|Y(1|1)=12ipX|Y(2|1)=12,i que es pot representar per la taula x12pX|Y(x|1)1/21/2Anàlogament, tenim la distribució de condicionada per Y=3 donada a la següent taula:x03pX|Y(x|3)1/21/2 Esperança d'un vector. Es defineix l'esperança del vector (X,Y) com el vector 𝑬[(X,Y)]=(E[X],E[Y]). Concretament, atès que E[X]=018+138+238+018=98iE[Y]=134+314=32, tenim que E[(X,Y)]=(9/8,3/2).

Matriu de variàncies-covariàncies d'un vector. La matriu 𝑽((X,Y))=(Var(X)Cov(X,Y)Cov(X,Y)Var(Y))s'anomena matriu de variàncies-covariàncies o matriu de dispersió del vector (X,Y). Tenim que Var(X)=E[X2](E[X])2=1588164=3964.De la mateixa manera es calcula que Var(Y)=3/2. Per calcular la covariància farem servir que Cov(X,Y)=E[XY]E[X]E[Y].Ara, per obtenir E[XY], necessitem utilitzar la funció de probabilitat conjunta de (X,Y): E[XY]=010+1118+2138+=74,d'on, Cov(X,Y)=1/16. Així, la matriu de variàncies-covariàncies és 𝑽((X,Y))=(3964141432)

Exemple 2. Vector aleatori bidimensional continu

De manera anàloga al cas d'una variable aleatòria absolutament contínua, es diu que un vector (X,Y) és absolutament continu si existeix una funció f(X,Y):2, anomenada funció de densitat (conjunta), que compleix

1. f(X,Y)(x,y)0,  (x,y)2.
2. f(X,Y)(x,y)dxdy=1.
3. Per qualsevol B2 (en rigor, conjunt de Borel de 2 ,

P((X,Y)B)=Bf(X,Y)(x,y)dxdy.

Figura 1. Triangle T

Com exemple, sigui (X,Y) un vector aleatori bidimensional amb distribució uniforme en el triangle T de vèrtexs els punts (0,0), (1,0) i (1,1) (vegeu la Figura 1). La funció de densitat conjunta és

f(X,Y)(x,y)={2,si (x,y)T,0,en cas contrari.

La funció de densitat (marginal) de Y es calcula per la fórmula:

fY(y)=f(X,Y)(x,y) dx

Ara cal distingir dos casos:

1. Fixada y(0,1), aleshores f(X,Y)(x,y)=0, x. És evident que fY(y)=0.

2. Fixada y(0,1),

f(X,Y)(x,y)={2,si x(y,1),0,en cas contrari.

Llavors

fY(y)=f(X,Y)(x,y)dx=y12dx=2(1y).

Figura 2. Densitat marginal de la variable Y

Ajuntant ambdós casos tenim, vegeu la Figura 2,

fY(y)={2(1y),si y(0,1),0,en cas contrari.

Figura 3. Densitat marginal variable X

De manera anàloga s'obté que la densitat marginal de X és, vegeu la Figura 3, fX(x)=f(X,Y)(x,y)dy={2x,si x(0,1),0,en cas contrari.

Ara podem calcular la densitat condicionada

fX|Y(x|y)

, que només es calculara per a

y(0,1)

fX|Y(x|y)=f(X,Y)(x,y)fY(y)={11y,quan x(y,1),0,en cas contrari.

Funció de densitat condicionada
Figura 3. Funció de densitat condicionada

Vegeu la Figura 4. Noteu que els papers de x i de y són completament diferents. Fixada la y(0,1) tenim una funció de densitat en x. De fet, en aquest cas, es tracta de la densitat d'una distribució uniforme en l'interval (y,1).

Per obtenir l'esperança del vector (X,Y) s'ha de calcular l'esperança de cada component utilitzant les fórmules corresponents al cas absolutament contínu: E[X]=xfX(x)dx=201x2dx=23.

També, E[Y]=2/3. Així, E[𝑿]=(2/3,2/3) .

El moment de segon ordre de X és: E[X2]=x2fX(x)dx=201x3dx=12. D'on Var(X)=E[X2](E[X])2=1249=118.

I el mateix dona Var(Y).

Finalment, per calcular la covariància, E[XY]=xyf(X,Y)(x,y)dxdy=Txydxdy=x=01y=0xxydxdy=16.Aleshores, Cov(X,Y)=E[XY]E[X]E[Y]=1649=518.Per tant, la matriu de variàncies covariàncies dona 𝑽((X,Y))=(118518518118)

Notes

Plantilla:Referències