Independència condicional

De testwiki
Salta a la navegació Salta a la cerca

Plantilla:VT En teoria de la probabilitat, dos esdeveniments aleatoris A i B són condicionalment independents donat un tercer esdeveniment C precisament si l'ocurrència d' A i l'ocurrència de B són esdeveniments independents en la seva distribució de probabilitat condicional donada C. En altres paraules, A i B són independents condicionalment donat C si i només si, tenint en compte que C es produeix, se sap que si es produeix A no proporciona informació sobre la probabilitat que es produeixi B, i el coneixement de si es produeix B no proporciona informació sobre la probabilitat que es produeixi A.

El concepte d'independència condicional es pot estendre des d'esdeveniments aleatoris a variables aleatòries i vectors aleatoris.

Independència condicional dels esdeveniments

Definició

En la notació estàndard de la teoria de la probabilitat, A i B són condicionalment independents C si i només si Pr(ABC)=Pr(AC)Pr(BC). La independència condicional de A i B donat C es denota com (AB)C. Formalment:

Plantilla:Equation box 1

o de forma equivalent,

(AB)CPr(ABC)=Pr(AC)oPr(BC)=1.

Exemples

La discussió sobre StackExchange proporciona un parell d'exemples útils (vegeu la referència).[1]

Caselles de colors

Cada casella representa un possible resultat. Els esdeveniments R, B i Y estan representats per les zones pintades de Plantilla:Font color, Plantilla:Font color i Plantilla:Font color respectivament. La intersecció entre els esdeveniments R i B es pinta de Plantilla:Font color.

Les probabilitats d'aquests esdeveniments són zones ombrejades respecte a l'àrea total. En els dos exemples R i B són condicionalment independents donat Y perquè:

Pr(RBY)=Pr(RY)Pr(BY)[Nota 1]

però no són condicionalment independents donat [no Y] perquè:

Pr(RBno Y)=Pr(Rno Y)Pr(Bno Y)

Clima i retards

Sigui dos esdeveniments que siguin les probabilitats que les persones A i B tornin a casa a temps per sopar i el tercer esdeveniment C és que una tempesta de neu afecti a la ciutat. Si tant A com B tinguessin una menor probabilitat d'arribar a casa a temps per sopar, aquestes probabilitats inferiors encara seran independents les unes de les altres. És a dir, el coneixement que A arriba tard no indica si B arribarà tard (poden viure a diferents barris, recórrer distàncies diferents i utilitzar diferents mitjans de transport). Tanmateix, si es té informació que viuen al mateix barri, utilitzen el mateix transport i treballen al mateix lloc, aleshores els dos esdeveniments NO són condicionalment independents si es veuen afectats per la tempesta de neu.

Suma de daus

La independència condicional depèn de la naturalesa del tercer esdeveniment. Si es llancen dos daus (A i B), es pot suposar que els dos daus es comporten independentment l'un del altre. Si ens fixem en els resultats d'una matriu, no té relació amb l'altra matriu (és a dir, els dos daus són independents). Però si el primer resultat és 3, i algú us explica un tercer esdeveniment C (per exemple, que la suma dels dos resultats sigui parell), aquesta informació addicional restringeix les opcions del segon resultat per a un nombre senar. És a dir, els dos esdeveniments poden ser independents, però NO condicionalment independents.

Alçada i vocabulari dels nens

L'alçada A i el vocabulari B són independents; però no són condicionalment independents si s'afegeix l'edat C.

Independència condicional de variables aleatòries

Dues variables aleatòries X i Y són independents condicionals donada una tercera variable aleatòria Z si i només si són independents en la distribució de probabilitats condicionals que dona Z. Això és, X i Y són condicionalment independents donat Z si i només si, donat qualsevol valor de Z, la distribució de probabilitats de X és el mateix per a tots els valors de Y i la distribució de probabilitats de Y és el mateix per a tots els valors deX. Formalment:

Plantilla:Equation box 1

on FX,YZ=z(x,y)=Pr(Xx,YyZ=z) és la funció de distribució acumulada condicional de X i Y donat Z.

Dos esdeveniments R i B són condicionalment independents donada una σ-àlgebra Σ si

Pr(RBΣ)=Pr(RΣ)Pr(BΣ) a.s.

on Pr(AΣ) denota l'esperança condicional de la funció indicatriu de l'esdeveniment A, χA, donada la σ-àlgebra Σ. Això és,

Pr(AΣ):=E[χAΣ].

Dues variables aleatòries X i Y són condicionalment independents donada una σ-àlgebra Σ si l'equació anterior es manté per a tots R en σ(X)i B en σ(Y).

Dues variables aleatòries X i Y són condicionalment independents donada una variable aleatòria W si són independents, donat σ(W): la σ-àlgebra generada per W. Això s'escriu comunament:

XYW o
XYW

Això es llegeix «X és independent de Y, donat W»; el condicionament s'aplica a tota la declaració: «(X és independent de Y) donat W».

(XY)W

Si W assumeix un conjunt de valors comptable, que equival a la independència condicional de X i Y per als esdeveniments de la forma [W=w].

La independència condicional de més de dos esdeveniments, o de més de dues variables aleatòries, es defineix de manera analògica.

Els dos exemples següents mostren queXY ni implica ni està implicada per (XY)W.

  • Primer, suposem que W=0 amb la probabilitat 0,5 i en cas contrari 1. Quan W=0 agafa X i Y per ser independents, cadascun té el valor 0 amb la probabilitat 0,99 i el valor 1 en cas contrari. Quan W=1, X i Y tornen a ser independents, però aquesta vegada prenen el valor 1 amb la probabilitat 0,99. Aleshores (XY)W. Pero X i Y són dependents, perquè Pr(X=0)<Pr(X=0|Y=0). Això és perquè Pr(X=0)=0.5, però si Y=0 llavors és molt probable que això W=0 i així això X=0 és també així Pr(X=0|Y=0)>0.5.
  • Per al segon exemple, suposem que XY, cadascuna prenent els valors 0 i 1 amb probabilitat 0,5. Fem que W sigui el producte XY. Llavors quan W=0, Pr(X=0)=2/3, però Pr(X=0|Y=0)=1/2, com (XY)W és fals.

Consulteu el tutorial de Kevin Murphy on X i Y agafa els valors «mentals» i «esportius».[2]

Independència condicional de vectors aleatoris

Dos vectors aleatoris 𝐗=(X1,,Xl)T i 𝐘=(Y1,,Ym)T són condicionalment independents donat un tercer vector aleatori 𝐙=(Z1,,Zn)T si i només si són independents en la seva distribució acumulada condicional donada 𝐙. Formalment:

Plantilla:Equation box 1

on 𝐱=(x1,,xl)T, 𝐲=(y1,,ym)T i 𝐳=(z1,,zn)T i les distribucions acumulatives condicionals es defineixen de la manera següent.

F𝐗,𝐘𝐙=𝐳(𝐱,𝐲)=Pr(X1x1,,Xlxl,Y1y1,,YmymZ1=z1,,Zn=zn)F𝐗𝐙=𝐳(𝐱)=Pr(X1x1,,XlxlZ1=z1,,Zn=zn)F𝐘𝐙=𝐳(𝐲)=Pr(Y1y1,,YmymZ1=z1,,Zn=zn)

Usos en inferència bayesiana

Sigui p la proporció de votants que votaran «sí» en un proper referèndum. En fer una enquesta d'opinió, es tria n votants a l'atzar entre la població. Per a i = 1, ..., n, fem Xi = 1 o 0 corresponent, respectivament, a si el votant escollit votarà o no votarà «sí».

En un enfocament de freqüència d'inferència estadística, no s'atribuiria cap distribució de probabilitats a p (tret que les probabilitats es poguessin interpretar d'alguna manera com a freqüències relatives d'ocurrència d'algun esdeveniment o com a proporcions d'alguna població) i es diria que X1, ..., Xn són variables aleatòries independents.

Per contra, en un enfocament bayesià d'inferència estadística, es podria assignar una distribució de probabilitats a p independentment de la inexistència d'alguna interpretació d'aquest tipus de «freqüència», i es deuria interpretar les probabilitats com a graus de creença que p es troba en qualsevol interval a que s'assigna una probabilitat. En aquest model, les variables aleatòries X1, ..., Xn no són independents, però són condicionalment independents atès el valor de p. En particular, si s'observa que un gran nombre de X són iguals a 1, això implicaria una alta probabilitat condicional, atès que l'observació, que p és a prop d'1 i, per tant, una alta probabilitat condicional, donada aquesta observació, que la següent. X a observar serà igual a 1.

Les normes de la independència condicional

De la definició bàsica s'han derivat un conjunt de regles que regulen les declaracions d'independència condicional.[3][4]

  • Nota: ja que aquestes implicacions contenen qualsevol espai de probabilitat, es continuaran mantenint si es considera un subunivers que condiciona tot sobre una altra variable, K. Per exemple, XYYX també voldria dir això XYKYXK.
  • Nota: a continuació, la coma es pot llegir com una «i».

Simetria

XYYX

Decomposició

XA,B i {XAXB

Prova:

  • pX,A,B(x,a,b)=pX(x)pA,B(a,b) (significat de XA,B)
  • BpX,A,B(x,a,b)db=BpX(x)pA,B(a,b)db (ignora la variable B integrant-la)
  • pX,A(x,a)=pX(x)pA(a)

Una prova similar mostra la independència de X i B.

Unió feble

XA,B i {XABXBA

Prova:

  • Per definició, Pr(X)=Pr(XA,B).
  • A causa de la propietat de la descomposició XB, Pr(X)=Pr(XB).
  • Combinant les dues igualitats anteriors dona Pr(XB)=Pr(XA,B), que estableix XAB.

La segona condició es pot demostrar de manera semblant.

Contracció

XABXB} i XA,B

Prova: Aquesta propietat es pot comprovar escrivint Pr(XA,B)=Pr(XB)=Pr(X), cada igualtat de les quals són afirmades per XAB i XB, respectivament.

Contracció - unió feble - descomposició

Combinant els tres anteriors, tenim:

XABXB} i XA,B i {XABXBXBAXA

Intersecció

Per a les distribucions de probabilitats estrictament positives,[4] també es manté el següent:

XAC,BXBC,A} i XB,AC

Les cinc regles anteriors es van anomenar «Axiomes dels grafoides» de Pearl i Paz, perquè contenen gràfics,[5] si XAB s'interpreta com «Tots els camins de X a A són interceptats pel conjunt B».[6]

Notes

  1. Per veure que és així, cal adonar-se’n que Pr(RB | Y) és la probabilitat que superposa R i B (la zona ombrejada de pòrpora) a l'àrea Y. Ja que, a la imatge de l'esquerra, hi ha dos quadrats on R i B es solapen dins de l'àrea Y, i l'àrea Y té dotze quadrats, Pr(RB | Y) = Plantilla:Sfrac = Plantilla:Sfrac. De manera semblant, Pr(R | Y) = Plantilla:Sfrac = Plantilla:Sfrac i Pr(B | Y) = Plantilla:Sfrac = Plantilla:Sfrac

Referències

Plantilla:Referències

Vegeu també

Plantilla:Autoritat