Prova de raó de versemblança

De testwiki
Salta a la navegació Salta a la cerca

En estadística, una prova de raó de versemblança és un test estadístic per comparar la bondat de l'ajust de dos models, un dels quals (el model nul o hipòtesi nul·la) és un cas especial de l'altre (el model alternatiu o hipòtesi alternativa). La prova es basa en la raó de versemblança, que expressa quantes vegades és més probable que les dades estiguin en un model que a l'altre. Aquesta raó de versemblança, o equivalentment el seu logaritme, es pot utilitzar per calcular un valor p, o comparar-la amb un valor crític per decidir si es rebutja el model nul a favor del model alternatiu. Quan s'utilitza el logaritme de la raó de versemblança, hom diu que l'estadístic és un estadístic de raó de log-versemblança, i la distribució de probabilitat d'aquest test estadístic, suposant que el model nul és cert, es pot aproximar emprant el teorema de Wilks.

En el cas de distingir entre dos models, on cap dels dos no té cap paràmetre, es pot justificar l'ús del la prova de raó de versemblança segons el lema de Neyman-Pearson, que demostra que tal prova té el poder més gran de tots els competidors.Plantilla:Sfn

Definició

Hipòtesi simple

Plantilla:Article principal Sovint, un model estadístic és una família paramètrica de funcions de densitat de probabilitat o de funcions de probabilitat f(x|θ). Un test d'hipòtesi "simple contra simple" té models completament especificats tant per la hipòtesi nul·la com per la hipòtesi alternativa, que, per convenció, s'escriuen en termes de valors fixats d'un paràmetre notacional θ:

H0:θ=θ0,H1:θ=θ1.

Cal notar que, sota cada hipòtesi, la distribució de les dades està completament especificada; no hi ha paràmetres desconeguts que calgui estimar. La prova de raó de versemblança en basa en la raó de versemblança, denotat per Λ (la lletra majúscula lambda de l'alfabet grec). La raó de versemblança es defineix de la següent manera:Plantilla:SfnPlantilla:Sfn

Λ(x)=L(θ0|x)L(θ1|x)=f(ixi|θ0)f(ixi|θ1)

o

Λ(x)=L(θ0x)sup{L(θx):θ{θ0,θ1}},

on L(θ|x) és la funció de versemblança, i sup és la funció suprem. Cal notar que algunes referències bibliogràfiques poden emprar el recíproc en la definició.Plantilla:Sfn En la forma indicada en aquest article, la raó de versemblança és petita si el model alternatiu és millor que el model nul, i el test de raó de versemblança proporciona la següent regla de decisió:

Si Λ>c, no rebutjar H0;
Si Λ<c, rebutjar H0;
Rebutjar amb probabilitat q si Λ=c.

Hom escull els valors de c i de q per tal d'obtenir un cert nivell de significació, mitjançant la relació:

qP(Λ=c|H0)+P(Λ<c|H0)=α.

El lema de Neyman-Pearson afirma que aquest test de raó de versemblança és el més poderós entre tots els tests amb nivell α per a aquest problema.Plantilla:Sfn

Hipòtesi composta

Sovint s'estableix una hipòtesi nul·la dient que el paràmetre θ es troba en un subconjunt especificat Θ0 de l'espai de paràmetres Θ.

H0:θΘ0H1:θΘ0

La funció de versemblança és L(θ|x)=f(x|θ) (la funció de densitat de probabilitat o la funció de probabilitat), que és una funció del paràmetre θ amb x fixat al valor observat, és a dir, les dades. LPlantilla:'estadístic del test de raó de versemblança és:Plantilla:Sfn

Λ(x)=sup{L(θx):θΘ0}sup{L(θx):θΘ}

on sup representa la funció suprem.

Una prova de raó de versemblança és qualsevol prova amb una regió crítica (o regió de refús) de la forma {x|Λc}, on c és qualsevol nombre que satisfaci 0c1. Molts tests estadístics, com el test Z, el test F, la prova de khi-quadrat de Pearson i el test G són proves per a models compostos, i es poden expressar en termes de raons de log-versemblança o en aproximacions a aquest cas.

Interpretació

La raó de versemblança és un estadístic, ja que és una funció de les dades x. La prova de raó de versemblança rebutja la hipòtesi nul·la si el valor d'aquest estadístic és massa petit. El significat precís de «petit» depèn del nivell de significació de la prova, és a dir, de quanta probabilitat d'error de tipus I es considera tolerable (els errors de "tipus I" consisteixen en el rebuig d'una hipòtesi nul·la que és certa).

El numerador correspon a la màxima versemblança d'un resultat observat sota la hipòtesi nul·la. El denominador correspon a la màxima versemblança d'un resultat observat quan es varien els paràmetres sobre tot l'espai de paràmetres. El numerador d'aquesta raó és menor que el denominador; per tant, la raó de versemblança és un valor situat entre 0 i 1. Els valors petits de la raó de versemblança signifiquen que el resultat observat era menys probable de succeir sota la hipòtesi nul·la que sota la hipòtesi alternativa. Els valors alts de l'estadístic signifiquen que el resultat observat està prop de ser tant probable de succeir sota la hipòtesi nul·la com de succeir sota la hipòtesi alternativa, i llavora no es pot rebutjar la hipòtesi nul·la.

El test de raó de versemblança necessita models niats: és a dir, models en els quals un de més complex es pot transformar en un de més simple, tot imposant un conjunt de restriccions sobre els paràmetres. Si els models no són niats, llavors es pot fer servir una generalització de la prova de raó de versemblança: la versemblança relativa.

Plantilla:ÀncoraDistribució: teorema de Wilks

Si la distribució de la raó de versemblança corresponent a unes certes hipòtesis nul·la i alternativa es pot determinar explícitament, llavors es pot utilitzar directament per a configurar regions de decisió (per tal d'acceptar o de rebutjar la hipòtesi nul·la). Tanmateix, en la majoria de casos, és molt difícil determinar la distribució exacta de la raó de versemblança corresponent a unes hipòtesis específiques. Un resultat de Samuel Wilks afirma que, conforme la grandària de la mostra n tendeix a infinit, el test estadístic 2log(Λ) per a un model niat tindrà asimptòticament una distribució χ2 amb un nombre de graus de llibertat igual a la diferència de les dimensions de Θ i de Θ0.Plantilla:Sfn Això significa que, per a una gran quantitat d'hipòtesis, hom pot calcular la raó de versemblança Λ per a les dades, i comparar 2log(Λ) amb el valor χ2 corresponent a una significació estadística desitjada, com a test estadístic aproximat.

Extensions

El teorema de Wilks assumeix que els valors reals, però desconeguts, dels paràmetres estimats pertanyen a l'interior de l'espai de paràmetres. Això acostuma a no complir-se, per exemple, en models d'efectes aleatoris o mixtos quan un dels components de la variància és negligible en relació amb els altres. En alguns d'aquests casos, un component de la variància és essencialment zero en comparació amb els altres, o bé els models no estan niats adequadament. Pinheiro i Bates van demostrar que la distribució real d'aquest estadístic khi quadrat de la raó de versemblança pot ser substancialment diferent d'una χ2 pura, i de vegades completament diferent.Plantilla:Sfn Aquestes suposicions podrien donar probabilitats de significació (valors p) que fossin massa grans en mitjana en alguns casos i excessivament petits en d'altres.

En general, per comprovar els efectes aleatoris, recomanen utilitzar el mètode anomenat "Versemblança màxima restringida (Plantilla:En Restricted maximum likelihood, REML). Per tal de comprovar els efectes fixos, «un test de raó de versemblança per ajustos REML no és possible, perquè» si es canvia l'especificació dels efectes fixos, es canvia també el significat dels efectes mixtos i, per tant, el model restringit no està niat amb el model més gran.Plantilla:Sfn

Van simular proves igualant una i dues variàncies dels efectes aleatoris a zero. En aquests exemples en particular, els valors p simulats amb k restriccions s'ajustaven per igual a una combinació de χ2(k) i χ2(k1) (amb k = 1, χ2(0) és 0 amb probabilitat 1. Això significa que una bona aproximació era 0,5χ2(1)).

Pinheiro i Bates també van simular proves amb diferents efectes ficos. En un test d'un factor amb 4 nivells (graus de llibertat = 3), van trobar que una combinació 50-50 de χ2(3) i χ2(4) era un ajust bo per als valors p reals obtinguts mitjançant simulació, i que l'error quan s'emprava χ2(3) “no era gaire alarmant.Plantilla:Sfn Tanmateix, en un altre test amb un factor de 15 nivells, van trobar un ajust raonable a χ2(18), 4 graus més de llibertat que els 14 que hom obtindria a partir d'una aplicació directa (i inadequada) del teorema de Wilks, i a més, el valor p simulat era diverses vegades el valor directe de χ2(14).” Van concloure que, per tal de comprovar els efectes fixos, és convenient utilitzar la simulació (addicionalment, van implementar una funció “simulate.lme” en el seu paquet “nlme” per S-PLUS i R que hi donava suport).

En resum, aquestes limitacions del teorema de Wilks no neguen les propietats del poder d'un test de raó de versemblança concret, només l'ús d'una distribució χ2 per avaluar la seva significació estadística.

Aplicacions

Cadascun dels dos models competidors, el model nul i el model alternatiu, està ajustat de manera separada a les dades i a la log-versemblança registrada. El test estadístic (sovint simbolitzat per D) és el doble del logaritme de la raó de les versemblances, és a dir, és el doble de la diferència de les log-versemblances:

D=2ln(versemblança pel model nulversemblança pel model alternatiu)=2ln(versemblança pel model alternatiuversemblança pel model nul)=2×[ln(versemblança pel model alternatiu)ln(versemblança pel model nul)]

El model amb més paràmetres (aquí, lPlantilla:'alternatiu) sempre estarà, com a mínim, tan ben ajustat –és a dir, té la mateixa o més gran log-versemblança– com el model amb menys paràmetres (aquí el nul). Per tal de determinar si l'ajust és significativament millor i, per tant, per decidir si és el model preferit, cal derivar la probabilitat o valor p de la diferència D. Quan la hipòtesi nul·la representa un cas especial de la hipòtesi alternativa, la distribució de probabilitat de l'estadístic és aproximadament una distribució khi quadrat amb un nombre de graus de llibertat igual a dfadfn,Plantilla:Sfn on dfa representa el nombre de graus de llibertat del model alternatiu i dfn representa el nombre de graus de llibertat del model nul.

A continuació es presenta un exemple d'ús. Si el model nul té 1 paràmetre i una log-versemblança de −8024, i el model alternatiu té 3 paràmetres i una log-versemblança de −8012, llavors la probabilitat d'aquesta diferència és la d'un valor khi quadrat de 2×(8012(8024))=24 amb 31=2 graus de llibertat, i és igual a 6×106. Cal fer certes suposicionsPlantilla:Sfn per tal que l'estadístic segueixi una distribució khi quadrat, i sovint es calculen valors p de manera empírica.

Exemples

Llençament d'una moneda

Un exemple, en el cas del test de Pearson, és comparar dues monedes per determinar si tenen la mateixa probabilitat de sortir "cara". Les observacions es poden plantejar en una taula de contingència, on les files representen cadascuna de les monedes, i les columnes corresponen a "cara" o "creu". Els elements de la taula de contingència seran el nombre de vegades que la moneda d'aquella fila ha tret cara o creu. El contingut d'aquesta taula són les observacions Plantilla:Mvar.

XCaraCreuMoneda 1k1Hk1TMoneda 2k2Hk2T

Aquí, Θ consisteix en les combinacions possibles de valors dels paràmetres p1H, p1T, p2H i p2T, que són la probabilitat que els llençaments de les monedes 1 i 2 resultin en cara o en creu. Denotem i=1,2 i j=H,T. L'espai d'hipòtesi Plantilla:Mvar està restringit per les restriccions habituals d'una distribució de probabilitat, 0pij1 i piH+piT=1. L'espai de la hipòtesi nul·la H0 és el subespai on p1j=p2j. Si s'escriu nij per als millors valors de pij sota la hipòtesi Plantilla:Mvar, l'estimació màxim versemblant ve donat per:

nij=kijkiH+kiT.

De la mateixa manera, les estimacions màxim versemblants de pij sota la hipòtesi nul·la H0 és:

mij=k1j+k2jk1H+k2H+k1T+k2T,

que no depèn de la moneda Plantilla:Mvar.

Les hipòtesis es poden reescriure lleugerament, de tal manera que satisfacin les restriccions per tal que el logaritme de la raó de versemblança tingui una certa distribució desitjada. Com que les restriccions provoquen que l'espai bidimensional Plantilla:Mvar es redueixi a un espai unidimensional H0, la distribució asimptòtica del test serà χ2(1), la distribució χ2 amb un grau de llibertat.

Per a la taula de contingència general, hom pot escriure l'estadístic de raó de log-versemblança com:

2logΛ=2i,jkijlognijmij.

Referències

Plantilla:Referències

Bibliografia

Enllaços externs