Teorema del límit central

De testwiki
La revisió el 18:01, 12 gen 2025 per imported>Langtoolbot (Bot: suficientment gran>prou gran)
(dif.) ← Versió més antiga | Versió actual (dif.) | Versió més nova → (dif.)
Salta a la navegació Salta a la cerca

En matemàtiques, el Teorema del límit central (o Teorema central del límit) diu que la distribució de la suma estandarditzada de variables aleatòries independents amb variància finita tendeix a una distribució normal estàndard quan el nombre de termes de la suma creix indefinidament. Com a conseqüència d'aquest teorema, s'explica el fet que moltes variables aleatòries siguin aproximadament normals i justifica la importància teòrica i pràctica de la distribució normal.

Aquest teorema, pertanyent a la Teoria de la probabilitat, troba aplicació en molts camps relacionats, com ara l'Estadística inferencial o la Teoria de renovació.

Teorema

Enunciat

Existeixen diverses versions del teorema (segons les hipòtesis escollides). L'enunciat més simple és aquest:

Teorema de Lindeberg-Lévy:

Donada una successió (Xn)n de variables aleatòries (*={1,2,}) independents i idènticament distribuïdes (abreujadament i.i.d.), amb variància finita, es posa:μ=E(Xn)iσ=Var(Xn),on se suposa que σ>0.

Si es defineix per a tot n:

Xn=X1++Xnn i
Xn=XnE(Xn)Var(Xn)=Xnμσ/n,(variable aleatòria estandarditzada associada a Xn), aleshores la successió (Xn)n convergeix en distribució cap a una variable aleatòria normal estàndard, Xn*\limits 𝒟𝒩(0,1).

Altrament dit: t,limn(Xnt)=Φ(t). (Vegeu límit d'una successió),

on Φ és la funció de la distribució normal estàndard 𝒩(0,1): per a tot nombre t,

 Φ(t)=12πteu22du.Remarques:

1. L'expressió variable aleatòria normalitzada vol dir que és una variable amb esperança 0 i variància 1. Concretament,

E[Xn*]=0iVar(Xn*)=1.
2. Un enunciat lleugerament diferent (però equivalent) és aquest, amb les mateixes hipòtesis: Si es defineix per a tot n:

Sn=X1++XniSn=SnE(Sn)Var(Sn)=Snnμσn, (Sn* és la variable aleatòria estandarditzada associada a Sn), aleshores la successió (Sn)n convergeix en distribució cap a una variable aleatòria normal estàndard.

Altrament dit: t,

limn(Snt)=Φ(t).

En efecte, és clar que per a tot n, Sn=Xn.

3. Atès que la funció de distribució Φ és contínua, per a s<t tenim limn(sXnt)=limn(s<Xnt)=limn(s<Xn<t)=limn(sXn<t)=Φ(t)Φ(s).

Interpretació

En estadística, el teorema del límit central s'interpreta i s'utilitza així: sigui X1, X2, ..., Xn una mostra aleatòria de mida n d'una distribució amb mitjana μ i variància σ² finites (σ ≠ 0).

Llavors, si n és prou gran (una condició freqüent és: n30):

  • la variable aleatòria X=1ni=1nXi (mitjana mostral) té aproximadament una distribució (o llei) normal amb mitjana μX=μ i variància σX2=σ2/n. Es diu que X és asimptòticament normal [1] amb mitjana μ i variància σ2/n, i s'escriu Xnés𝒜𝒩(μ,σ2n).
  • També es compleix que la variable aleatòria Sn=X1++Xn té aproximadament una distribució normal amb mitjana μS=nμ i variància σS2=nσ2 ; amb la notació anteriorSnés𝒜𝒩(nμ,nσ2).

Com més gran sigui el valor de n, millor serà l'aproximació. L'aproximació entre les dues distribucions és, en general, major en el centre que en els extrems o cues, motiu pel qual s'anomena "Teorema del límit central" ("central" fa referència al límit de la successió estandarditzada, més que no al teorema).

Importància pràctica

Aquesta propietat d'aproximació té aplicacions pràctiques importants. Sovint, no es coneix la distribució "exacta" d'una variable aleatòria, però es pot aproximar per una distribució normal; fins i tot quan es coneix la distribució exacta, pot resultar més senzill aproximar-la per una distribució normal — sempre que sigui justificat; vegeu més avall el Teorema de De Moivre-Laplace.

Demostració del teorema de Lindeberg-Lévy

Per demostrar aquest teorema, s'utilitzen les funcions característiques i el teorema de continuïtat de Lévy.

Plantilla:Caixa desplegable

Exemple

Basat en un exemple de Richard Durrett.[2] Considerem una ruleta europea (és a dir, amb els nombres del 0 al 36; la ruleta americana utilitza, a més, el 00). Estudiarem l'aposta més senzilla que consisteix a apostar 10 € que sortirà un nombre parell; el zero no es considera ni parell ni senar. Si surt un nombre parell (2,4,,36), el jugador guanya 10 € i si surt un nombre senar o el zero, aleshores perd 10 €. El joc és favorable al casino, perquè el 0 desequilibra les apostes: és més probable obtenir 0 o senar (19 resultats favorables) que parell (18 resultats favorables) . Quantifiquem probabilísticament els guanys i pèrdues del jugador i del casino. Suposem un jugador que està jugant diverses partides, i designem per X1 el guany o la pèrdua de la primera partida, per X2 el corresponent a la segona, i així successivament. Tenim una successió X1,X2,, de variables aleatòries independents, i totes amb la mateixa distribució: Xi={10,amb probabilitat  1837(surt parell),10,amb probabilitat  1939(surt 0 o senar).L'esperança d'aquestes variables és E(Xi)=101837101937=10370,27.D'acord amb la llei dels grans nombres,

limn1ni=1nXi=0,27 quasi segurament.Això vol dir que si el jugador juga n vegades (n gran), pot tenir bona sort unes quantes partides, però, si insisteix, en mitjana haurà perdut aproximadament 0,27 € per partida. Més concretament, si, posem, juga 100 partides, aleshores haurà perdut, aproximadament, 27 €. Amb les notacions anteriors, si escrivimSn=i=1nXi,tenim S10027 euros.

Amb ajuda del teorema del límit central podem estimar la probabilitat que el jugador, després de 100 partides, no hagi perdut diners, (S1000). Amb aquest objectiu, necessitem calcular la desviació típica σ de Xi. Tenim que E(Xi2)=1021837+(10)21937=100, d'on σ2=E(Xi2)(E(Xi))2=100(1037)2=99,97.

Així, σ=99,9710.Aleshores, normalitzant la variable S100, S100100μσ100=S100+27100.Llavors, (S1000)=(S100+2710027100)=(S100+271000,27)1Φ(0,27)0,39.(Per calcular aquest nombre s'utilitzen unes taules de la llei normal estàndard). Per tant, aproximadament el 39% de persones que juguen 100 partides guanyen alguna cosa, o, d'una altra manera, al contrari, el 61 % dels jugadors, després de 100 partides, perden diners.

De la mateixa manera podem calcular que la probabilitat que guanyi 200 € és (S100200)=(S100+27100200+27100)=(S100+271002,27)1Φ(2,27)0,01.

i així, és pràcticament impossible que el jugador guany 200 €, que no seria guany excessiu, ja que per apostar 100 cops 10 € necessita un bon capital (tenint en compte que a vegades guanya i a vegades perd).

D'altra banda, si ara considerem el casino, que té diverses taules de ruleta i nombrosos jugadors a cada taula, quan s'han fet 10000 jugades, el guany total dels jugadors serà S10000. Repetim els càlculs anteriors i calculem la probabilitat que S10000700 : (S10000700)=(S10000+27001010000700+27001010000)=(S10000+270010100002)Φ(2)0,98.Així, el casino, de forma lenta però pràcticament segura, haurà guanyat almenys 700 €.

Il·lustració gràfica

Una densitat de probabilitat

Densitat de probabilitat inicial

La densitat de probabilitat f1 representada aquí és discontínua i no té cap simetria. Si una variable aleatòria segueix la distribució definida per aquesta densitat, aleshores la seva mitjana és 0 i la seva variància és 1.

Considerem aquí variables aleatòries independents i idènticament distribuïdes X1, X2, X3 ... que segueixen la distribució definida per aquesta densitat.

Plantilla:Clear

Densitat de la suma de dues variables

Suma de dues variables aleatòries

Després determinem la densitat f2 de S2=X1+X2 (per convolució de f1 per f1).

La densitat de probabilitat representada és la de la variable aleatòria estandarditzada S2 associada a S2.

Aquesta densitat ja és més regular (més "llisa") que la densitat inicial. Tanmateix, s'hi veuen punts angulosos.

Plantilla:Clear

Densitat de la suma de tres variables

Suma de tres variables aleatòries

Després determinem la densitat f3 de S3=X1+X2+X3 (per convolució de f1 per f2).

La densitat de probabilitat representada és la de la variable aleatòria estandarditzada S3 associada a S3.

Aquesta densitat és encara més regular que la precedent.

Plantilla:Clear

Densitat de la suma de quatre variables

Suma de quatre variables aleatòries

Finalment, determinem la densitat f4 de S4=X1+X2+X3+X4 (per convolució de f1 per f3).

La densitat de probabilitat representada és la de la variable aleatòria estandarditzada S4 associada a S4.

A ull nu, no es pot distingir aquesta densitat de la densitat normal estàndard. Plantilla:Clear

Cas particular: el teorema de De Moivre-Laplace

Aquest cas particular del teorema del límit central en va ser històricament la primera atestació.

S'enuncia així:

Sigui una successió (Xn)n de variables aleatòries de Bernoulli independents amb paràmetre (comú) p, on 0<p<1. Per a tot n,

E(Xn)=p i Var(Xn)=p(1p) són finites.

Llavors, el teorema del límit central és aplicable. En aquest cas, Sn=X1++Xn és una variable aleatòria binomial de paràmetres n i p, i per tant, amb esperança np i variància np(1p). Aleshores, si designem per B(n,p) una distribució binomial de paràmetres n i p, amb les noacions que hem introduit abans,

B(n,p)és𝒜𝒩(np,np(1p)).Remarques:

  1. Aquesta aproxiamció s'acepta per a np(1p)>18. La qualitat de l'aproximació millora amb la simetria de la funció de probabilitat de la binomial: com més propera sigui p a 1/2, millor serà l'aproximació.
  2. Correcció per continuïtat. Siguin ab dos nombres naturals. A l'utilitzar l'aproximació normal per calcular (aB(n,p)b)) es recomana canviar l'interval [a,b] per (a05,b+05), en altres paraules, per n gran, (aB(n,p)b))Φ((b+05np)/np(1p))Φ((a05np)/np(1p)).
    Quan l'aproximació es fa d'aquesta manera es diu que s'ha fet una correcció per continuïtat.
  3. De Moivre va estudiar el cas de les variables aleatòries de Bernoulli amb paràmetre p=1/2 (joc de cara o creu) l'any 1714 i Laplace el va generalitzara qualsevol p l'any 1812 .
  4. Si n és prou gran, la variable aleatòria Xn té aproximadament una distribució normal amb mitjana  p i variància p(1p)n. En estadística inferencial, es pot utilitzar aquesta aproximació per construir intervals de confiança per a una proporció desconeguda p .

Aplicació: simulació de la distribució normal estàndard

Sigui una successió (Xn)n de variables aleatòries independents i idènticament distribuïdes amb distribució uniforme contínua sobre l'interval [0, 1]. Se sap que per a tot n,

E(Xn)=12 i Var(Xn)=112 són finites.

El teorema del límit central és aplicable. Si es defineix per a tot n:

Sn=X1++Xn i
Tn=Sn=SnE(Sn)Var(Sn)=Snn2n12,

aleshores la successió (Tn)n convergeix en distribució cap a una variable aleatòria normal estàndard. Tenint en compte la simetria de la distribució uniforme contínua sobre l'interval [0, 1], la convergència és molt ràpida: es considera que a partir del valor n = 12, l'aproximació de la distribució de Tn per la distribució normal estàndard és excel·lent; en particular, es pot considerar que la distribució de

T12=S126=X1++X126

és pràcticament normal estàndard.

En un llenguatge de programació on existeix un generador de nombres pseudoaleatoris (sovint anomenat "random") simulant una variable aleatòria amb distribució uniforme contínua sobre l'interval [0, 1], és fàcil simular una variable aleatòria (pràcticament) normal estàndard. Heus aquí un algorisme en Pascal:

T := - 6.0;
for k := 1 to 12 do T : = T + random;

La variable T, que simula la variable aleatòria T12, és (pràcticament) normal estàndard.

Contraexemple quan no existeix l'esperança

En totes les versions del teorema del límit central, se suposa l'existència de la variància (finita) de cadascuna de les variables aleatòries de la successió.

Sigui una successió (Xn)n de variables aleatòries independents i idènticament distribuïdes amb distribució de Cauchy simètrica 𝒞(0,γ); no tenen ni mitjana ni variància.

Aleshores, per a tot n, la variable aleatòria

Xn=X1++Xnn

segueix la mateixa distribució de Cauchy 𝒞(0,γ) que cadascuna de les variables aleatòries X1,X2, (és fàcil demostrar-ho mitjançant les funcions característiques): no hi ha convergència cap a una distribució normal.

Teorema del límit central multidimensional

Sigui (𝑿n)n* una successió de vectors aleatoris independents i idènticament distribuïts, tals que totes les components tinguin variància finita, amb vector d'esperances μ i matriu de variàncies covariàncies Σ. Aleshores n(1ni=1n𝑿iμ)\limits 𝒟𝒩(0,Σ),on 𝒩(0,Σ) és una distribució normal multidimensional centrada amb matriu de variàncies covariàncies Σ.[3]

Bibliografia

  • De Moivre (Abraham) — The Doctrine of Chances, or a Method of Calculating the Probabilities of Events in Play. — London, 1756
  • Laplace (Pierre-Simon) — Théorie analytique des probabilités. — Paris, 1812
  • Feller (William)An Introduction to Probability Theory and Its Applications. (vol. 2) — New York, 1971. John Wiley & Sons

Referències

Plantilla:Referències

Enllaços externs

Plantilla:Commonscat

Plantilla:Autoritat

  1. Una successió de variables aleatòries Y1,Y2, tal que (Ynmn)/rn convergeix en distribució a una variable normal estàndard es diu que és asimptòticament normal i s'escriu Yn és 𝒜𝒩(mn,rn2). Vegeu Serfling, R. J., Approximation theorems of mathematical statistics, Wiley, 1980,isbn=0-471-02403-1, pàgina 20}}
  2. Plantilla:Ref-llibre
  3. Plantilla:Ref-llibre