Distribució normal

De testwiki
Salta a la navegació Salta a la cerca

Plantilla:Infotaula distribució de probabilitat

La distribució normal, també coneguda com a distribució gaussiana, és una important família de distribucions de probabilitat contínues i és aplicable a molts camps. Cada membre de la família queda definit per dos paràmetres: la localització o mitjana μ i l'escala o desviació estàndard σ, i es denota per  𝒩(μ,σ2). Un cas particular és la distribució normal estàndard, per la qual la mitjana és 0 i la desviació estàndard és 1. Fou Carl Friedrich Gauss qui descobrí la distribució normal quan analitzava dades astronòmiques, i definí l'equació de la seva funció de densitat de probabilitat.[1] Aquesta distribució també s'anomena campana de Gauss, atès que el gràfic de la seva funció de densitat de probabilitat s'assembla a una campana.

La importància de la distribució normal en les ciències naturals i del comportament rau en el teorema central del límit. Aquest teorema estableix que la suma d'un elevat nombre d'efectes independents segueix (aproximadament) una distribució normal. D'aquesta manera, és útil en processos en els quals hi ha errors de mesura que es deuen a un elevat nombre de factors, tots ells contribuint una petita porció a l'error total. En la teoria de probabilitat i d'inferència estadística, el teorema central del límit garanteix que un llarg nombre d'estadístics segueixen la distribució normal, si més no aproximadament. Per exemple, la mitjana mostral o els estimadors màxim versemblants segueixen aproximadament una distribució normal sota certes condicions matemàtiques que són força generals.[2]

Funció de densitat de probabilitat

f(x;μ,σ)=1σ2πe(xμ)22σ2=1σϕ(xμσ)

on σ és la desviacio estàndard, μ és l'esperança matemàtica, i

ϕ(x)=12πe12x2

és la funció de densitat de probabilitat de la distribució normal estàndard, és a dir, la distribució normal amb μ = 0 i σ = 1. Per comprovar que la integral de φ(x) sobre la recta real és igual a 1 vegeu la integral de Gauß.[3][4]

Funció de distribució

La funció de distribució d'una distribució normal 𝒩(μ,σ2) és F(x;μ,σ)=xf(t;μ,σ)dt=1σ2πxe(tμ)2/(2σ2)dt,x.Per a una distribució normal estàndard 𝒩(0,1) s'acostuma a utilitzar la notació Φ(x) per designar la seva funció de distribució. Concretament, Φ(x)=F(x;0,1)=12πxet2/2dt,x.Cal notar que F(x;μ,σ)=Φ(xμσ).

(Vegeu mes avall l'apartat sobre estandardització de variables normals).Plantilla:SfnPlantilla:Sfn

Es important remarcar que la funció de distribució no és pot expressar en termes de funcions elementals (polinomis, exponencials, funcions trigonomètriques,..) Vegeu un comentari sobre la demostració d'aquesta propietat a l'article.[5] Per aquest motiu, de cara a la utilització pràctica de les distribucions normals i els càlculs numèrics corresponents, les aproximacions a la funció de distribució són molt importants i s'han utilitzat tècniques d'integració numèrica, sèries de Taylor, sèries asimptòtiques o fraccions contínues. Vegeu Patel and Read per una revisió d'aquestes aproximacions.[6]

Funcions generadores

Funció generadora de moments

La funció generadora de moments es defineix com a l'esperança matemàtica de exp(tX). Per la distribució normal la funció generadora de moments és:Plantilla:Sfn

MX(t)=E[exp(tX)]=1σ2πexp((xμ)22σ2)exp(tx)dx=exp(μt+σ2t22).

Funció característica

La funció característica es defineix com a l'esperança matemàtica de exp(itX), on i és el nombre imaginari, i t és un nombre real. Per la distribució normal la funció característica és:Plantilla:SfnPlantilla:Sfn

φX(t)=E[eitX]=1σ2πexp((xμ)22σ2)exp(itx)dx=exp(iμtσ2t22).

Propietats

Algunes propietats:

  1. Si X𝒩(μ,σ2) i a i b són nombres reals, aleshores aX+bN(aμ+b,(aσ)2) (veure esperança i variància).[7]
  2. Si X𝒩(μX,σX2) i Y𝒩(μY,σY2) són variables aleatòries normals independents, aleshores:[8][7]
    • La seva suma segueix la distribució normal amb U=X+Y𝒩(μX+μY,σX2+σY2).
    • La seva diferència segueix una distribució normal amb V=XY𝒩(μXμY,σX2+σY2).
    • U i V són independents si i només si σX=σY.
    • La divergència de Kullback-Leibler,[9] DKL(XY)=12(log(σY2σX2)+σX2σY2+(μYμX)2σY21).
  3. Si X𝒩(0,σX2) i Y𝒩(0,σY2) són variables aleatòries normals independents, aleshores:[8]
  4. Si X1,,Xn són variables aleatòries independents idènticament distribuïdes amb distribució normal estàndard, aleshores X12++Xn2 segueix una distribució khi quadrat amb n graus de llibertat.[10]

Estandardització de variables aleatòries normals

Com a conseqüència de la propietat 1, és possible relacionar totes les variables aleatòries normals amb la distribució normal estàndard; aquest procediment s'anomena estandardització d'una variable normal.

Si  X𝒩(μ,σ2), aleshores

Z=Xμσ

és una variable aleatòria normal estàndard:  Z𝒩(0,1). Una conseqüència important és que la funció de distribució de  X és :

F(x;μ,σ)=Pr(Xx)=Φ(xμσ),

on Φ és la funció de distribució normal estàndard: per a tot real t,

 Φ(t)=tϕ(u)du=t12πeu22du=12(1+erf(t2)).

D'altra banda, si Z és una variable aleatòria normal estàndard,  Z𝒩(0,1), aleshores

X=σZ+μ

és una variable aleatòria normal amb esperança μ i variància σ2.

La funció de distribució normal estàndard Φ ha estat tabulada, i les altres funcions de distribució normals en són simples transformacions, tal com hem explicat anteriorment. Per tant, un pot emprar valors tabulats de la funció de distribució normal estàndard per a trobar el valor de la funció de distribució de qualsevol altra distribució normal.

Moments

Alguns dels primers moments de la distribució normal són:

Número Moment Moment central Cumulant
0 1 1
1 μ 0 μ
2 μ2+σ2 σ2 σ2
3 μ3+3μσ2 0 0
4 μ4+6μ2σ2+3σ4 3σ4 0

Tots els cumulants de la distribució normal a partir del segon són zero.

Moments d'una variable normal centrada

Per a les variables aleatòries normals centrades tenim la següent fórmula per als moments de qualsevol ordre. Si Z𝒩(0,1) aleshores [11] E[Zk]={0,si k és senar,(2n)!2nn!,si k=2n. Notem que (2n)!2nn!=(2n1)!2n1(n1)!=(2n1)(2n3)1=(2n1)!!=(k1)!!, on m!! denota el doble factorial de m. Així, de forma més compacta podem escriure E[Zk]={0,si k és senar,(k1)!!,si k és parell.


Alternativament, usant la relació del doble factorial amb la funció gamma, per a k parell, (k1)!!=2k/2πΓ(k+12),on Γ(x) és la funció gamma.

De la fórmula pels moments de Z és dedueix que si X𝒩(0,σ2), aleshores

E[Xk]={0,si k és senar,(k1)!!σk,si k és parell.

Cas general

Sigui  X𝒩(μ,σ2), i designem per mk=E[Xk] el moment d'ordre k . Aleshores [12] mk=σkk!j=0[k/2](μ/σ)k2j2jj!(k2j)!,on [r] designa la part entera del nombre r.

Recurrència pels moments d'una variable normal


Amb les notacions anteriors tenim [12]mk+1=μmk+kσ2mk1,k1.(*)

Expressió compacta dels moments


Suposem que σ=1. Aleshores mk=eμ2/2dkeμ2/2dμk,on dnf(x)/dxn designa la derivada d'ordre n-èssim de la funció f, amb el conveni d0f(x)/dx0=f(x) . Aquesta fórmula és demostra mitjançant la regla de Leibniz per provar que la funció Pk(μ)=eμ2/2dkeμ2/2dμk,compleix la recurrència (*), amb P0(μ)=1 i P1(μ)=μ.[13]

Referències

Plantilla:Referències

Bibliografia

Vegeu també

Plantilla:Commonscat Plantilla:Viccionari-lateral

Plantilla:Distribucions de probabilitat Plantilla:Autoritat