Distribució gamma

De testwiki
La revisió el 15:12, 9 gen 2025 per imported>EVA3.0 (bot) (Puntuació (vegeu, per exemple, https://www.uoc.edu/portal/ca/servei-linguistic/criteris/ortografia/puntuacio/index.html))
(dif.) ← Versió més antiga | Versió actual (dif.) | Versió més nova → (dif.)
Salta a la navegació Salta a la cerca
Plantilla:Distribució de probabilitat

En la teoria de la probabilitat i l'estadística, la distribució gamma és una família de distribucions contínues amb dos paràmetres que inclouen com a casos particulars moltes distribucions importants, com la distribució exponencial, khi quadrat o Erlang. Té un paràmetre d'escala θ i un paràmetre de forma k. Si k és un nombre sencer aleshores la distribució representa la suma de k variables aleatòries exponencials, cadascuna de les quals té mitjana θ. La referència bàsica d'aquest article és Johnson et al.Plantilla:Sfn.

Funció de densitat i parametritzacions

Hi ha dues parametritzacions diferents de la distribució gamma. La primera[1] utilitza un paràmetre d'escala θ(0,) i un paràmetre de forma k(0,), i és àmpliament utilitzada tant en Estadística com en Probabilitats; a més, és la més habitual en el programari estadístic.[2] La funció de densitat és

Plantilla:Equation box 1

on Γ(k) és la funció gamma. Si X és una variable aleatòria amb aquesta distribució, s'escriu XΓ(k,θ) o XGamma(k,θ) .


La segona parametrització utilitza un paràmetre d'escala inversa, que també s'anomena paràmetre de taxa (rate parameter), β(0,), β=1/θ, i el paràmetre de forma α=k(0,). Aquesta parametrització també s'utilitza molt, per exemple en teoria de la probabilitat [3] o en Estadística bayesiana.[4] La funció de densitat, amb aquesta parametrització és f(x;α,β)={βαΓ(α)xα1eβx,si x>0,0,si x0.


En aquest article utilitzarem la primera parametrització.

Funció de distribució

F(x;k,θ)={1Γ(k)γ(k,xθ),si x00,si x<0,on γ(k,x) és la funció gamma incompleta inferior.

Propietat d'escala

Sigui XΓ(k,θ). Aleshores per qualsevol c>0, tenim que cXΓ(k,cθ). Aquesta propietat es comprova calculant la funció de densitat de cX.

En particular, si XΓ(k,θ), aleshores XθΓ(k,1) i, recíprocament, si YΓ(k,1), aleshores θYΓ(k,θ); Johnson et alPlantilla:Sfn anomenen distribució gamma estàndard a la distribució Γ(k,1).

En termes de les funcions de densitat tenim la relacióf(x;k,θ)=1θf(xθ;k;1), que és una de les característiques dels paràmetres d'escala.

La propietat d'escala permet reduir diverses propietats (per exemple el càlcul dels moments) a casos més senzills.

Moments

La distribució gamma té moments de tots els ordres. Si XΓ(k,θ), aleshores per a n1,

Plantilla:Equation box 1


En particular, E[X2]=θ2k(k+1), d'on Var(X)=E[X2](E[X])2=θ2k.

Plantilla:Equation box 1


Plantilla:Caixa desplegable


Funció generatriu de moments i funció característica

La distribució gamma Γ(k,θ) té funció generatriu de moments en una semirecta que conté el zero: M(t)=1(1θt)k,t(,1θ).


Plantilla:Caixa desplegable


La funció característica és [3] φ(t)=1(1iθt)k=exp{klog(1iθt)},t, on log és la branca principal del logaritme, és a dir, amb la part imaginària a (π,π) .

Caràcter reproductiu

Si X1Γ(k1,θ) i X2Γ(k2,θ) independents, aleshores X1+X2Γ(k1+k2,θ); és diu que la distribució Γ(k,θ) és reproductiva[5] respecte el paràmetre k . Aquesta propietat es demostra utilitzant les funcions característiques (o les funcions generatrius de moments) de X1 i X2.


Més generalment, si X1,,Xn són independents, XiΓ(ki,θ) , aleshores i=1nXiΓ(i=1nki,θ). .

La distribució gamma és infinitament divisible

La distribució gamma Γ(k,θ) és infinitament divisible (o infinitament descomposable),[6] això és, sigui XΓ(k,θ), aleshores per a qualsevol enter n1, existeixen (en algun espai de probabilitat) variables aleatòries X1,,Xn independents i idènticament distribuïdes tals que X =𝒟 X1++Xn,on =𝒟 indica la igualtat en distribució o llei. Aquí cal prendre XiΓ(k/n,θ), i=1,,n .

La representació de Lévy-Khintchine[7] de la funció característica és φ(t)=exp{k0(eitx1)ex/θxdx}. Per tant, la mesura de Lévy té densitat g(x)=kex/θx,x>0, i la part gaussiana i la deriva (drift) són zero (vegeu Sato [8] per a les definicions d'aquests termes).

Aproximació de la distribució gamma per la distribució normal

En aquest apartat suposarem que el paràmetre k és un nombre natural. Sigui XkΓ(k,1), aleshores, com conseqüència del teorema central de límit, Xkkk 𝒟k 𝒩(0,1).(Vegeu les notacions a convergència de variables aleatòries.) En altres paraules, per a k gran, Xk és aproximadament normal 𝒩(k,k) .

Plantilla:Caixa desplegable

Però aquesta aproximació a la distribució normal és molt lenta i el següent resultat dona una aproximació més ràpida: Sigui XkΓ(k,1). Aleshores 2(Xkk14) 𝒟k 𝒩(0,1). És a dir, per a k gran, Xk és aproximadament normal 𝒩(k14,14).[9]

Plantilla:Caixa desplegable



Altres propietats

Família exponencial

La distribució gamma pertany a la família exponencial de dos paràmetres i té paràmetres naturals k1 i 1/θ, i estadístics naturals X i ln(X).

Moda

Quan k1, la funció de densitat de la distribució Γ(k,θ) té un únic màxim al punt θ(k1); és diu que aquest valor és la moda de la distribució i que la distribució és unimodal. El valor del màxim és (k1)k1e(k1)/(θΓ(k)), que per la fórmula de Stirling, per a valors grans de k es pot aproximar per 1/(θ2π(k1)).[10]

Quan k(0,1), aleshores la densitat no està afitada, ja que, en aquest cas, limx0+f(x;k,θ)=.

Entropia

L'entropia ve donada per

1θkΓ(k)0xk1ex/θ[(k1)lnxx/θklnθlnΓ(k)]dx
=[(k1)(lnθ+ψ(k))kklnθlnΓ(k)]
=k+lnθ+lnΓ(k)+(1k)ψ(k)

on ψ(k) és la funció digamma.

Divergència Kullback-Leibler

La divergència Kullback-Leibler entre una Γ(α0, β0) (la distribució veritable) i una Γ(α, β) (la distribució que l'aproxima) ve donada per

DKL(α,β||α0,β0)=log(Γ(α0)β0α0Γ(α)βα0)+(αα0)ψ(α)+αββ0β0

Transformada de Laplace

La transformada de Laplace de la distribució gamma és:

F(s)=βα(s+β)α

Estimació dels paràmetres

Màxima versemblança

La funció de versemblança per a N observacions iid (x1,,xN) és

L(θ)=i=1Nf(xi;k,θ)

de la qual podem calcular la log-versemblança

(θ)=(k1)i=1Nln(xi)xi/θNkln(θ)NlnΓ(k).

L'estimador màxim-versemblant s'obté maximitzant la log-versemblança, és a dir, calculant-ne la derivada i igualant a zero (es pot demostrar que la funció és convexa i que per tant té un sol extrem). Procedint d'aquesta manera trobem que:

θ^=1kNi=1Nxi.

Substituint aquest resultat a l'expressió de la log-versemblança dona

=(k1)i=1Nln(xi)NkNkln(xikN)Nln(Γ(k)).

Per trobar el màxim respecte de k cal calcular la derivada i igualar-la a zero, amb què s'obté:

ln(k)ψ(k)=ln(1Ni=1Nxi)1Ni=1Nln(xi)

on

ψ(k)=Γ(k)Γ(k)

és la funció digamma. No existeix cap fórmula tancada per a k, però la funció es comporta bé numèricament (és convex) i, per tant, és senzill trobar-ne una solució numèrica, per exemple amb el mètode de Newton. És possible trobar un valor inicial per a k emprant el mètode dels moments, o emprant l'aproximació

ln(k)ψ(k)1k(12+112k+2).

Si definim

s=ln(1Ni=1Nxi)1Ni=1Nln(xi),

aleshores k és aproximadament

k3s+(s3)2+24s12s

que és dins d'un 1,5% del valor correcte.

Estimador Bayesià

Si considerem que k és conegut i θ és desconegut, la funció de densitat a posteriori per a θ és (assumint que la distribució a priori és proporcional a 1/θ)

P(θ|k,x1,...,xN)1/θi=1Nf(xi;k,θ).

Definint

yi=1Nxi,P(θ|k,x1,,xN)=C(xi)θNk1ey/θ.

Per tal de calcular l'esperança cal calcular la integral respecte &theta, el qual pot dur-se a terme emprant un canvi de variables que revela que 1/&theta segueix una distribució gamma amb paràmetres α=Nk,  β=y.

0θNk1+mey/θdθ=0xNk1mexydx=y(Nkm)Γ(Nkm).

Els moments podem calcular-se especificant diferents valors per a m a la següent expressió

E(xm)=Γ(Nkm)Γ(Nk)ym,

Per exemple, l'esperança +/- la desviació estàndard de la distribució a posteriori de θ és:

yNk1 +/- y2(Nk1)2(Nk2).

També és possible obtenir estimadors Bayesians sense assumir que k és conegut, però en general no és possible obtenir-ne una expressió senzilla.

Generació de valors d'una distribució gamma

Tenint en compte la propietat d'escala esmentada anteriorment, és suficient generar una variable gamma amb β = 1 i després transformar-la a qualsevol altre valor de β amb una simple divisió.

Emprant el fet que una distribució Γ(1, 1) és el mateix que una distribució exponencial Exp(1), i tenint en compte el mètode per generar variables aleatòries exponencials, arribem a la conclusió que si U prové d'una distribució uniforme en (0, 1], aleshores -ln(U) segueix una Γ(1, 1). Emprant la propietat de què la suma de variables aleatòries gamma independents segueix novament una distribució gamma, extenem el resultat:

k=1nlnUkΓ(n,1),

on Uk són uniformement distribuïdesen (0, 1] i independents.

Tanmateix aquesta estratègia només funciona si n és un nombre sencer. Ara veurem com generar observacions d'una Γ(δ, 1) per a 0 < δ < 1, ja que després podem aplicar la propietat de la suma per al cas 1 < &delta.

A continuació presenten un algoritme, sense demostració. Es tracta d'un cas particular del mètode d'acceptació-rebuig:

  1. Sigui m= 1.
  2. Generar V2m1 i V2m — independents i uniformement distribuïdes a (0, 1].
  3. Si V2m1v0, on v0=ee+δ, aleshores anar a 4, altrament anar a 5.
  4. Sigui ξm=V2m11/δ, ηm=V2mξmδ1. Anar a 6.
  5. Sigui ξm=1lnV2m1, ηm=V2meξm.
  6. Si ηm>ξmδ1eξm, aleshores incrementar m i tornar a 2.
  7. Assumim que ξ=ξm és l'observació d'una Γ(δ,1)

Per resumir,

θ(ξi=1[k]lnUi)Γ(k,θ),

on [k] és la part sencera de k, i ξ ha estat generat emprant l'algoritme que hem presentat δ = {k} (la part fraccional de k), Uk i Vl segueixen la distribució explicada anteriorment i són independents.

La Llibreria científica GNU disposa de rutines robustes per a generar observacions de moltes distribucions, incloent la distribució Gamma.

Distribucions relacionades

Casos particulars

  • Si XΓ(k=1,θ=1/λ), aleshores X segueix una distribució exponencial amb paràmetre λ.
  • Si XΓ(k=v/2,θ=2), aleshores X és idènticament distribuïda a una χ²(ν), la distribució khi-quadrat amb ν graus de llibertat.
  • Si k és un nombre sencer, la distribució gamma es denomina distribució d'Erlang que serveix per a modelar el temps d'arribada fins a la k-ena "arribada" en un procés de Poisson d'una dimensió amb intensitat 1/θ.

Altres

  • Si X segueix una Γ(k, θ) aleshores 1/X segueix una distribució gamma inversa amb paràmetres k i θ-1.
  • Si X i Y són Γ(α, θ) i Γ(β, θ) independents, respectivament, aleshores X / (X + Y) segueix una distribució beta amb paràmetres α i β.
  • Si Xi són Γ(αi,θ) independents, aleshores el vector (X1 / S, ..., Xn / S), on S = X1 + ... + Xn, segueix una distribució de Dirichlet amb paràmetres α1, ..., αn.

Distribució gamma amb tres paràmetres

Johnson et al.Plantilla:Sfn introdueixen la distribució gamma amb tres paràmetres: a més dels paràmetres de forma i escala k,θ(0,), consideren un paràmetre de posició γ; la distribució ve definida per la funció de densitat f(x;k,θ,γ)={1θkΓ(k)(xγ)k1e(xγ)/θ,si x>γ,0,si xγ.


Notes

Plantilla:Referències

Bibliografia

  • Hogg, R. V. and Craig, A. Introduction to Mathematical Statistics, 4th edition. Nova York: Macmillan, 1978. (Vegeu la secció 3.3.)
  • Plantilla:Ref-llibre
  • Choi, S. C: and R. Wette, R. (1969) Maximum Likelihood Estimation of the Parameters of the Gamma Distribution and Their Bias, Technometrics, 11(4) 683-69

Enllaços externs

Plantilla:Distribucions de probabilitat Plantilla:Autoritat