Entropia diferencial

De testwiki
Salta a la navegació Salta a la cerca
Distribució beta d'entropia diferencial per alfa i beta de l'1 al 5.
Distribució beta d'entropia diferencial per alfa i beta de 0,1 a 5.

L'entropia diferencial (també anomenada entropia contínua ) és un concepte en teoria de la informació que va començar com un intent de Claude Shannon d'estendre la idea d'entropia (Shannon), una mesura de la mitjana (sorpresa) d'una variable aleatòria, a distribucions de probabilitat contínues. Malauradament, Shannon no va derivar aquesta fórmula, i més aviat va suposar que era l'anàleg continu correcte de l'entropia discreta, però no ho és.[1] Plantilla:RpLa versió contínua real de l'entropia discreta és la densitat limitant de punts discrets (LDDP). L'entropia diferencial (descrita aquí) es troba habitualment a la literatura, però és un cas límit del LDDP i que perd la seva associació fonamental amb l'entropia discreta.

Pel que fa a la teoria de la mesura, l'entropia diferencial d'una mesura de probabilitat és l'entropia relativa negativa d'aquesta mesura a la mesura de Lebesgue, on aquesta última es tracta com si fos una mesura de probabilitat, tot i no estar normalitzada.

Definició

Deixar X ser una variable aleatòria amb una funció de densitat de probabilitat f el suport dels quals és un conjunt 𝒳 . L' entropia diferencial h(X) o h(f) es defineix com [2] Plantilla:Rp Plantilla:Equation box 1 Per a distribucions de probabilitat que no tenen una expressió de funció de densitat explícita, però tenen una expressió de funció quantil explícita, Q(p), doncs h(Q) es pot definir en termes de la derivada de Q(p) és a dir, la funció de densitat quantil Q(p) com

h(Q)=01logQ(p)dp

Igual que amb el seu analògic discret, les unitats d'entropia diferencial depenen de la base del logaritme, que sol ser 2 (és a dir, les unitats són bits). Vegeu unitats logarítmiques per als logaritmes presos en diferents bases. Els conceptes relacionats com ara conjunt, entropia diferencial condicional i entropia relativa es defineixen de manera similar. A diferència de l'analògic discret, l'entropia diferencial té un desplaçament que depèn de les unitats utilitzades per mesurar X.[3] Plantilla:RpPer exemple, l'entropia diferencial d'una quantitat mesurada en mil·límetres serà Plantilla:Literal més que la mateixa quantitat mesurada en metres; una quantitat adimensional tindrà una entropia diferencial de Plantilla:Literal més que la mateixa quantitat dividida per 1000.

Cal tenir cura en intentar aplicar les propietats de l'entropia discreta a l'entropia diferencial, ja que les funcions de densitat de probabilitat poden ser superiors a 1. Per exemple, la distribució uniforme 𝒰(0,1/2) té entropia diferencial negativa ; és a dir, està millor ordenat que 𝒰(0,1) com es mostra ara

0122log(2)dx=log(2)

sent inferior a la de 𝒰(0,1) que té entropia diferencial zero . Per tant, l'entropia diferencial no comparteix totes les propietats de l'entropia discreta.

Entropies diferencials per a diverses distribucions

A la taula següent Γ(x)=0ettx1dt és la funció gamma, ψ(x)=ddxlnΓ(x)=Γ(x)Γ(x) és la funció digamma, B(p,q)=Γ(p)Γ(q)Γ(p+q) és la funció beta i γ E és la constant d'Euler.[4] Plantilla:Rp

Nom de la distribució Funció de densitat de probabilitat (pdf) Entropia diferencial en nats
Uniforme f(x)=1ba ln(ba)
Normal f(x)=12πσ2exp((xμ)22σ2) ln(σ2πe)
Exponencial f(x)=λexp(λx) 1lnλ
Rayleigh f(x)=xσ2exp(x22σ2) 1+lnσ2+γE2
Beta f(x)=xα1(1x)β1B(α,β) for 0x1 lnB(α,β)(α1)[ψ(α)ψ(α+β)](β1)[ψ(β)ψ(α+β)]
Cauchy f(x)=γπ1γ2+x2 ln(4πγ)
Chi f(x)=22k/2Γ(k/2)xk1exp(x22) lnΓ(k/2)2k12ψ(k2)+k2
Chi-quadrat f(x)=12k/2Γ(k/2)xk21exp(x2) ln2Γ(k2)(1k2)ψ(k2)+k2
Erlang f(x)=λk(k1)!xk1exp(λx) (1k)ψ(k)+lnΓ(k)λ+k
F f(x)=n1n12n2n22B(n12,n22)xn121(n2+n1x)n1+n22 lnn1n2B(n12,n22)+(1n12)ψ(n12)(1+n22)ψ(n22)+n1+n22ψ(n1+n22)
Gamma f(x)=xk1exp(xθ)θkΓ(k) ln(θΓ(k))+(1k)ψ(k)+k
Laplace f(x)=12bexp(|xμ|b) 1+ln(2b)
Logistic f(x)=ex/ss(1+ex/s)2 lns+2
Lognormal f(x)=1σx2πexp((lnxμ)22σ2) μ+12ln(2πeσ2)
Maxwell–Boltzmann f(x)=1a32πx2exp(x22a2) ln(a2π)+γE12
Generalized normal f(x)=2βα2Γ(α2)xα1exp(βx2) lnΓ(α/2)2β12α12ψ(α2)+α2
Pareto f(x)=αxmαxα+1 lnxmα+1+1α
Student's t f(x)=(1+x2/ν)ν+12νB(12,ν2) ν+12(ψ(ν+12)ψ(ν2))+lnνB(12,ν2)
Triangular f(x)={2(xa)(ba)(ca)for axc,2(bx)(ba)(bc)for c<xb, 12+lnba2
Weibull f(x)=kλkxk1exp(xkλk) (k1)γEk+lnλk+1
Multivariate normal fX(x)=exp(12(xμ)Σ1(xμ))(2π)N/2|Σ|1/2 12ln{(2πe)Ndet(Σ)}

Referències

Plantilla:Referències