Desigualtat de Gibbs

De testwiki
La revisió el 23:56, 17 des 2023 per imported>InternetArchiveBot (Add 1 book for Viquipèdia:Verificabilitat (20231217)) #IABot (v2.0.9.5) (GreenC bot)
(dif.) ← Versió més antiga | Versió actual (dif.) | Versió més nova → (dif.)
Salta a la navegació Salta a la cerca
Josiah Willard Gibbs

En teoria de la informació, la desigualtat de Gibbs és una declaració sobre l'entropia de la informació d'una distribució de probabilitat discreta. Moltes altres cotes en l'entropia de les distribucions de probabilitat deriven de la desigualtat de Gibbs, inclosa la desigualtat de Fano. Va ser presentada per primer cop per J. Willard Gibbs en el segle XIX.

Desigualtat de Gibbs

Sigui

P={p1,,pn}

una distribució de probabilitat discreta. Llavors per qualsevol altra distribució de probabilitat

Q={q1,,qn}

La desigualtat següent entre quantitats positives (des de pi i qi és entre zero i un) controls:[1]Plantilla:Rp

i=1npilogpii=1npilogqi

amb igualtat si i només si

pi=qi

per tot i. En paraules, l'entropia de Shannon d'una distribució P és menor o igual a la seva entropia creuada amb qualsevol altra distribució Q.

La diferència entre dues quantitats és la divergència de Kullback-Leibler o l'entropia relativa, així doncs també es pot escriure la desigualtat com:[2]Plantilla:Rp

DKL(PQ)i=1npilogpiqi0.

Noti's que l'ús de logaritmes de base 2 és opcional i que permet referir-se a la quantitat en cada costat de la desigualtat com la quantitat d'informació en bits.

Demostració

Per simplicitat, s'utilitza el logaritme natural (ln), ja que

loga=lnaln2,

El logaritme en particular que s'utilitzi només escala la relació.

Sigui I el conjunt de tots els índexs i pels quals pi és diferent a zero. Llavors, com que lnxx1 per tot x > 0, amb igualtat si i només si x=1, es té:

iIpilnqipiiIpi(qipi1)=iIqi+iIpi=iIqi+10

L'última desigultat és una conseqüència del fet que pi i qi formen part d'una distribució de probabilitat. En particular, la suma de tots els valors diferents de zero és 1. Alguns termes no-zeros qi, tanmateix, poden haver estat exclosos ja que la tria d'índexs depèn dels termes pi diferents a zero. Per tant, la suma dels qi pot ser inferior a 1.

Fins aquí, en el conjunt d'índexs I, es té:

iIpilnqipi0,

o equivalentment

iIpilnqiiIpilnpi.

Tots dos sumatoris poden ser estesos a tots els índexs i=1,,n, és a dir, incloent pi=0, recordant que l'expressió plnp tendeix a 0 a mesura que p tendeix a 0, i (lnq) tendeix a a mesura que q tendeix a 0. S'arriba a

i=1npilnqii=1npilnpi

Per tal que hi hagi igualtat, cal que

  1. qipi=1 per tot iI perquè apliqui l'igualtat lnqipi=qipi1,
  2. i iIqi=1 que significa que qi=0 si iI, és a dir, qi=0 si pi=0.

Això pot passar si i només si pi=qi per i=1,,n.

Demostracions alternatives

Alternativament, el resultat pot ser demostrat usant la desigualtat de Jensen, la desigualtat de la suma de logaritmes, o el fet que la divergència de Kullback-Leibler és una forma de divergència de Bregman. A continuació es mostra una demostració basada en la desigualtat de Jensen:

Com que el logaritme és una funció còncava, es té que:

ipilogqipilogipiqipi=logiqi0

On la primera desigualtat és deguda a la desigualtat de Jensen, i la darrera igualtat és deguda a la mateixa raó que es dona en la demostració principal, més amunt.

A més, com que log és estrictament còncava, per la condició d'igualtat de la desigualtat de Jensen es té igualtat com

q1p1=q2p2==qnpn

i

iqi=1

Suposi's que aquest ràtio és σ, llavors es té que

1=iqi=iσpi=σ

On s'ha usat el fet que p,q són distribucions de probabilitat. Per tant, la igualtat es dona quan p=q.

Corol·lari

L'entropia de P és fitada per:[1]Plantilla:Rp

H(p1,,pn)logn.

La demostració és trivial - agafi's qi=1/n per tot i.

Vegeu també

Referències

Plantilla:Referències