Desigualtat en el tractament de dades

De testwiki
La revisió el 06:06, 27 jul 2024 per imported>Paucabot (Afegida Categoria:Teoria de la informació usant HotCat)
(dif.) ← Versió més antiga | Versió actual (dif.) | Versió més nova → (dif.)
Salta a la navegació Salta a la cerca

En matemàtiques i informàtica, la desigualtat en el tractament de dades (DPI, de l'anglès Data Processing Inequality) és un concepte de teoria de la informació que estableix que el contingut d'informació d'un senyal no es pot augmentar mitjançant una operació reiterativa local. Això es pot expressar de manera concisa com "el postprocessament no pot produir nova informació".[1] Està molt relacionat amb el terme GIGO (garbage in, garbage out), que estipula que d'un input degenerat només en pot sorgir un output tant o més degenerat.[2]

Aquest concepte ha guanyat pes amb l'aparició de processos de computació d'aprenentatge automàtic, com és el cas de l'entrenament de models d'intel·ligència artificial. Així, un model entrenat amb dades generades a partir d'un altre model no pot obtenir informació nova; al llarg d'aquest procés la qualitat dels models disminueix fins a obtenir resultats corromputs.[3][4]

La desigualtat en el tractament de dades està estretament relacionada amb les inferències bayesianes.[5] L'aparició d'inferències a partir de resultats incomplets afecta a la predicció de nous resultats, que ràpidament acaben col·lapsant el sistema.[2]

Declaració

Es defineixen tres variables aleatòries que formen la cadena de Markov XYZ, el que implica que la distribució condicional de Z depèn només de Y i és condicionalment independent de X . Concretament, tenim aquesta cadena de Markov si la funció de massa de probabilitat conjunta es pot escriure com

p(x,y,z)=p(x)p(y|x)p(z|y)=p(y)p(x|y)p(z|y)

En aquesta configuració, el no processament Y, sigui de forma determinista o aleatòria, pot augmentar la informació que Y conté sobre X . Utilitzant la informació mútua, això es pot escriure com :

I(X;Y)I(X;Z),

amb la igualtat I(X;Y)=I(X;Z) si i només si I(X;YZ)=0 . És a dir, Z i Y contenen la mateixa informació sobre X, i XZY també forma una cadena de Markov.[6]

Demostració

Es pot aplicar la regla de la cadena per a la informació mútua per obtenir dues descomposicions diferents de I(X;Y,Z) :

I(X;Z)+I(X;YZ)=I(X;Y,Z)=I(X;Y)+I(X;ZY)

Per la relació XYZ, sabem que X i Z són condicionament independents, donada Y, que implica la informació mútua condicional, I(X;ZY)=0 . Aleshores, la desigualtat de processament de dades se segueix de la no-negativitat de I(X;YZ)0.

Referències

Plantilla:Referències