Relació pic de senyal a soroll

De testwiki
Salta a la navegació Salta a la cerca

La relació de senyal de pic a soroll (PSNR per les seves sigles en anglès) és un terme que designa la relació entre el màxima potència possible d'un senyal i la potència del soroll que el corromp i que afecta la fidelitat de la seva representació. Donat que molts senyals tenen un rang dinàmic molt ampli, la PSNR se sol expressar en una escala logarítmica, i s'expressa en decibels. Un dels usos de la PSNR és la quantificació de la qualitat de la reconstrucció d'imatge i vídeo sotmesos en el cas de compressió amb pèrdua.

Definició

La PSNR es pot definit utilitzant l'error quadràtic mig (MSE). Donada una imatge lliure de soroll I de m×n pixels, i la seva aproximació amb soroll K, el MSE es defineix com:

𝑀𝑆𝐸=1mni=0m1j=0n1[I(i,j)K(i,j)]2.

La PSNR (en dB) es defineix com:

𝑃𝑆𝑁𝑅=10log10(𝑀𝐴𝑋I2𝑀𝑆𝐸)=20log10(𝑀𝐴𝑋I𝑀𝑆𝐸)=20log10(𝑀𝐴𝑋I)10log10(𝑀𝑆𝐸).

on, MAXI és el màxim valor possible per un píxel de la imatge. Quan els valors dels píxels de la imatge es representen amb nombres enters de 8 bits, aquest valor és 255. De forma més genèrica, quan les mostres es representen utilitzant PCM lineal amb B bits per píxel, MAXI és 2B − 1.

Ús en imatges en color

Per a imatges en color en RGB, la definició de la PSNR és la mateixa excepte que el MSE és la suma de totes les diferències de valor al quadrat (ara per a cada color, és a dir, tres vegades més diferències que en una imatge monocroma) dividida per la mida de la imatge i per tres. Alternativament, per a les imatges en color en altres models de color (per exemple, YCbCr o HSV), s'informa de la PSNR en cada canal d'aquest espai de color.[1][2]

Estimació de la qualitat amb PSNR

La PSNR s'utilitza habitualment per mesurar la qualitat de la reconstrucció dels algorismes de compressió amb pèrdua (p. ex., per a compressió d'imatges). El senyal en aquest context són les dades originals, i el soroll és l'error introduït per la compressió. En aquest cas, la PSNR és una "aproximació" a la percepció humana de la qualitat de la reconstrucció.

Els valors típics del PSNR en compressió amb pèrdua d'imatge o de vídeo estan entre 30 i 50 dB, sempre que la profunditat de bits sigui de 8 bits, on valors més alts indiquen millor qualitat. La qualitat de les imatges de 12 bits es considera alta quan el valor de la PSNR és de 60 dB o més.[3][4] For 16-bit data typical values for the PSNR are between 60 and 80 dB.[5][6] Es consideren valors acceptables per transmissió sense fils els que van entre 20 dB i 25 dB.[7][8]

En absència de soroll, les dues imatges I i K són idèntiques i, per tant, el MSE és zero. En aquest cas, la PSNR és infinita.[9]

Plantilla:Imatge múltiple

Comparació de rendiment

Tot i que una PSNR més alt en general indica que la reconstrucció és de millor qualitat, en alguns casos pot ser que no sigui així. S'ha de tenir molta cura amb el rang de validesa d'aquesta mètrica; només és vàlid de manera concloent quan s'utilitza per comparar resultats del mateix còdec (o tipus de còdec) i el mateix contingut.[10]

En general, s'ha demostrat que la PSNR té un rendiment baix en comparació amb altres mètriques de qualitat quan es tracta d'estimar la qualitat de les imatges i especialment dels dels vídeos tal com la perceben els humans.[10][11]

Variants

La PSNR-HVS[12] és una extensió de la PSNR que incorpora propietats del sistema visual humà com ara la percepció del contrast.

La PSNR-HVS-M millora el PSNR-HVS tenint en compte addicionalment l'emmascarament visual[13] En un estudi de 2007, va oferir millors aproximacions dels judicis de qualitat visual humana que PSNR i que l'SSIM per un gran marge. També es va demostrar que tenia un avantatge sobre DCTune i PSNR-HVS.[14]

Referències

Plantilla:Referències

Vegeu també

  1. Plantilla:Ref-web
  2. Plantilla:Ref-web
  3. Plantilla:Ref-publicació
  4. Plantilla:Ref-publicació
  5. Plantilla:Ref-llibre
  6. Plantilla:Ref-llibre
  7. Thomos, N., Boulgouris, N. V., & Strintzis, M. G. (2006, January). Optimized Transmission of JPEG2000 Streams Over Wireless Channels. IEEE Transactions on Image Processing, 15 (1).
  8. Xiangjun, L., & Jianfei, C. Robust transmission of JPEG2000 encoded images over packet loss channels. ICME 2007 (pp. 947-950). School of Computer Engineering, Nanyang Technological University.
  9. Plantilla:Ref-llibre
  10. 10,0 10,1 Plantilla:Ref-publicació
  11. Plantilla:Ref-publicació
  12. Egiazarian, Karen, Jaakko Astola, Nikolay Ponomarenko, Vladimir Lukin, Federica Battisti, and Marco Carli (2006). "New full-reference quality metrics based on HVS." In Proceedings of the Second International Workshop on Video Processing and Quality Metrics, vol. 4.
  13. Plantilla:Ref-publicació
  14. Plantilla:Citar ref