Word Error Rate

De testwiki
Salta a la navegació Salta a la cerca

Word Error Rate (WER) és una mesura utilitzada habitualment en l'avaluació de sistemes de reconeixement de la parla o de traducció automàtica.

Calcula el nombre mínim d'insercions, esborrats i substitucions d'una paraula per una altra, necessaris per transformar una frase en una altra. Aquesta mesura es basa en la distància d'edició o de Levensthein, amb l'excepció que aquesta última es calcula a nivell de lletra i WER ho fa a nivell de paraula.

En tasques tant de traducció automàtica com de reconeixement de la parla, es calcula WER entre la frase generada pel sistema i una frase de referència correcta.

WER=S+B+IN

on

  • S és el nombre de substitucions,
  • B és el nombre d'esborrats,
  • I és el nombre d'insercions,
  • N és el nombre de paraules que té la frase de referència.

Per trobar el valor mínim de WER entre dos frases s'utilitza un algorisme de programació dinàmica.

Si considerem que t1,t2...,tn són les primeres i paraules de la frase generada i r1,r2...rn les r primeres de la frase de referència:

WER(i,j)=min{WER(i1,j)+1WER(i,j1)+1WER(i1,j1)+Δ(i,j)

on Δ(i,j) és 1 si les paraules ti i rj són diferents i 0 si són iguals.

Vegeu també