Coeficient kappa de Cohen

El coeficient kappa de Cohen (κ, minúscula grec kappa) és una estadística que s'utilitza per mesurar la fiabilitat entre avaluadors per a ítems qualitatius (categòrics).^[1] En general, es pensa que és una mesura més robusta que el simple càlcul de percentatge d'acord, ja que κ té en compte la possibilitat que l'acord es produeixi per casualitat. Hi ha controvèrsia al voltant del kappa de Cohen a causa de la dificultat d'interpretar els índexs d'acord. Alguns investigadors han suggerit que conceptualment és més senzill avaluar el desacord entre els ítems.^[2]

El kappa de Cohen mesura l'acord entre dos evaluadors que classifiquen cadascun N ítems en categories C mútuament excloents. La definició de $κ$ és ^[3]

$κ \equiv \frac{p_{o} - p_{e}}{1 - p_{e}} = 1 - \frac{1 - p_{o}}{1 - p_{e}},$

on Plantilla:Mvar és l'acord relatiu observat entre els evaluadors i Plantilla:Mvar és la probabilitat hipotètica d'acord d'atzar, utilitzant les dades observades per calcular les probabilitats que cada observador vegi aleatòriament cada categoria. Si els avaluadors estan totalment d'acord, aleshores $κ = 1$ . Si no hi ha cap acord entre els avaluadors diferent del que s'esperaria per casualitat (tal com dona Plantilla:Mvar), $κ = 0$ . És possible que l'estadística sigui negativa,^[4] que pot ocórrer per casualitat si no hi ha relació entre les valoracions dels dos evaluadors, o pot reflectir una tendència real dels qualificadors a donar puntuacions diferents.^[5]

Per a Plantilla:Mvar categories, Plantilla:Mvar observacions per categoritzar i $n_{k i}$ el nombre de vegades que l'evaluador Plantilla:Mvar va predir la categoria Plantilla:Mvar :

$p_{e} = \frac{1}{N^{2}} \sum_{k} n_{k 1} n_{k 2}$

Això es deriva de la següent construcció:

$p_{e} = \sum_{k} \hat{p_{k 12}} = \sum_{k} \hat{p_{k 1}} \hat{p_{k 2}} = \sum_{k} \frac{n_{k 1}}{N} \frac{n_{k 2}}{N} = \frac{1}{N^{2}} \sum_{k} n_{k 1} n_{k 2}$

On $\hat{p_{k 12}}$ és la probabilitat estimada que tant l'evaluador 1 com l'evaluador 2 classifiquen el mateix ítem com a k, mentre que $\hat{p_{k 1}}$ és la probabilitat estimada que l'evaluador 1 classifiqui un element com a k (i de manera similar per a l'evaluador 2). La relació $\hat{p_{k}} = \sum_{k} \hat{p_{k 1}} \hat{p_{k 2}}$ es basa en l'ús de la hipòtesi que la qualificació dels dos evaluadors és independent. El terme $\hat{p_{k 1}}$ s'estima utilitzant el nombre d'ítems classificats com a k pel qualificador 1 ( $n_{k 1}$ ) dividit pel total d'elements a classificar ( $N$ ): $\hat{p_{k 1}} = \frac{n_{k 1}}{N}$ (i de la mateixa manera per a l'avaluador 2).

A la matriu de confusió tradicional 2 × 2 emprada en l'aprenentatge automàtic i les estadístiques per avaluar classificacions binàries, la fórmula Kappa de Cohen es pot escriure com:^[6]

$κ = \frac{2 \times (T P \times T N - F N \times F P)}{(T P + F P) \times (F P + T N) + (T P + F N) \times (F N + T N)}$

on TP són els vertaders positius, FP són els falsos positius, TN són els veritables negatius i FN són els falsos negatius. En aquest cas, el Kappa de Cohen és equivalent a la puntuació d'habilitat de Heidke coneguda a Meteorologia.^[7] La mesura va ser introduïda per primera vegada per Myrick Haskell Doolittle el 1888.^[8]

Referències

Plantilla:Referències

[Mary2012-1] Plantilla:Ref-publicació

[:0-2] Plantilla:Ref-publicació

[3] Plantilla:Ref-web

[4] Plantilla:Ref-publicació

[5] Plantilla:Ref-web

[6] Plantilla:Ref-publicació

[7] Plantilla:Ref-publicació

[8] Plantilla:Ref-llibre

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

Coeficient kappa de Cohen

Referències

Menú de navegació

Cerca