Índex de Jaccard

De testwiki
Salta a la navegació Salta a la cerca

L'índex de Jaccard és una mesura de semblança entre dues particions d'objectes (per exemple, entre les categories resultants d'aplicar dos métodes de categorització).

Definició

Sigui un conjunt de n objectes O={o1,,on}, i dues particions Π={π1,,πr} i Π={π'1,,π'r} del conjunt d'objectes.

Aleshores, si definim

r': correspon al nombre de parells (a,b) on a i b es troben en un mateix grup tant a la partició Π com a la partició Π.

s: correspon al nombre de parells (a,b) on a i b es troben en un mateix grup de Π però no de Π.

t: correspon al nombre de parells (a,b) on a i b es troben en grups diferents de Π però en canvi es troben en el mateix grup de Π.

l'índex de Jaccard correspon al quocient:

rr+s+t

Vegeu també