Funcions de pèrdua per a la classificació

De testwiki
Salta a la navegació Salta a la cerca
(Vermell) estàndard Pèrdua logística (γ=1,μ=2) i (Blau) augment del marge Pèrdua logística (γ=0.2

En l'aprenentatge automàtic i l'optimització matemàtica, les funcions de pèrdua per a la classificació són funcions de pèrdua computacionalment factibles que representen el preu pagat per la imprecisió de les prediccions en problemes de classificació (problemes per identificar a quina categoria pertany una observació particular).[1] Donat 𝒳 com l'espai de totes les entrades possibles (normalment 𝒳d), i 𝒴={1,1} com el conjunt d'etiquetes (sortides possibles), un objectiu típic dels algorismes de classificació és trobar una funció f:𝒳𝒴 que prediu millor una etiqueta y per a una entrada determinada x.[2] Tanmateix, a causa de la informació incompleta, el soroll en la mesura o els components probabilístics en el procés subjacent, és possible que el mateix x per generar diferents y.[3] Com a resultat, l'objectiu del problema d'aprenentatge és minimitzar la pèrdua esperada (també coneguda com a risc), definida com:

I[f]=𝒳×𝒴V(f(x),y)p(x,y)dxdy

on V(f(x),y) és una funció de pèrdua donada, i p(x,y) és la funció de densitat de probabilitat del procés que ha generat les dades, que de manera equivalent es pot escriure com:

p(x,y)=p(yx)p(x).

Dins de la classificació, diverses funcions de pèrdua d'ús habitual s'escriuen únicament en termes del producte de l'etiqueta veritable y i l'etiqueta prevista f(x). Per tant, es poden definir com a funcions d'una sola variable υ=yf(x), i que V(f(x),y)=ϕ(yf(x))=ϕ(υ) amb una funció adequadament escollida ϕ:. Aquestes s'anomenen funcions de pèrdua basades en marges. Escollir una funció de pèrdua basada en el marge equival a triar ϕ. La selecció d'una funció de pèrdua en aquest marc afecta l'òptima fϕ* que minimitza el risc esperat.

Exemples: [4]

Nom de la pèrdua ϕ(v) C(η) f1(v)
Exponencial ev 2η(1η) e2v1+e2v
Logística 1log(2)log(1+ev) 1log(2)[ηlog(η)(1η)log(1η)] ev1+ev
Quadrat (1v)2 4η(1η) 12(v+1)
Salvatge 1(1+ev)2 η(1η) ev1+ev
Tangent (2arctan(v)1)2 4η(1η) arctan(v)+12

Referències

Plantilla:Referències