Mètodes d'aprenentatge de gradient proximal

De testwiki
Salta a la navegació Salta a la cerca

Els mètodes d'aprenentatge de gradient proximal (divisió cap endavant cap enrere) són una àrea d'investigació en l'optimització i la teoria de l'aprenentatge estadístic que estudia algorismes per a una classe general de problemes de regularització convex on la penalització de regularització pot no ser diferenciable. Un d'aquests exemples és 1 regularització (també coneguda com Lasso) de la forma

minwd1ni=1n(yiw,xi)2+λw1, on xid i yi.

Els mètodes de gradient proximal ofereixen un marc general per resoldre problemes de regularització a partir de la teoria de l'aprenentatge estadístic amb penalitzacions que s'adapten a una aplicació de problema específica.[1][2] Aquestes penalitzacions personalitzades poden ajudar a induir una certa estructura en les solucions de problemes, com ara l'esparsa (en el cas de lazo) o l'estructura de grup (en el cas de lasso de grup).

Els mètodes de gradient proximal són aplicables en una gran varietat d'escenaris per resoldre problemes d'optimització convex de la forma

minxF(x)+R(x),

on F és convex i diferenciable amb el gradient continu de Lipschitz, R és una funció semicontinua inferior convexa que possiblement no és diferenciable, i és un conjunt, normalment un espai de Hilbert. El criteri habitual de x minimitza F(x)+R(x) si i només si (F+R)(x)=0 a la configuració convexa, diferenciable ara es substitueix per

0(F+R)(x),

on φ denota el subdiferencial d'una funció convexa de valor real φ .

Donada una funció convexa φ: un operador important a tenir en compte és el seu operador proximal proxφ: definit per

proxφ(u)=argminxφ(x)+12ux22,

que està ben definit per l'estricta convexitat de la 2 norma. L'operador proximal es pot veure com una generalització d'una projecció.[3][4][5] Veiem que l'operador de proximitat és important perquè x* és un minimitzador del problema minxF(x)+R(x) si i només si

x*=proxγR(x*γF(x*)), on γ>0 és qualsevol nombre real positiu.[6]

Referències

Plantilla:Referències