Algorisme del gradient descendent

De testwiki
La revisió el 10:11, 9 oct 2024 per 79.155.74.149 (discussió) (ortografia)
(dif.) ← Versió més antiga | Versió actual (dif.) | Versió més nova → (dif.)
Salta a la navegació Salta a la cerca
Il·lustració del gradient descendent d'una funció: els punts apunten al cercle central que és el mínim de la funció

LPlantilla:'algorisme del gradient descendent és un mètode iteratiu d'optimització de primer ordre per a trobar el mínim d'una funció. S'anomena descendent perquè el prenen els increments proporcionals al negatiu del gradient de la funció. Si es prenen increments positius al gradient, s'anomena gradient ascendent.[1][2][3]

Aquest mètode s'empra sovint com una extensió de l'algorisme de retropropagació usat en l'entrenament de xarxes neuronals artificials.

Descripció

El gradient descendent es basa en el fet que si la funció multivariable F(x) està definida i és derivable al voltant d'un punt a, llavors F(x)decreix de la manera més ràpida si es va des del punt a en direcció del gradient negatiu de Fen a, o sigui F(𝐚). Aleshores la seqüència de punts és:

𝐚n+1=𝐚nγF(𝐚n)

o també:

𝐱n+1=𝐱nγnF(𝐱n), n0.

i la seqüència és monotònica descendent:

F(𝐱0)F(𝐱1)F(𝐱2),

Referències

Plantilla:Referències