Funció softmax

De testwiki
La revisió el 23:27, 28 abr 2024 per imported>JoRobot (Robot treu enllaç igual al text enllaçat)
(dif.) ← Versió més antiga | Versió actual (dif.) | Versió més nova → (dif.)
Salta a la navegació Salta a la cerca
Exemple de funció softmax.

La funció softmax, també coneguda com softargmax [1] Plantilla:Rpo funció exponencial normalitzada,[2] Plantilla:Rpconverteix un vector de Plantilla:Mvar nombres reals en una distribució de probabilitat de Plantilla:Mvar possibles resultats. És una generalització de la funció logística a múltiples dimensions, i s'utilitza en regressió logística multinomial. La funció softmax s'usa sovint com l'última funció d'activació d'una xarxa neuronal per normalitzar la sortida d'una xarxa a una distribució de probabilitat sobre classes de sortida predites, basada en l'axioma d'elecció de Luce.[3]

La funció softmax pren com a entrada un vector Plantilla:Mvar de Plantilla:Mvar nombres reals i el normalitza en una distribució de probabilitats que consta de Plantilla:Mvar probabilitats proporcionals a les exponencials dels nombres d'entrada. És a dir, abans d'aplicar softmax, alguns components vectorials podrien ser negatius o superiors a un; i podria no sumar 1; però després d'aplicar softmax, cada component estarà a l'interval (0,1), i els components sumaran 1, de manera que es puguin interpretar com a probabilitats. A més, els components d'entrada més grans correspondran a probabilitats més grans.

La funció estàndard (unitat) softmax σ:K(0,1)K es defineix quan K1 amb la fórmula

σ(𝐳)i=ezij=1Kezj     for i=1,,K and 𝐳=(z1,,zK)K.

En paraules senzilles, aplica la funció exponencial estàndard a cada element zi del vector d'entrada 𝐳 i normalitza aquests valors dividint per la suma de totes aquestes exponencials; aquesta normalització assegura que la suma de les components del vector de sortida σ(𝐳) és 1.

En la teoria de la probabilitat, la sortida de la funció softargmax es pot utilitzar per a representar una distribució categòrica, és a dir, una distribució de probabilitat sobre Plantilla:Mvar diferents resultats possibles.

La funció softmax s'utilitza en diversos mètodes de classificació multiclasse, com ara la regressió logística multinomial (també coneguda com a regressió softmax) [4] Plantilla:Rp[1], anàlisi discriminant lineal multiclasse, classificadors Bayes ingenus i xarxes neuronals artificials.[5] Concretament, en regressió logística multinomial i anàlisi discriminant lineal, l'entrada a la funció és el resultat de Plantilla:Mvar funcions lineals diferents, i la probabilitat prevista per a la classe Plantilla:Mvar a partir d'un vector de mostra Plantilla:Math i un vector de ponderació Plantilla:Math és:

P(y=j𝐱)=e𝐱𝖳𝐰jk=1Ke𝐱𝖳𝐰k

Referències

Plantilla:Referències