Nucli de funció de base radial

De testwiki
Salta a la navegació Salta a la cerca

En l'aprenentatge automàtic, el nucli de la funció de base radial, o nucli RBF, és una funció real del nucli que s'utilitza en diversos algorismes d'aprenentatge kernelitzats. En particular, s'utilitza habitualment en la classificació de màquines de vectors de suport.[1]

El nucli RBF en dues mostres 𝐱k i x', representat com a vectors de característiques en algun espai d'entrada, es defineix com [2]

K(𝐱,𝐱)=exp(𝐱𝐱22σ2)

𝐱𝐱2 es pot reconèixer com la distància euclidiana al quadrat entre els dos vectors de característiques. σ és un paràmetre lliure. Una definició equivalent implica un paràmetre γ=12σ2 :

K(𝐱,𝐱)=exp(γ𝐱𝐱2)

Com que el valor del nucli RBF disminueix amb la distància i oscil·la entre zero (al límit) i un (quan Plantilla:Math), té una interpretació fàcil com a mesura de semblança. L'espai de característiques del nucli té un nombre infinit de dimensions; per σ=1, la seva expansió utilitzant el teorema multinomial és:

exp(12𝐱𝐱2)=exp(22𝐱𝐱12𝐱212𝐱2)=exp(𝐱𝐱)exp(12𝐱2)exp(12𝐱2)=j=0(𝐱𝐱)jj!exp(12𝐱2)exp(12𝐱2)=j=0n1+n2++nk=jexp(12𝐱2)x1n1xknkn1!nk!exp(12𝐱2)x1n1xknkn1!nk!=φ(𝐱),φ(𝐱)


φ(𝐱)=exp(12𝐱2)(al0(0),a1(1),,al1(1),,a1(j),,alj(j),)

on lj=(k+j1j) ,


al(j)=x1n1xknkn1!nk!|n1+n2++nk=j1llj

Aproximacions

Com que les màquines de vectors de suport i altres models que utilitzen el truc del nucli no s'escalen bé a un gran nombre de mostres d'entrenament o un gran nombre de funcions a l'espai d'entrada, s'han introduït diverses aproximacions al nucli RBF (i a nuclis similars). Normalment, aquests prenen la forma d'una funció z que mapeja un sol vector a un vector de dimensionalitat més alta, aproximant-se al nucli: [3]

z(𝐱),z(𝐱)φ(𝐱),φ(𝐱)=K(𝐱,𝐱)

on φ és el mapeig implícit incrustat al nucli RBF.[4]

Referències

Plantilla:Referències