Màquina vectorial de rellevància

De testwiki
Salta a la navegació Salta a la cerca

En matemàtiques, una màquina vectorial de rellevància (RVM) és una tècnica d'aprenentatge automàtic que utilitza la inferència bayesiana per obtenir solucions parsimonioses per a la regressió i la classificació probabilística.[1] El RVM té una forma funcional idèntica a la màquina vectorial de suport, però proporciona una classificació probabilística.[2]

En realitat és equivalent a un model de procés gaussià amb funció de covariància:

k(𝐱,𝐱)=j=1N1αjφ(𝐱,𝐱j)φ(𝐱,𝐱j)

on φ és la funció del nucli (generalment gaussiana), αj són les variàncies de l'a priori sobre el vector pes wN(0,α1I), i 𝐱1,,𝐱N són els vectors d'entrada del conjunt d'entrenament.[3]

En comparació amb les màquines de vectors de suport (SVM), la formulació bayesiana de la RVM evita el conjunt de paràmetres lliures de la SVM (que normalment requereixen post-optimitzacions basades en validació creuada). Tanmateix, els RVM utilitzen un mètode d'aprenentatge semblant a la maximització de les expectatives (EM) i, per tant, corren el risc de tenir mínims locals. Això és a diferència dels algorismes estàndard basats en l'optimització mínima seqüencial (SMO) utilitzats per les SVM, que es garanteixen trobar un òptim global (del problema convex).[4]

La màquina vectorial de rellevància va ser patentada als Estats Units per Microsoft (la patent va caducar el 4 de setembre de 2019).

Referències

Plantilla:Referències