Màquina vectorial de rellevància

En matemàtiques, una màquina vectorial de rellevància (RVM) és una tècnica d'aprenentatge automàtic que utilitza la inferència bayesiana per obtenir solucions parsimonioses per a la regressió i la classificació probabilística.^[1] El RVM té una forma funcional idèntica a la màquina vectorial de suport, però proporciona una classificació probabilística.^[2]

En realitat és equivalent a un model de procés gaussià amb funció de covariància:

$k (𝐱, 𝐱^{'}) = \sum_{j = 1}^{N} \frac{1}{α_{j}} φ (𝐱, 𝐱_{j}) φ (𝐱^{'}, 𝐱_{j})$

on $φ$ és la funció del nucli (generalment gaussiana), $α_{j}$ són les variàncies de l'a priori sobre el vector pes $w \sim N (0, α^{- 1} I)$ , i $𝐱_{1}, \dots, 𝐱_{N}$ són els vectors d'entrada del conjunt d'entrenament.^[3]

En comparació amb les màquines de vectors de suport (SVM), la formulació bayesiana de la RVM evita el conjunt de paràmetres lliures de la SVM (que normalment requereixen post-optimitzacions basades en validació creuada). Tanmateix, els RVM utilitzen un mètode d'aprenentatge semblant a la maximització de les expectatives (EM) i, per tant, corren el risc de tenir mínims locals. Això és a diferència dels algorismes estàndard basats en l'optimització mínima seqüencial (SMO) utilitzats per les SVM, que es garanteixen trobar un òptim global (del problema convex).^[4]

La màquina vectorial de rellevància va ser patentada als Estats Units per Microsoft (la patent va caducar el 4 de setembre de 2019).

Referències

Plantilla:Referències

[1] Plantilla:Ref-publicació

[2] Plantilla:Ref-web

[3] Plantilla:Ref-tesi

[4] Plantilla:Ref-llibre

[1]

[2]

[3]

[4]

Màquina vectorial de rellevància

Referències

Menú de navegació

Cerca