Aprenentatge d'Occam

De testwiki
La revisió el 07:38, 26 maig 2024 per imported>EVA3.0 (bot) (Diacrítics)
(dif.) ← Versió més antiga | Versió actual (dif.) | Versió més nova → (dif.)
Salta a la navegació Salta a la cerca

En la teoria de l'aprenentatge computacional, l'aprenentatge d'Occam és un model d'aprenentatge algorítmic on l'objectiu de l'alumne és produir una representació sucinta de les dades d'entrenament rebudes. Això està estretament relacionat amb l'aprenentatge probablement aproximadament correcte (PAC), on l'aprenent és avaluat pel seu poder predictiu d'un conjunt de proves.

L'aprenentatge d'Occam implica l'aprenentatge de PAC, i per a una gran varietat de classes de conceptes, també és cert el contrari: l'aprenentatge de PAC implica l'aprenentatge d'Occam.[1]

Occam Learning rep el nom de la navalla d'Occam, que és un principi que estableix que, tenint en compte que totes les altres coses són iguals, s'hauria d'afavorir una explicació més curta de les dades observades en lloc d'una explicació més llarga. La teoria de l'aprenentatge d'Occam és una justificació formal i matemàtica d'aquest principi. Va ser mostrat per primera vegada per Blumer, et al.[2] que l'aprenentatge d'Occam implica l'aprenentatge PAC, que és el model estàndard d'aprenentatge en la teoria de l'aprenentatge computacional. En altres paraules, la parsimònia (de la hipòtesi de sortida) implica poder predictiu.[3]

La concisió d'un concepte c a classe de concepte 𝒞 es pot expressar per la longitud size(c) de la cadena de bits més curta que pot representar c en 𝒞. L'aprenentatge d'Occam connecta la concisió de la sortida d'un algorisme d'aprenentatge amb el seu poder predictiu sobre dades no vistes.

Deixar 𝒞 i ser classes de conceptes que contenen conceptes i hipòtesis objectiu respectivament. Després, per a constants α0 i 0β<1, un algorisme d'aprenentatge L és un (α,β) -Algorisme d'Occam per 𝒞 utilitzant si, donat un conjunt S={x1,,xm} de m mostres etiquetades segons un concepte c𝒞, L dona sortida a una hipòtesi h de tal manera

  • h és coherent amb c activat S (això és, h(x)=c(x),xS), i
  • size(h)(nsize(c))αmβ [4][5]

on n és la longitud màxima de qualsevol mostra xS. Un algorisme d'Occam s'anomena eficient si s'executa en un polinomi de temps n, m, i size(c). Diem una classe de conceptes 𝒞 és Occam aprendre respecte a una classe d'hipòtesis si existeix un algorisme Occam eficient per 𝒞 utilitzant .

Referències

Plantilla:Referències

  1. Plantilla:Ref-web
  2. Blumer, A., Ehrenfeucht, A., Haussler, D., & Warmuth, M. K. (1987). Occam's razor. Information processing letters, 24(6), 377-380.
  3. Plantilla:Ref-web
  4. Kearns, M. J., & Vazirani, U. V. (1994). An introduction to computational learning theory, chapter 2. MIT press.
  5. Blumer, A., Ehrenfeucht, A., Haussler, D., & Warmuth, M. K. (1987). Occam's razor. Information processing letters, 24(6), 377-380.