Aprenentatge automàtic en línia

De testwiki
La revisió el 07:38, 26 maig 2024 per imported>EVA3.0 (bot) (Diacrítics)
(dif.) ← Versió més antiga | Versió actual (dif.) | Versió més nova → (dif.)
Salta a la navegació Salta a la cerca

En informàtica, l'aprenentatge automàtic en línia és un mètode d'aprenentatge automàtic en què les dades estan disponibles en un ordre seqüencial i s'utilitzen per actualitzar el millor predictor de dades futures a cada pas, a diferència de les tècniques d'aprenentatge per lots que generen el millor predictor mitjançant l'aprenentatge. en tot el conjunt de dades d'entrenament alhora. L'aprenentatge en línia és una tècnica comuna que s'utilitza en àrees d'aprenentatge automàtic on és computacionalment inviable entrenar sobre tot el conjunt de dades, i requereix la necessitat d'algorismes fora del nucli. També s'utilitza en situacions en què és necessari que l'algoritme s'adapti dinàmicament als nous patrons de les dades, o quan les dades en si es generen en funció del temps, per exemple, la predicció del preu de les accions. Els algorismes d'aprenentatge en línia poden ser propensos a interferències catastròfiques, un problema que es pot solucionar mitjançant enfocaments d'aprenentatge incremental.[1][2]

En el marc de l'aprenentatge supervisat, una funció de f:XY s'ha d'aprendre, on X es pensa com un espai d'inputs i Y com un espai de sortides, que prediu bé els casos que s'extreuen d'una distribució de probabilitat conjunta p(x,y) activat X×Y. En realitat, l'alumne mai sap la distribució real p(x,y) sobre instàncies. En canvi, l'alumne sol tenir accés a un conjunt d'exemples de formació (x1,y1),,(xn,yn). En aquesta configuració, la funció de pèrdua es dona com V:Y×Y, de tal manera que V(f(x),y) mesura la diferència entre el valor previst f(x) i el valor real y. L'objectiu ideal és seleccionar una funció f, on és un espai de funcions anomenat espai d'hipòtesis, de manera que es minimitza alguna noció de pèrdua total. Segons el tipus de model (estadístic o adversari), es poden idear diferents nocions de pèrdua, que donen lloc a diferents algorismes d'aprenentatge.[3]

Implementacions:[4]

Referències

Plantilla:Referències