Aprenentatge per transferència

De testwiki
La revisió el 07:39, 26 maig 2024 per imported>EVA3.0 (bot) (Diacrítics)
(dif.) ← Versió més antiga | Versió actual (dif.) | Versió més nova → (dif.)
Salta a la navegació Salta a la cerca

L'aprenentatge per transferència (amb acrònim anglès TL) és un problema d'investigació en aprenentatge automàtic (ML) que se centra a emmagatzemar el coneixement adquirit mentre es resol un problema i l'aplica a un problema diferent però relacionat.[1] Per exemple, els coneixements adquirits en aprendre a reconèixer els cotxes es podrien aplicar quan s'intenta reconèixer els camions. Aquesta àrea de recerca guarda certa relació amb la llarga història de la literatura psicològica sobre transferència de l'aprenentatge, encara que els vincles pràctics entre ambdós camps són limitats. Des del punt de vista pràctic, reutilitzar o transferir informació de tasques apreses prèviament per a l'aprenentatge de noves tasques té el potencial de millorar significativament l'eficiència de la mostra d'un agent d'aprenentatge de reforç.[2]

El 1976, Stevo Bozinovski i Ante Fulgosi van publicar un article que abordava explícitament l'aprenentatge de transferència en l'entrenament de xarxes neuronals.[3][4] El document ofereix un model matemàtic i geomètric d'aprenentatge per transferència. El 1981 es va presentar un informe sobre l'aplicació de l'aprenentatge de transferència en l'entrenament d'una xarxa neuronal en un conjunt de dades d'imatges que representaven lletres de terminals d'ordinador. Es va demostrar experimentalment l'aprenentatge de transferència tant positiu com negatiu.[5]

La definició de transferència d'aprenentatge es dona en termes de dominis i tasques. Un domini 𝒟 consta de: un espai de característiques 𝒳 i una distribució de probabilitat marginal P(X), on X={x1,...,xn}𝒳. Donat un domini específic, 𝒟={𝒳,P(X)}, una tasca consta de dos components: un espai d'etiquetes 𝒴 i una funció predictiva objectiva f:𝒳𝒴. La funció f s'utilitza per predir l'etiqueta corresponent f(x) d'una nova instància x. Aquesta tasca, denotada per 𝒯={𝒴,f(x)}, s'aprèn a partir de les dades d'entrenament que consisteixen en parelles {xi,yi}, on xiX i yi𝒴.[6]

Donat un domini d'origen 𝒟S i tasca d'aprenentatge 𝒯S, un domini objectiu 𝒟T i tasca d'aprenentatge 𝒯T, on 𝒟S𝒟T, o 𝒯S𝒯T, l'aprenentatge de transferència pretén ajudar a millorar l'aprenentatge de la funció predictiva objectiu fT() en 𝒟T utilitzant el coneixement en 𝒟S i 𝒯S.[7]

Hi ha algorismes disponibles per a l'aprenentatge de transferència en xarxes lògiques de Markov [8] i xarxes bayesianes.[9] L'aprenentatge de transferència també s'ha aplicat al descobriment de subtipus de càncer,[10] utilització d'edificis,[11][12] jocs generals,[13] classificació de text,[14][15] reconeixement de dígits,[16] imatges mèdiques i filtratge de correu brossa.[17]

L'any 2020 es va descobrir que, a causa de la seva naturalesa física semblant, és possible l'aprenentatge de transferència entre senyals electromiogràfics (EMG) dels músculs i classificant els comportaments de les ones cerebrals electroencefalogràfiques (EEG), des del domini de reconeixement de gestos fins al domini de reconeixement de l'estat mental. També es va assenyalar que aquesta relació funcionava a l'inrevés, demostrant que l'EEG també es pot utilitzar per classificar l'EMG.[18] Els experiments van assenyalar que la precisió de les xarxes neuronals i les xarxes neuronals convolucionals es va millorar [19] mitjançant l'aprenentatge de transferència tant a la primera època (abans de qualsevol aprenentatge, és a dir, en comparació amb la distribució de pes aleatòria estàndard) com a l'asimptota (el final de l'aprenentatge). procés). És a dir, els algorismes es milloren amb l'exposició a un altre domini. A més, l'usuari final d'un model pre-entrenat pot canviar l'estructura de les capes completament connectades per aconseguir un rendiment superior.[20]

Referències

Plantilla:Referències

  1. Plantilla:Ref-web
  2. Plantilla:Ref-publicació
  3. Stevo. Bozinovski and Ante Fulgosi (1976). "The influence of pattern similarity and transfer learning upon the training of a base perceptron B2." (original in Croatian) Proceedings of Symposium Informatica 3-121-5, Bled.
  4. Stevo Bozinovski (2020) "Reminder of the first paper on transfer learning in neural networks, 1976". Informatica 44: 291–302.
  5. S. Bozinovski (1981). "Teaching space: A representation concept for adaptive pattern classification." COINS Technical Report, the University of Massachusetts at Amherst, No 81-28 [available online: UM-CS-1981-028.pdf]
  6. Plantilla:Ref-publicació Material was copied from this source, which is available under a Creative Commons Attribution 4.0 International License.
  7. Plantilla:Ref-publicació Material was copied from this source, which is available under a Creative Commons Attribution 4.0 International License.
  8. Plantilla:Citation
  9. Plantilla:Citation
  10. Hajiramezanali, E. & Dadaneh, S. Z. & Karbalayghareh, A. & Zhou, Z. & Qian, X. Bayesian multi-domain learning for cancer subtype discovery from next-generation sequencing count data. 32nd Conference on Neural Information Processing Systems (NeurIPS 2018), Montréal, Canada. Plantilla:ArXiv
  11. Plantilla:Citar conferència
  12. Plantilla:Ref-publicació
  13. Banerjee, Bikramjit, and Peter Stone. "General Game Learning Using Knowledge Transfer Plantilla:Webarchive." IJCAI. 2007.
  14. Plantilla:Citar conferència
  15. Plantilla:Citar conferència
  16. Plantilla:Ref-publicació
  17. Plantilla:Citar conferència
  18. Plantilla:Ref-publicació
  19. Plantilla:Ref-publicació
  20. Plantilla:Ref-publicació