Unitats recurrents controlades

De testwiki
Salta a la navegació Salta a la cerca

Les unitats recurrents controlades (GRU) són un mecanisme de gating en xarxes neuronals recurrents, introduït el 2014 per Kyunghyun Cho i altres.[1] El GRU és com una memòria a llarg termini (LSTM) amb una porta oblidada,[2] però té menys paràmetres que LSTM, ja que no té una porta de sortida.[3] Es va trobar que el rendiment de GRU en determinades tasques de modelatge de música polifònica, modelatge de senyals de parla i processament de llenguatge natural era similar al de LSTM.[4][5] Els GRU van demostrar que el gating és realment útil en general i l'equip de Bengio va concloure que no hi havia cap conclusió concreta sobre quina de les dues unitats de gating era millor.[6]

Unitat recurrent Gated, versió totalment tancada.

Arquitectura

Hi ha diverses variacions a la unitat completa de control, amb l'obtenció feta utilitzant l'estat ocult anterior i el biaix en diverses combinacions, i una forma simplificada anomenada unitat mínima de control.[7]

Tipus 1.

L'operador denota el producte de Hadamard a continuació.

Unitat totalment controlada

Tipus 2.


Inicialment, per t=0, el vector de sortida és h0=0

zt=σg(Wzxt+Uzht1+bz)rt=σg(Wrxt+Urht1+br)h^t=ϕh(Whxt+Uh(rtht1)+bh)ht=ztht1+(1zt)h^t

Les variables

  • xt: vector d'entrada
  • ht: vector de sortida
  • h^t: vector d'activació candidat
  • zt: actualitza el vector de la porta
  • rt: reinicia el vector de la porta
  • W, U i b: matrius de paràmetres i vector
Tipus 3.

Funcions d'activació

Són possibles funcions d'activació alternatives, sempre que això σg(x)[0,1].

Es poden crear formes alternatives canviant zt i rt [8]

  • Tipus 1, cada porta depèn només de l'estat ocult anterior i del biaix.
    zt=σg(Uzht1+bz)rt=σg(Urht1+br)
  • Tipus 2, cada porta només depèn de l'estat ocult anterior.
    zt=σg(Uzht1)rt=σg(Urht1)
  • Tipus 3, cada porta es calcula utilitzant només el biaix.
    zt=σg(bz)rt=σg(br)


Referències

Plantilla:Referències