Regressió lineal bayesiana

De testwiki
Salta a la navegació Salta a la cerca

Plantilla:Estadística bayesianaLa regressió lineal bayesiana és un tipus de modelització condicional en què la mitjana d'una variable es descriu mitjançant una combinació lineal d'altres variables, amb l'objectiu d'obtenir la probabilitat posterior dels coeficients de regressió (així com altres paràmetres que descriuen la distribució de la regressió y) i permet, finalment, la predicció fora de la mostra del regressand (sovint etiquetat y) condicional als valors observats dels regressors (normalment X). La versió més senzilla i més utilitzada d'aquest model és el model lineal normal, en el qual y donat X Es distribueix gaussià. En aquest model, i sota una elecció particular de probabilitats a priori per als paràmetres —els anomenats priors conjugats—, el posterior es pot trobar analíticament. Amb anteriors escollits de manera més arbitrària, els posteriors generalment s'han d'aproximar.[1][2]

Configuració del model

Considereu un problema de regressió lineal estàndard, en el qual for i=1,,n especifiquem la mitjana de la distribució condicional de yi donat a k×1 vector predictor 𝐱i: [3]yi=𝐱i𝖳β+εi,on β és un k×1 vector, i el εi són variables aleatòries independents i de distribució normal idèntica:εiN(0,σ2).Això correspon a la funció de probabilitat següent:ρ(𝐲𝐗,β,σ2)(σ2)n/2exp(12σ2(𝐲𝐗β)𝖳(𝐲𝐗β)).La solució de mínims quadrats ordinària s'utilitza per estimar el vector de coeficients utilitzant el pseudoinvers de Moore-Penrose:β^=(𝐗𝖳𝐗)1𝐗𝖳𝐲on 𝐗 és el n×k matriu de disseny, cada fila de la qual és un vector predictor 𝐱i𝖳; i 𝐲 és la columna n -vector [y1yn]𝖳.

Aquest és un enfocament freqüentista i suposa que hi ha prou mesures per dir alguna cosa significativa β. En l'enfocament bayesià, les dades es complementen amb informació addicional en forma d'una distribució de probabilitat prèvia. La creença prèvia sobre els paràmetres es combina amb la funció de probabilitat de les dades segons el teorema de Bayes per produir la creença posterior sobre els paràmetres. β i σ. El prior pot adoptar diferents formes funcionals segons el domini i la informació disponible a priori.

Atès que les dades comprenen tots dos 𝐲 i 𝐗, el focus només en la distribució de 𝐲 condicionat a 𝐗 necessita justificació. De fet, una anàlisi bayesiana "completa" requeriria una probabilitat conjunta ρ(𝐲,𝐗β,σ2,γ) juntament amb un prior ρ(β,σ2,γ), on γ simbolitza els paràmetres de la distribució per 𝐗. Només sota el supòsit d'exogeneïtat (feble) es pot tenir en compte la probabilitat conjunta ρ(𝐲𝐗,β,σ2)ρ(𝐗γ). L'última part normalment s'ignora sota el supòsit de conjunts de paràmetres disjunts. Més encara, sota supòsits clàssics 𝐗 es consideren escollits (per exemple, en un experiment dissenyat) i, per tant, té una probabilitat coneguda sense paràmetres.[4]

Referències

Plantilla:Referències