Nucli més suau

De testwiki
Salta a la navegació Salta a la cerca

Un kernel smoother és una tècnica estadística per estimar una funció de valor real f:p com a mitjana ponderada de les dades observades veïnes. El pes es defineix pel nucli, de manera que els punts més propers reben pes més alts. La funció estimada és suau i el nivell de suavitat el defineix un únic paràmetre. El suavització del nucli és un tipus de mitjana mòbil ponderada.[1][2]

Definicions

Si Khλ(X0,X) és un nucli definit per

Khλ(X0,X)=D(XX0hλ(X0))

on:

  • és la norma euclidiana
  • és un paràmetre (radi del nucli)
  • D (t ) és típicament una funció de valor real positiu, el valor de la qual és decreixent (o no augmenta) per a la distància creixent entre X i X 0.

Els nuclis populars utilitzats per allisar inclouen els nuclis parabòlics (Epanechnikov), Tricube i gaussians.

Sigui Y(X):p una funció contínua de X. Per cadascú X0p, la mitjana ponderada pel nucli de Nadaraya-Watson (estimació suau Y (X )) es defineix per

Y^(X0)=i=1NKhλ(X0,Xi)Y(Xi)i=1NKhλ(X0,Xi)

on:

  • N és el nombre de punts observats
  • Y (X i ) són les observacions en X i punts.

A les seccions següents, es descriuen alguns casos particulars de suavitzadors del nucli.[3]

Nucli gaussià més suau

El nucli gaussià és un dels nuclis més utilitzats, i s'expressa amb l'equació següent.

K(x*,xi)=exp((x*xi)22b2)

Aquí, b és l'escala de longitud per a l'espai d'entrada.

Veí més proper més suau

La idea del veí més proper més suau és la següent. Per a cada punt X 0, pren els m veïns més propers i estima el valor de Y (X 0 ) fent la mitjana dels valors d'aquests veïns.Formalment, hm(X0)=X0X[m], on X[m] és la m- èma més propera a X 0 veí, i

D(t)={1/mif |t|10otherwise

Exemple:

En aquest exemple, X és unidimensional. Per cada X 0, el Y^(X0) és un valor mitjà de 16 més proper a X 0 punts (indicat amb vermell). El resultat no és prou suau.

Nucli mitjà més suau

La idea del suau mitjà del nucli és la següent. Per a cada punt de dades X 0, trieu una mida de distància constant λ (radi del nucli o amplada de la finestra per a p = 1) i calculeu una mitjana ponderada per a tots els punts de dades que estan més a prop de λ a X 0 (com més a prop de X 0 punts obtenen pesos més alts).

Formalment, hλ(X0)=λ=constant, i D (t ) és un dels nuclis populars.[4]

Referències

Plantilla:Referències