Algorisme k-means

De testwiki
Salta a la navegació Salta a la cerca

Plantilla:Falten referències

[1]exemple de k-means++

LPlantilla:'algorisme K-means és un mètode de quantificació vectorial que té com a objectiu la partició d'un conjunt n observacions en k grups en el qual cada observació pertany al grup més proper a la mitjana. És un mètode utilitzat en mineria de dades.[2]

Descripció

Donat un conjunt d'observacions (x1, x₂, …, xn), on cada observació és un vector real de d dimensions, k-means construeix una partició de les observacions en k conjunts (kn) S = {S1, S₂, …, Sk}. A fi de minimitzar la suma dels quadrats a dins de cada grup (WCSS):

argmin𝐒i=1k𝐱jSi𝐱jμi2

on µi és la mitjana de punts en Si.

Aplicacions

L'algorisme k-means és fàcil d'aplicar fins i tot en grans grups de dades. S'utilitza sovint abans d'aplicar altres algorismes per donar un punt de partida al programa (preprocessing).

Clusterització de dades

Un dels seus usos és la clusterització de dades,[1] fonamental en l'aprenentatge automàtic. Consisteix a agrupar punts de dades segons la seva similitud. Aquest us serveix, per exemple, per la segmentació de mercat, on els clients són agrupats segons característiques o comportaments similars.

Quantificació vectorial

L'algorisme k-means s'utilitza per quantificar colors dins dels grups k. Amb això es pot, per exemple, agrupar els colors d'una imatge digital per “simplificar-la” i així evitar perdre qualitat quan es comprimeix.[2]

Referències

Plantilla:Referències