Anàlisi de correspondències

De testwiki
La revisió el 16:28, 28 feb 2025 per imported>EVA3.0 (bot) (Tipografia)
(dif.) ← Versió més antiga | Versió actual (dif.) | Versió més nova → (dif.)
Salta a la navegació Salta a la cerca

A estadística multivariant, lPlantilla:'anàlisi de correspondències (Plantilla:En Correspondence analysis, CA) és una tècnica descriptiva proposada[1] per Hirschfeld[2] i posteriorment desenvolupada per Jean-Paul Benzécri.[3]

Totes les dades han de ser no-negatives i en la mateixa escala per tal de poder aplicar l'anàlisi de correspondències, i el mètode tracta les files i les columnes de forma equivalent. Se sol aplicar a l'estudi de taules de contingència i és conceptualment similar a l'anàlisi de components principals amb la diferència que en l'anàlisi de correspondències les dades s'escalen de manera que files i columnes es tracten de manera equivalent. És una manera de visualitzar o resumir un conjunt de dades en una representació de dues dimensions.

L'anàlisi de correspondències descompon l'estadístic del test de la khi-quadrat associat a una taula de contingència en components ortogonals.[4] Atès que es tracta d'una tècnica descriptiva, es pot aplicar fins i tot en circumstàncies en què l'estadístic χ2 no és apropiat.[4][5]

Detalls

Igual que l'anàlisi de components principals, l'anàlisi de correspondències crea components ortogonals i, per a cada element d'una taula, crea un conjunt de puntuacions (de vegades anomenats puntuacions de factors). L'anàlisi de correspondències es realitza sobre una taula de contingència C, de grandària m×n on m és el nombre de files i n el nombre de columnes.

Preprocessament

A partir d'una taula C, es calcula un conjunt de pesos per a les columes i les files,[4][5] on els pesos de les files són

wm=(1C1)1C1

i els pesos de les columnes són

wn=(1C1)11C.

A continuació, es calcula una taula S (anomenada matriu estocàstica), on C es divideix per la suma de C

S=(1C1)1C.

Finalment, es calcula una taula M a partir de S i dels pesos:

M=Swmwn.

Components ortogonals

Llavors es descompon la taula M mitjançant la descomposició en valors singulars generalitzats, on els vectors singulars per l'esquerra i per la dreta estan restringits pels pesos. Els pesos són taules diagonals

Wm=diag{wm}

i

Wn=diag{wn}

on els elements de la diagonal de Wn són wn i els de fora de la diagonal són 0.

Llavors s'obté la descomposició de M:

M=UΣV*

on

U*WmU=V*WnV=I.

Puntuació de factors

Les puntuacions de factors per als elements fila de la taula C són

Fm=WmUΣ

i pels elements columna

Fn=WnVΣ.

Extensions i aplicacions

Existeixen diverses variants de l'anàlisi de correspondències, incloent-hi l'anàlisi de correspondències amb eliminació de la tendència (Plantilla:En detrended correspondence analysis, DCA) i l'anàlisi de correspondències canòniques (Plantilla:En canonical correspondence analysis, CCA). L'extensió de l'anàlisi de correspondències a més d'una variable categòrica s'anomena anàlisi de correspondències múltiple. Una adaptació de l'anàlisi de correspondències al problema de discriminació basat en variables qualitatives (és a dir, l'equivalent de l'anàlisi discriminant per a dades qualitatives) s'anomena anàlisi de correspondències discriminant o anàlisi discriminant baricèntric.

En ciències socials, l'anàlisi de correspondències, i en particular l'anàlisi de correspondències múltiple, es va donar a conéixer fora de França pel sociòleg francès Pierre Bourdieu.[6]

Implementacions

  • El sistema de visualització de dades Orange inclou el mòdul: orngCA.
  • El sistema estadístic R inclou els paquets: ade4, ca, vegan, ExPosition i FactoMineR, que realitzen anàlisi de correspondències i anàlisi de correspondències múltiples.[7]

Referències

Plantilla:Referències

Vegeu també

Enllaços externs

  • Greenacre, Michael (2008), La Práctica del Análisis de Correspondencias, BBVA Foundation, Madrid, Spanish translation of Correspondence Analysis in Practice, available for free download from BBVA Foundation publications Plantilla:Webarchive
  • Greenacre, Michael (2010), Biplots in Practice, BBVA Foundation, Madrid, available for free download at multivariatestatistics.org
  1. Dodge, Y. (2003) The Oxford Dictionary of Statistical Terms, OUP Plantilla:ISBN
  2. Hirschfeld, H.O. (1935) "A connection between correlation and contingency", Proc. Cambridge Philosophical Society, 31, 520–524
  3. Plantilla:Ref-llibre
  4. 4,0 4,1 4,2 Plantilla:Ref-llibre
  5. 5,0 5,1 Plantilla:Ref-llibre
  6. Plantilla:Ref-llibre
  7. orngCA