Llei de Zipf-Mandelbrot

De testwiki
Salta a la navegació Salta a la cerca

Plantilla:Distribució de probabilitat

En teoria de probabilitat i estadística, la llei de Zipf-Mandelbrot és una distribució de probabilitat discreta. També coneguda com la llei de Pareto-Zipf, és una distribució de llei potencial a les dades classificades, anomenada així pel lingüista George Kingsley Zipf qui va suggerir una distribució més senzilla anomenada llei de Zipf i el matemàtic Benoit Mandelbrot, que posteriorment la va generalitzar.

La funció de massa de probabilitat ve donada per:

f(k;N,q,s)=1/(k+q)sHN,q,s

on HN,q,s és donat per:

HN,q,s=i=1N1(i+q)s

que es pot considerar com una generalització d'un nombre harmònic. A la fórmula, k és el rang de les dades q i s són paràmetres de la distribució. En el límit de N quan s'acosta a l'infinit, es converteix en la funció zeta de Hurwitz ζ(s,q). Per a N finit i q=0 la llei de Zipf-Mandelbrot es converteix en la llei de Zipf. Per a N infinit i q=0 es converteix en la distribució Zeta.

Aplicacions

La distribució de paraules classificades per la seva freqüència en un corpus lingüístic aleatori s'aproxima per una distribució de llei potencial, coneguda com a llei de Zipf.

Si es dibuixa el rang de freqüència de les paraules contingudes en un corpus de dades de text de mida moderada vers el nombre d'ocurrències o freqüències reals, s'obté una distribució de llei potencial, amb exponent proper a 1 (però vegeu Powers, 1998 i Gelbukh i Sidorov, 2001). La llei de Zipf assumeix implícitament una mida de vocabulari fixa, però la sèrie harmònica amb s=1 no convergeix, mentre que la generalització de la llei Zipf-Mandelbrot amb s>1 ho fa. A més, hi ha proves que la classe tancada de paraules funcionals que defineixen un idioma obeeix a una distribució Zipf-Mandelbrot amb diferents paràmetres de les classes obertes de paraules amb contingut que varien per tema, camp i registre.[1]

En estudis del camp ecològic, la distribució d'abundància relativa (és a dir, el gràfic del nombre d'espècies observades en funció de la seva abundància) es troba sovint conforme a la llei de Zipf-Mandelbrot.[2]

Dins de la música, moltes mètriques de la música «agradable» s'ajusten a les distribucions Zipf-Mandelbrot.

Referències

Plantilla:Referències

Bibliografia

Enllaços externs

Plantilla:Distribucions de probabilitat Plantilla:Autoritat