Teoria de les grans desviacions

De testwiki
Salta a la navegació Salta a la cerca

En teoria de la probabilitat, la teoria de les grans desviacions es refereix al comportament asimptòtic de les cues remotes de seqüències de distribucions de probabilitat. Mentre que algunes idees bàsiques de la teoria es poden rastrejar a Laplace, la formalització va començar amb les matemàtiques d'assegurances, és a dir, la teoria de la ruïna amb Cramér i Lundberg. Una formalització unificada de la teoria de la gran desviació es va desenvolupar el 1966, en un article de Varadhan.[1] La teoria de grans desviacions formalitza les idees heurístiques de concentració de mesures i generalitza àmpliament la noció de convergència de mesures de probabilitat.[2]

A grans trets, la teoria de les grans desviacions es refereix a la disminució exponencial de les mesures de probabilitat de certs tipus d'esdeveniments extrems o de cua.[3]

Exemples introductoris

Un exemple elemental

Considerant una seqüència de llançaments independents d'una moneda justa. Els possibles resultats podrien ser cap o cua. Denotant el possible resultat de l'i-è assaig per Plantilla:Nowrap on es codifica el cap com a 1 i la cua com a 0. Ara es fa MN i el valor mitjà després N assaigs, és a dir

Plantilla:Nowrap

Aleshores MN està entre 0 i 1. De la llei dels grans nombres es dedueix que a mesura que N creix, la distribució de MN convergeix a 0.5=E[X] (el valor esperat d'un sol llançament de moneda).

A més, pel teorema central del límit, es dedueix que MN es distribueix aproximadament normalment per a grans Plantilla:Nowrap El teorema del límit central pot proporcionar informació més detallada sobre el comportament de MN que la llei dels grans nombres. Per exemple, podem trobar aproximadament una probabilitat de cua de Plantilla:Nowrap Plantilla:Nowrap això MN és més gran que Plantilla:Nowrap per un valor fix de Plantilla:Nowrap Tanmateix, l'aproximació pel teorema del límit central pot no ser precisa si x està lluny de E[Xi] tret que N és prou gran. A més, no proporciona informació sobre la convergència de les probabilitats de la cua quan Plantilla:Nowrap Tanmateix, la teoria de la gran desviació pot donar respostes a aquests problemes.

Grans desviacions per a sumes de variables aleatòries independents

En l'exemple anterior de llançament de monedes vam assumir explícitament que cada llançament és una prova independent i la probabilitat d'aconseguir cap o cua és sempre la mateixa.

Si X,X1,X2, ser independents i idènticament distribuïdes (iid) variables aleatòries la distribució comuna de les quals compleix una determinada condició de creixement. Aleshores existeix el següent límit:

Plantilla:Nowrap

Aquí

Plantilla:Nowrap

com abans.

Funció I() s'anomena " funció de velocitat " o "funció de Cramér" o de vegades "funció d'entropia".

Definició formal

Donat un espai polonès 𝒳 deixar {N} ser una seqüència de mesures de probabilitat de Borel Plantilla:Nowrap deixar {aN} ser una successió de nombres reals positius tal que Plantilla:Nowrap i finalment deixar I:𝒳[0,] ser un funcional semicontinu inferior 𝒳. La seqüència {N} es diu que satisfà un principi de gran desviació amb la velocitat {an} i taxa I si, i només si, per a cada conjunt mesurable de Borel Plantilla:Nowrap

Plantilla:Nowrap

on E i E denoten respectivament el tancament i l'interior d'Plantilla:Nowrap

Història breu

Els primers resultats rigorosos sobre grans desviacions es deuen al matemàtic suec Harald Cramér, que els va aplicar per modelar el negoci de les assegurances. Des del punt de vista d'una companyia d'assegurances, els guanys són a un ritme constant per mes (la prima mensual) però les reclamacions es produeixen de manera aleatòria. Perquè l'empresa tingui èxit durant un període de temps determinat (preferiblement molts mesos), els guanys totals han de superar el total de la reclamació. Així, per estimar la prima cal fer la següent pregunta: "Què hem de triar com a prima q tal que s'ha acabat N mesos la reclamació total C=ΣXi hauria de ser inferior a Plantilla:Nowrap Aquesta és clarament la mateixa pregunta que fa la teoria de les grans desviacions. Cramér va donar una solució a aquesta pregunta per a variables aleatòries iid, on la funció de velocitat s'expressa com una sèrie de potències.

Aplicacions

Els principis de grans desviacions es poden aplicar eficaçment per recopilar informació d'un model probabilístic. Així, la teoria de les grans desviacions troba les seves aplicacions en la teoria de la informació i la gestió del risc. En física, l'aplicació més coneguda de la teoria de les grans desviacions sorgeix en la termodinàmica i la mecànica estadística (en relació amb la relació de l'entropia amb la funció de velocitat).[4]

Referències

Plantilla:Referències

  1. S.R.S. Varadhan, Asymptotic probability and differential equations, Comm. Pure Appl. Math. 19 (1966),261-286.
  2. Plantilla:Ref-web
  3. Plantilla:Ref-web
  4. Plantilla:Ref-web