Revisióndemodelosy convergenciaestocástica
EnelpasadocursodeEstadísticaBásicaseintrodujeronalgunoscapítulos dedicadosalosmodelosdeprobabilidadmásimportantes.Enesteprimertema introductorioserevisanlosquevanaserutilizadosenelpresentecursoyse estableceelconceptodeconvergenciaestocásticacomounaextensióndela convergencianuméricaalcampodelasvariablesaleatorias.
1.1.Variablesaleatoriasymodelosdeprobabilidad
Conelfindellevaracabounaasignaciónnuméricaalosresultadosdeun experimentoaleatoriosedefinenlasvariablesaleatorias,quenosonmásque aplicacionesquetransformanlossucesosdeunespaciomuestralennúmeros. Cuandoladimensiónesigualosuperioradosentoncessehabladevectores
1
Tema1.Revisióndemodelosyconvergenciaestocástica aleatorios.
Losmodelosdeprobabilidadunivariantesdiscretosmásimportantessonel Bernouilli,elBinomialyelPoissonydentrodeloscontinuos,elUniforme,el ExponencialyelNormal.
ElsencillomodelodeprobabilidadBernouillisecorrespondeconunadistribucióndicotómica.Lafuncióndeprobabilidadodecuantíadeunavariable aleatoria X condistribución Br (θ
es
θ son, respectivamente,
Larealizaciónde n experimentosaleatoriosindependientesdeltipoBernouilliylaconsideracióndelnúmerodeéxitosenesas n pruebas,dalugara unavariablealeatoriacuyadistribuciónrecibeelnombredeBinomialytiene dosparámetros: n,elnúmeroderealizacionesindependientesdelexperimento y
θ ,laprobabilidaddeéxitoencadaunadelaspruebasBernouilli.
Lafuncióndeprobabilidaddeunavariablealeatoria X ∼ Bi(n,θ ),quenos proporcionalaprobabilidaddeobtenerunnúmerodeterminadodeéxitosen
2
)
f (x)= ⎧ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎩ θ si x =1 1 θ si x =0 0 enotrocaso.
LamediaylavarianzadeunadistribuciónBernouillideparámetro μ = E (X )= xi ∈X (Ω) xi f (xi )=(0)(1 θ )+(1)(θ )= θ σ 2 = Var (X )= xi ∈X (Ω) x 2 i f (xi ) μ 2 =(0)2 (1 θ )+(1)2 (θ ) θ 2 = = θ (1 θ )
EduardoBeamonteCórdoba 3
n pruebasdicotómicasindependienteses
f (x)= ⎧ ⎨ ⎩ n x θ x (1 θ )n x si x =0, 1,...,n 0 enotrocaso
Lamediadeladistribución Bi(n,θ ) es μ = nθ ysuvarianza σ 2 = nθ (1 θ ).
Sedicequeunavariablealeatoria X sigueunadistribucióndeprobabilidad Poissondeparámetro
λ> 0,
X ∼ Po(λ),cuandosufuncióndeprobabilidad odecuantíaesiguala
f (x)= ⎧ ⎨ ⎩ exp( λ) λx x! si x ∈ N 0 enotrocaso
LamediaylavarianzadeunavariablealeatoriaPoissonsonigualesy coincidenprecisamenteconelparámetro
λ deladistribución.
Dados
a,b ∈ R con
a<b,sedicequeunavariablealeatoriasigueuna distribuciónUniformeentre a y
b,
X ∼ Un(a,b),sisufuncióndedensidad resultaiguala
f (x)= ⎧ ⎨ ⎩ 1 b a si x ∈ [a,b] 0 enotrocaso
Lamediadeladistribución Un(a,b) eselpuntomediodelintervalo, μ = a+b 2 ysuvarianzaes σ 2 = (b a)2 12
SedicequeunavariablealeatoriapositivasigueunadistribuciónExponencialdeparámetro
λ> 0,
X ∼ Ex(λ),sisufuncióndedensidades
f (x)= ⎧ ⎨ ⎩ λ exp( λx) si x> 0 0 enotrocaso
Tema1.Revisióndemodelosyconvergenciaestocástica
Lamediadeestadistribuciónesigualalinversodelparámetro, μ = 1 λ ,y suvarianzaresulta σ 2 = 1 λ2
Sinningúngénerodedudas,ladistribuciónNormaleslamásimportante delasdistribucionescontinuasutilizadasenEstadística.Unavariablealeatoria quetomavaloresentodalarectarealsigueunadistribuciónNormaldemedia μ yvarianza σ 2 ,
X ∼ N (μ,σ 2 ),sisufuncióndedensidades
f (x)= 1 σ √2π exp 1 2 x μ σ
2 ,x ∈ R.
X ∼ N (0, 1) ysedicequelavariable aleatoriasigueunadistribuciónNormalestándarotipificada.
Cuando μ =0 y σ =1,entonces
TodatransformaciónlinealdeunavariablealeatoriaNormalestambién Normal,porloquepuedeserobtenidacualquierprobabilidadapartirdela distribuciónNormalestándar.Enefecto,comolafuncióndedistribucióncorrespondienteaunavariableNormaltipificadaseencuentratabulada,para hallarcualquierprobabilidaddeltipo p(a ≤ X ≤ b),relativaaunavariable X ∼ N (μ,σ 2 ),seprocedeatipificarlamismayaconsultarlastablas,
eslafuncióndedistribuciónNormalestándar.
LastablasdelafuncióndedistribuciónNormalestándarsuelenestardisponiblessóloparaabscisaspositivas,puesdebidoalasimetríarespectoalcero dedichadistribuciónsetieneque p(X ≤ x)=Φ(x)=1 Φ( x)= p(X ≥ x), ∀x ∈ R.
Enlorelativoalosmodelosdeprobabilidadmultivariantestambiénla distribuciónNormalmultivarianteeslamásimportantedetodas.Seestablece sudefiniciónenelcasobidimensionaldelsiguientemodo.
4
p(a ≤
p a μ σ ≤ X μ σ ≤ b μ σ =Φ b μ σ Φ a μ σ ,
X ≤ b)=
donde Φ
EduardoBeamonteCórdoba 5
Z2 variablesaleatoriasindependienteseidénticamentedistribuidassegúnuna N (0, 1),entonceselvectoraleatorio Z1 Z2 ∼ N µ = 0 0 , Σ= 10 01
(Z1 ,Z2 ) sigueuna distribuciónNormalbivariantereducidaoBinormalreducida,
Definiendodeunmodoadecuadounatransformaciónlinealbivariantesobre (Z1 ,Z2 ) podemosobtenerunvectoraleatorioconvectordemediasymatriz devarianzas-covarianzascualesquieraycondistribuciónNormalbivarianteo Binormal.
LadistribuciónNormalbivariantetambiéngozadealgunasinteresantesy atractivaspropiedades,comoporejemploquetantolasmarginalesunivariantes comolascorrespondientesdistribucionescondicionadasdeunaBinormalson Normales.
TambiénsetieneenelcasoNormalqueincorrelaciónimplicaindependencia,esdecir,si X1 y
X2 sonNormalesincorreladas,entonces X1 y
X2 son independientes.
2 ) ∼ N (µ, Σ)
yconsideradalatransformaciónlinealunivariante
2 ,estoes,si X1 ∼ N (μ1 ,σ 2 1
, X2 ∼ N (μ2
,σ 2 2 ), independientes,entoncespara a,b,c ∈ R
linealunivariante Y = aX1 + bX2 + c ∼ N (aμ1 + bμ2 + c,a2 σ 2 1 + b2 σ 2 2 )
Dadas Z1 y
Dadounvectoraleatorio Y = aX1 + bX2 + c,con
(X1 ,X a,b,c ∈ R,severificaque Y ∼ N (aμ1 + bμ2 + c,a2 σ 2 1 + b2 σ 2 2 +2abσ12 )
TambiénsetieneelresultadoanteriorbajolahipótesisdeNormalidade independenciapara X1 y
X
)
,secumplequelatransformación
Tema1.Revisióndemodelosyconvergenciaestocástica
POREJEMPLO:
X2 representan,respectivamente,losingresosbrutosylosgastos, enmilesdeeuros,derivadosdelaventadeunvalormobiliario. Supongamosdichovectormodelizadosegúnunadistribución
probabilidaddequelosingresosnetosobtenidosporlaventa deundeterminadovalorseansuperioresa 584 milesdeeuros
p(
= X1 X2 ∼
yrepresentalosingresosnetosenmilesdeeuros.Sume-
Dadaunasucesióndevariablesaleatorias,laideaesqueapesardelhabitual desconocimientodelasrespectivasdistribucionesdeprobabilidad,enmuchas ocasionesesposibleaproximarladistribucióndeprobabilidaddelasumade ungrannúmerodevariables.
6
Normalbivariante X1 X2 ∼ N 600 30 , 10030 309 ,entoncesla
esiguala
seaelvectoraleatorio T ≥ 584),donde T
(X1 ,X2 ) cuyascomponentes N μt ,σ 2 t
X1 y diaes μt = μ1 μ2 =600 30=570,suvarianza σ 2 t = σ 2 1 + σ 2 2 2σ12 =100+9 60=49 ylaprobabilidad requeridaes p(T ≥ 584)= p T μt σt ≥ 584 570 7 = p(Z ≥ 2)= 1 Φ(2)=0 0227,donde Z = T μt σt ∼ N (0, 1)
1.2.Convergenciaenmodelosestocásticos
Elconceptodeconvergenciaparalassucesionesnuméricaspuedesergeneralizadoparavariablesaleatoriasyhablarasídeunasuertede convergencia estocástica
EduardoBeamonteCórdoba 7
Existendiferentestiposdeconvergenciaestocástica:convergenciacasisegura,convergenciaenprobabilidad,convergenciaenmediacuadrática,convergenciaendistribución,etc.Sinembargo,noesobjetodeestecursolaconsideracióndelosdistintostiposdeconvergencia.Únicamenteintroduciremosenel siguientepuntounresultadogenéricodegranimportanciaestadística.
La
leydelosgrandesnúmeros esunodelosprimerosymásimportantes resultadosdeconvergenciaestocástica.Bajosusdistintasformulacionessegún lashipótesisconsideradas,básicamentedemuestralaconvergenciadelpromediodeunasucesióndevariablesaleatoriasalamediadelasesperanzasdelas mismas.
Porejemplo,el teoremadeBernouilli esuncasoparticulardeestaley paravariablesaleatoriasBernouilli.Dadaunasucesión
{Xi }∞ i=1 devariables aleatoriasindependienteseidénticamentedistribuidassegúnuna Br (θ ),la mediaaritméticadelas n primerasvariablesaleatorias,
n i=1 Xi n ,convergeala mediapoblacional
θ .
Latambiénllamada leyderegularidadestadística esintuitivamenteun resultadodesencillaobservación.Sienunapoblaciónexisteunadeterminadaproporcióndeindividuosconunaciertacaracterística,seleccionadosunos cuantosparasuexamen,laproporcióndeindividuosconlacaracterísticade interésestarátantomáspróximaalaproporciónpoblacionalcuantomayor seaelnúmerodeindividuosseleccionados.
1.3.Teoremacentraldellímite
Sinningúngénerodedudas,el teoremacentraldellímite esunodelos resultadosestadísticosdemayorimportancia.Tambiénsehanformuladodiferentesteoremassegúnlashipótesiscondicionantesperolamásgenérica,yla
Tema1.Revisióndemodelosyconvergenciaestocástica consideradaenestecurso,aproximaladistribucióndeprobabilidaddelasuma demuchasvariablesaleatoriasindependienteseidénticamentedistribuidasa unadistribuciónNormal.
{Xi }∞ i=1 variablesaleatoriasindependienteseidénticamentedistribuidasconmedia μ yvarianza σ 2 nonula,entonceslavariable n i=1 Xi ≈ N (nμ,nσ 2 ).
Formalmente,dadas
ComocualquiercombinaciónlinealdevariablesaleatoriasNormalesindependientestambiénesNormal,setendráasimismoladistribuciónaproximada para
X n = n i=1 Xi n ≈ N μ, σ 2 n
Lavarianzadeestaúltimadistribuciónpuedeserreducidatantocomose deseesinmásqueaumentareltamañomuestral n.Comolavarianzamidela dispersiónrelativarespectoalamedia,podríatambiénseraproximadalavariablealeatoria X n alamediapoblacionaldesconocidaconelgradodeprecisión requerido.
Suimportanciaradicaenlaposibilidaddeobtencióndecualquierresultado aproximadorelativoalasumade n variablesaleatoriastansóloexigiendosu independencia,suequidistribuciónyque n seasuficientementegrande.Nitan siquieraseprecisaelconocimientodeladistribucióndeprobabilidaddelas variablesaleatorias,tansóloquesealamismaparatodasellas.
Enlapráctica,setienelavalidezdelaaproximaciónpara n ≥ 30,sibien laconvergenciapuedesermásrápidasiladistribuciónpoblacionalesparecida aladistribuciónNormal.
8
EduardoBeamonteCórdoba 9
POREJEMPLO:
siconsideramoslavariablealeatoria X ,unidadesdiarias vendidasdeunciertoartículo,conmedia μx =50 yvarianza
σ 2 x =100,laprobabilidaddequeen182díasseanvendidas másde9200unidadespuedeaproximarseutilizandoelteorema centraldellímite.Suponiendoindependenciayequidistribución paralasventasdiariassetieneque Y = 182 i=1 Xi ≈ N μy ,σ 2 y , donde μy =(182)(50)=9100 y
σ 2 y =(182)(100)=18200.Así, p(Y> 9200)= p Y μy σy > 9200 9100 √18200 = p(Zy > 0 7412)
0.2293,donde Zy = Y μy σy ≈ N (0, 1).
1.4.DistribucionesderivadasdelaNormal
Introducimosenesteapartadodosnuevasdistribucionesdeprobabilidad derivadasdelaNormal,ladistribución
Chi-cuadrado yladistribución tde Student.
Dadas X1 ,...,Xn variablesaleatoriasindependienteseidénticamentedistribuidassegúnuna N (0, 1) entonces
n i=1 X 2 i ∼ χ2 n .LaChi-cuadradoesuna distribucióncontinuaypositiva,tieneunúnicoparámetrodenominado grados delibertad,sumediacoincideconlosgradosdelibertadysuvarianzaesigual alamediaalcuadrado.
Y ∼ χ2 n ,variablesaleatoriasindependientesentonces
Y/n ∼ tn .LatdeStudentesunadistribucióncontinuadevariablereal, tieneunúnicoparámetrocoincidenteconlosgradosdelibertad,sufunciónde
Dadas X ∼ N (0, 1) e X √
Tema1.Revisióndemodelosyconvergenciaestocástica
densidadestantomássimilaraladelaNormalcuantomayoressonlosgrados delibertadyresultasimétricarespectoalamediacero,peroconlascolasun pocomáspesadas.
10