1_9788411698627

Page 1

INFERENCIA ESTADÍSTICA

Grado en Administración y Dirección de Empresas

Eduardo Beamonte Córdoba
apuntes

ACCESO GRATIS a la Lectura en la Nube

Para visualizar el libro electrónico en la nube de lectura envíe junto a su nombre y apellidos una fotografía del código de barras situado en la contraportada del libro y otra del ticket de compra a la dirección:

ebooktirant@tirant.com

En un máximo de 72 horas laborales le enviaremos el código de acceso con sus instrucciones.

La visualización del libro en NUBE DE LECTURA excluye los usos bibliotecarios y públicos que puedan poner el archivo electrónico a disposición de una comunidad de lectores. Se permite tan solo un uso individual y privado

Copyright ® 2023

Todos los derechos reservados. Ni la totalidad ni parte de este libro puede reproducirse o transmitirse por ningún procedimiento electrónico o mecánico, incluyendo fotocopia, grabación magnética, o cualquier almacenamiento de información y sistema de recuperación sin permiso escrito del autor y del editor.

En caso de erratas y actualizaciones, la Editorial Tirant lo Blanch publicará la pertinente corrección en la página web www.tirant.com.

© TIRANT LO BLANCH

EDITA: TIRANT LO BLANCH VALENCIA

TELFS.: 96/361 00 48 - 50

Email: tlb@tirant.com

www.tirant.com

Librería Virtual: www.tirant.es

DEPOSITO LEGAL: V-2474-2023

ISBN: 978-84-1169-862-7

MAQUETA E IMPRIME:

Si tiene alguna queja o sugerencia, envíenos un mail a: atencioncliente@tirant.com.

En caso de no ser atendida su sugerencia, por favor, lea nuestro procedimiento de quejas en: www.tirant.net/index.php/empresa/politicas-de-empresa

Responsabilidad Social Corporativa

http://www.tirant.net/Docs/RSCTirant.pdf

INFERENCIAESTADÍSTICA

GradoenAdministraciónyDireccióndeEmpresas EduardoBeamonteCórdoba Valencia,septiembrede2023.
1.Revisióndemodelosyconvergenciaestocástica1 1.1.Variablesaleatoriasymodelosdeprobabilidad ..........1 1.2.Convergenciaenmodelosestocásticos. ..............6 1.3.Teoremacentraldellímite .....................7 1.4.DistribucionesderivadasdelaNormal. ..............9 2.Introducciónalainferenciaestadística11 2.1.Conceptosgenerales:universo,poblaciónymuestra.Objetivos delainferenciaestadística .....................12 2.2.Tiposdemuestreo.Muestreoaleatorio ..............14 2.3.Estadísticosydistribucionesasociadas ..............15 3.Estimación19 i
Índice
ii ÍNDICE 3.1.Estimaciónpuntual:estimadoresyestimaciones.Propiedades delosestimadores ..........................19 3.2.Métodosdeobtencióndeestimadores ...............21 3.3.Estimaciónporintervalos ......................22 3.4.Determinacióndeltamañomuestral ................31 4.Contrastesdehipótesisparamétricas37 4.1.Planteamientogeneraldelacontrastacióndehipótesisestadísticas38 4.2.Contrastesdehipótesisunilaterales ................41 4.3.Contrastesdehipótesisbilaterales .................50 5.Contrastesdehipótesisnoparamétricas61 5.1.Contrastesdebondaddeajuste. .................62 5.2.Contrastesdeindependenciaydehomogeneidad.. .......64 5.3.Otroscontrastesnoparamétricos .................70

Tema1

Revisióndemodelosy convergenciaestocástica

EnelpasadocursodeEstadísticaBásicaseintrodujeronalgunoscapítulos dedicadosalosmodelosdeprobabilidadmásimportantes.Enesteprimertema introductorioserevisanlosquevanaserutilizadosenelpresentecursoyse estableceelconceptodeconvergenciaestocásticacomounaextensióndela convergencianuméricaalcampodelasvariablesaleatorias.

1.1.Variablesaleatoriasymodelosdeprobabilidad

Conelfindellevaracabounaasignaciónnuméricaalosresultadosdeun experimentoaleatoriosedefinenlasvariablesaleatorias,quenosonmásque aplicacionesquetransformanlossucesosdeunespaciomuestralennúmeros. Cuandoladimensiónesigualosuperioradosentoncessehabladevectores

1

Tema1.Revisióndemodelosyconvergenciaestocástica aleatorios.

Losmodelosdeprobabilidadunivariantesdiscretosmásimportantessonel Bernouilli,elBinomialyelPoissonydentrodeloscontinuos,elUniforme,el ExponencialyelNormal.

ElsencillomodelodeprobabilidadBernouillisecorrespondeconunadistribucióndicotómica.Lafuncióndeprobabilidadodecuantíadeunavariable aleatoria X condistribución Br (θ

es

θ son, respectivamente,

Larealizaciónde n experimentosaleatoriosindependientesdeltipoBernouilliylaconsideracióndelnúmerodeéxitosenesas n pruebas,dalugara unavariablealeatoriacuyadistribuciónrecibeelnombredeBinomialytiene dosparámetros: n,elnúmeroderealizacionesindependientesdelexperimento y

θ ,laprobabilidaddeéxitoencadaunadelaspruebasBernouilli.

Lafuncióndeprobabilidaddeunavariablealeatoria X ∼ Bi(n,θ ),quenos proporcionalaprobabilidaddeobtenerunnúmerodeterminadodeéxitosen

2
)
f (x)= ⎧ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎩ θ si x =1 1 θ si x =0 0 enotrocaso.
LamediaylavarianzadeunadistribuciónBernouillideparámetro μ = E (X )= xi ∈X (Ω) xi f (xi )=(0)(1 θ )+(1)(θ )= θ σ 2 = Var (X )= xi ∈X (Ω) x 2 i f (xi ) μ 2 =(0)2 (1 θ )+(1)2 (θ ) θ 2 = = θ (1 θ )

EduardoBeamonteCórdoba 3

n pruebasdicotómicasindependienteses

f (x)= ⎧ ⎨ ⎩ n x θ x (1 θ )n x si x =0, 1,...,n 0 enotrocaso

Lamediadeladistribución Bi(n,θ ) es μ = nθ ysuvarianza σ 2 = nθ (1 θ ).

Sedicequeunavariablealeatoria X sigueunadistribucióndeprobabilidad Poissondeparámetro

λ> 0,

X ∼ Po(λ),cuandosufuncióndeprobabilidad odecuantíaesiguala

f (x)= ⎧ ⎨ ⎩ exp( λ) λx x! si x ∈ N 0 enotrocaso

LamediaylavarianzadeunavariablealeatoriaPoissonsonigualesy coincidenprecisamenteconelparámetro

λ deladistribución.

Dados

a,b ∈ R con

a<b,sedicequeunavariablealeatoriasigueuna distribuciónUniformeentre a y

b,

X ∼ Un(a,b),sisufuncióndedensidad resultaiguala

f (x)= ⎧ ⎨ ⎩ 1 b a si x ∈ [a,b] 0 enotrocaso

Lamediadeladistribución Un(a,b) eselpuntomediodelintervalo, μ = a+b 2 ysuvarianzaes σ 2 = (b a)2 12

SedicequeunavariablealeatoriapositivasigueunadistribuciónExponencialdeparámetro

λ> 0,

X ∼ Ex(λ),sisufuncióndedensidades

f (x)= ⎧ ⎨ ⎩ λ exp( λx) si x> 0 0 enotrocaso

Tema1.Revisióndemodelosyconvergenciaestocástica

Lamediadeestadistribuciónesigualalinversodelparámetro, μ = 1 λ ,y suvarianzaresulta σ 2 = 1 λ2

Sinningúngénerodedudas,ladistribuciónNormaleslamásimportante delasdistribucionescontinuasutilizadasenEstadística.Unavariablealeatoria quetomavaloresentodalarectarealsigueunadistribuciónNormaldemedia μ yvarianza σ 2 ,

X ∼ N (μ,σ 2 ),sisufuncióndedensidades

f (x)= 1 σ √2π exp 1 2 x μ σ

2 ,x ∈ R.

X ∼ N (0, 1) ysedicequelavariable aleatoriasigueunadistribuciónNormalestándarotipificada.

Cuando μ =0 y σ =1,entonces

TodatransformaciónlinealdeunavariablealeatoriaNormalestambién Normal,porloquepuedeserobtenidacualquierprobabilidadapartirdela distribuciónNormalestándar.Enefecto,comolafuncióndedistribucióncorrespondienteaunavariableNormaltipificadaseencuentratabulada,para hallarcualquierprobabilidaddeltipo p(a ≤ X ≤ b),relativaaunavariable X ∼ N (μ,σ 2 ),seprocedeatipificarlamismayaconsultarlastablas,

eslafuncióndedistribuciónNormalestándar.

LastablasdelafuncióndedistribuciónNormalestándarsuelenestardisponiblessóloparaabscisaspositivas,puesdebidoalasimetríarespectoalcero dedichadistribuciónsetieneque p(X ≤ x)=Φ(x)=1 Φ( x)= p(X ≥ x), ∀x ∈ R.

Enlorelativoalosmodelosdeprobabilidadmultivariantestambiénla distribuciónNormalmultivarianteeslamásimportantedetodas.Seestablece sudefiniciónenelcasobidimensionaldelsiguientemodo.

4
p(a ≤
p a μ σ ≤ X μ σ ≤ b μ σ =Φ b μ σ Φ a μ σ ,
X ≤ b)=
donde Φ

EduardoBeamonteCórdoba 5

Z2 variablesaleatoriasindependienteseidénticamentedistribuidassegúnuna N (0, 1),entonceselvectoraleatorio Z1 Z2 ∼ N µ = 0 0 , Σ= 10 01

(Z1 ,Z2 ) sigueuna distribuciónNormalbivariantereducidaoBinormalreducida,

Definiendodeunmodoadecuadounatransformaciónlinealbivariantesobre (Z1 ,Z2 ) podemosobtenerunvectoraleatorioconvectordemediasymatriz devarianzas-covarianzascualesquieraycondistribuciónNormalbivarianteo Binormal.

LadistribuciónNormalbivariantetambiéngozadealgunasinteresantesy atractivaspropiedades,comoporejemploquetantolasmarginalesunivariantes comolascorrespondientesdistribucionescondicionadasdeunaBinormalson Normales.

TambiénsetieneenelcasoNormalqueincorrelaciónimplicaindependencia,esdecir,si X1 y

X2 sonNormalesincorreladas,entonces X1 y

X2 son independientes.

2 ) ∼ N (µ, Σ)

yconsideradalatransformaciónlinealunivariante

2 ,estoes,si X1 ∼ N (μ1 ,σ 2 1

, X2 ∼ N (μ2

,σ 2 2 ), independientes,entoncespara a,b,c ∈ R

linealunivariante Y = aX1 + bX2 + c ∼ N (aμ1 + bμ2 + c,a2 σ 2 1 + b2 σ 2 2 )

Dadas Z1 y
Dadounvectoraleatorio Y = aX1 + bX2 + c,con
(X1 ,X a,b,c ∈ R,severificaque Y ∼ N (aμ1 + bμ2 + c,a2 σ 2 1 + b2 σ 2 2 +2abσ12 )
TambiénsetieneelresultadoanteriorbajolahipótesisdeNormalidade independenciapara X1 y
X
)
,secumplequelatransformación

Tema1.Revisióndemodelosyconvergenciaestocástica

POREJEMPLO:

X2 representan,respectivamente,losingresosbrutosylosgastos, enmilesdeeuros,derivadosdelaventadeunvalormobiliario. Supongamosdichovectormodelizadosegúnunadistribución

probabilidaddequelosingresosnetosobtenidosporlaventa deundeterminadovalorseansuperioresa 584 milesdeeuros

p(

= X1 X2 ∼

yrepresentalosingresosnetosenmilesdeeuros.Sume-

Dadaunasucesióndevariablesaleatorias,laideaesqueapesardelhabitual desconocimientodelasrespectivasdistribucionesdeprobabilidad,enmuchas ocasionesesposibleaproximarladistribucióndeprobabilidaddelasumade ungrannúmerodevariables.

6
Normalbivariante X1 X2 ∼ N 600 30 , 10030 309 ,entoncesla
esiguala
seaelvectoraleatorio T ≥ 584),donde T
(X1 ,X2 ) cuyascomponentes N μt ,σ 2 t
X1 y diaes μt = μ1 μ2 =600 30=570,suvarianza σ 2 t = σ 2 1 + σ 2 2 2σ12 =100+9 60=49 ylaprobabilidad requeridaes p(T ≥ 584)= p T μt σt ≥ 584 570 7 = p(Z ≥ 2)= 1 Φ(2)=0 0227,donde Z = T μt σt ∼ N (0, 1)
1.2.Convergenciaenmodelosestocásticos
Elconceptodeconvergenciaparalassucesionesnuméricaspuedesergeneralizadoparavariablesaleatoriasyhablarasídeunasuertede convergencia estocástica

EduardoBeamonteCórdoba 7

Existendiferentestiposdeconvergenciaestocástica:convergenciacasisegura,convergenciaenprobabilidad,convergenciaenmediacuadrática,convergenciaendistribución,etc.Sinembargo,noesobjetodeestecursolaconsideracióndelosdistintostiposdeconvergencia.Únicamenteintroduciremosenel siguientepuntounresultadogenéricodegranimportanciaestadística.

La

leydelosgrandesnúmeros esunodelosprimerosymásimportantes resultadosdeconvergenciaestocástica.Bajosusdistintasformulacionessegún lashipótesisconsideradas,básicamentedemuestralaconvergenciadelpromediodeunasucesióndevariablesaleatoriasalamediadelasesperanzasdelas mismas.

Porejemplo,el teoremadeBernouilli esuncasoparticulardeestaley paravariablesaleatoriasBernouilli.Dadaunasucesión

{Xi }∞ i=1 devariables aleatoriasindependienteseidénticamentedistribuidassegúnuna Br (θ ),la mediaaritméticadelas n primerasvariablesaleatorias,

n i=1 Xi n ,convergeala mediapoblacional

θ .

Latambiénllamada leyderegularidadestadística esintuitivamenteun resultadodesencillaobservación.Sienunapoblaciónexisteunadeterminadaproporcióndeindividuosconunaciertacaracterística,seleccionadosunos cuantosparasuexamen,laproporcióndeindividuosconlacaracterísticade interésestarátantomáspróximaalaproporciónpoblacionalcuantomayor seaelnúmerodeindividuosseleccionados.

1.3.Teoremacentraldellímite

Sinningúngénerodedudas,el teoremacentraldellímite esunodelos resultadosestadísticosdemayorimportancia.Tambiénsehanformuladodiferentesteoremassegúnlashipótesiscondicionantesperolamásgenérica,yla

Tema1.Revisióndemodelosyconvergenciaestocástica consideradaenestecurso,aproximaladistribucióndeprobabilidaddelasuma demuchasvariablesaleatoriasindependienteseidénticamentedistribuidasa unadistribuciónNormal.

{Xi }∞ i=1 variablesaleatoriasindependienteseidénticamentedistribuidasconmedia μ yvarianza σ 2 nonula,entonceslavariable n i=1 Xi ≈ N (nμ,nσ 2 ).

Formalmente,dadas

ComocualquiercombinaciónlinealdevariablesaleatoriasNormalesindependientestambiénesNormal,setendráasimismoladistribuciónaproximada para

X n = n i=1 Xi n ≈ N μ, σ 2 n

Lavarianzadeestaúltimadistribuciónpuedeserreducidatantocomose deseesinmásqueaumentareltamañomuestral n.Comolavarianzamidela dispersiónrelativarespectoalamedia,podríatambiénseraproximadalavariablealeatoria X n alamediapoblacionaldesconocidaconelgradodeprecisión requerido.

Suimportanciaradicaenlaposibilidaddeobtencióndecualquierresultado aproximadorelativoalasumade n variablesaleatoriastansóloexigiendosu independencia,suequidistribuciónyque n seasuficientementegrande.Nitan siquieraseprecisaelconocimientodeladistribucióndeprobabilidaddelas variablesaleatorias,tansóloquesealamismaparatodasellas.

Enlapráctica,setienelavalidezdelaaproximaciónpara n ≥ 30,sibien laconvergenciapuedesermásrápidasiladistribuciónpoblacionalesparecida aladistribuciónNormal.

8

EduardoBeamonteCórdoba 9

POREJEMPLO:

siconsideramoslavariablealeatoria X ,unidadesdiarias vendidasdeunciertoartículo,conmedia μx =50 yvarianza

σ 2 x =100,laprobabilidaddequeen182díasseanvendidas másde9200unidadespuedeaproximarseutilizandoelteorema centraldellímite.Suponiendoindependenciayequidistribución paralasventasdiariassetieneque Y = 182 i=1 Xi ≈ N μy ,σ 2 y , donde μy =(182)(50)=9100 y

σ 2 y =(182)(100)=18200.Así, p(Y> 9200)= p Y μy σy > 9200 9100 √18200 = p(Zy > 0 7412)

0.2293,donde Zy = Y μy σy ≈ N (0, 1).

1.4.DistribucionesderivadasdelaNormal

Introducimosenesteapartadodosnuevasdistribucionesdeprobabilidad derivadasdelaNormal,ladistribución

Chi-cuadrado yladistribución tde Student.

Dadas X1 ,...,Xn variablesaleatoriasindependienteseidénticamentedistribuidassegúnuna N (0, 1) entonces

n i=1 X 2 i ∼ χ2 n .LaChi-cuadradoesuna distribucióncontinuaypositiva,tieneunúnicoparámetrodenominado grados delibertad,sumediacoincideconlosgradosdelibertadysuvarianzaesigual alamediaalcuadrado.

Y ∼ χ2 n ,variablesaleatoriasindependientesentonces

Y/n ∼ tn .LatdeStudentesunadistribucióncontinuadevariablereal, tieneunúnicoparámetrocoincidenteconlosgradosdelibertad,sufunciónde

Dadas X ∼ N (0, 1) e X √

Tema1.Revisióndemodelosyconvergenciaestocástica

densidadestantomássimilaraladelaNormalcuantomayoressonlosgrados delibertadyresultasimétricarespectoalamediacero,peroconlascolasun pocomáspesadas.

10

Tema2 Introducciónalainferencia estadística

Resultahabitualparaelinvestigadorcomplementarlaestadísticadescriptiva,lameraclasificaciónydescripcióndelosdatos,conla inferenciaestadística, consistenteenlaobtencióndeconclusionesgenéricasapartirdelosmismos. Además,alestarbasadasenunapartedeltodo,estasconclusioneshande tenerencuentaelazary,consecuentemente,lainferenciaestadísticaprecisala utilizacióndeherramientasdelaTeoríaMatemáticadelaProbabilidadpara laformulacióndeunmodelodeprobabilidadadecuadoparalosdatos.

11

Tema2.Introducciónalainferenciaestadística

2.1.Conceptosgenerales:universo,poblacióny muestra.Objetivosdelainferenciaestadística

Uncolectivodeindividuosoconjuntode N elementosperfectamenteidentificados, U = {u1 ,...,uN },recibeelnombrede universo.Consideradauna variable X ,observablesobretodosycadaunodelosindividuos,sedenomina

población asociadapor X aluniverso U alconjuntode N observaciones (x1 ,...,xN ).

Evidentemente,puedenserconsideradasdiferentespoblacionessobreun mismouniverso.Tantascomocaracterísticassusceptiblesdeobservación.

Elanálisisoestudiodeunapoblaciónsuelesernooperativo,cuandono imposible.Suhabitualelevadotamañohaceinviableelanálisisdetodassus unidadesyesporelloqueserecurreala investigaciónpormuestreo.Sedefine una

muestra detamaño n deluniverso U comounsubconjuntodelmismo, {u1 ,...,un }.Porextensión,tambiénsedenominamuestra,datosu observacionesmuestrales alcorrespondientesubconjuntodelapoblación,

(x1 ,...,xn ) Obsérvesequeparanocomplicarendemasíalanotaciónseprocedenormalmenteaabusarunpocodelamisma.

Comosehacomentado,elprincipalobjetivodelainferenciaestadística eslaobtencióndeconclusionesparaunapoblaciónestudiandotansólouna muestradelamisma.Esporesto,porelhechodeestablecerconclusionespara untodoanalizandotansólounaparte,quedichasconclusioneshandeser matizadasporungradodefiabilidad.Porladificultadoimposibilidaddesu obtención,lascaracterísticaspoblacionessonaproximadasporlasmuestrales conelcorrespondientegradodeprecisión.

12

Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.