using Dates
Dates.format(now(), "E, dd U yyyy HH:MM:SS")
"Thursday, 15 May 2025 08:35:42"
using Distributions, StatsPlots, StatsBase, HypothesisTests
gr()
Plots.GRBackend()
Los parámetros son generalmente desconocidos, hay que estimarlos. Hay dos formas:
Se da un valor para el parámetro. La probabilidad de acierto es 0 o 1.
Se da un intervalo donde está el parámetro con una probabilidad dada. Hallar un intervalo de confianza para un parámetro $\Theta$ es hallar dos valores $L_i$ y $L_s$ tales que:
$$P(L_i < \Theta < L_s)=1-\alpha$$A $(1-\alpha)$ se le llama nivel de confianza, éste se fija de antemano. El nivel de confianza va en el centro de la distribución y en las colas se reparte el área equitativamente.
Un estimador es una función de los valores muestrales y una estimación es el valor del estimador para una muestra dada.
Parámetro | Estimador | Estimador más usual |
---|---|---|
$\mu$ | $\hat{\mu}$ | $\bar{X}$ |
$\sigma^2$ | $\hat{\sigma}^2$ | $S^2$ |
$\sigma$ | $\hat{\sigma}$ | $S$ |
$\pi$ | $\hat{\pi}$ | $p$ |
En lo sucesivo se asume que las muestras provienen de una población normal. De no haber normalidad se necesita un tamaño de muestra mayor o igual a 30.
En la práctica: confianza mínima de 95% y error máximo de 5%.
y = randn(100) .* 15 .+ 50
n = length(y)
α = 0.05
conf=1-α
σ = 15
Li, Ls = mean(y) .+ [-1,1] .* quantile(Normal(),1-α/2) .* σ ./√(n)
2-element Vector{Float64}: 47.57282830983698 53.45272026345715
Con 95% de confianza la media poblacional está entre 48.27 y 54.15
plot(Normal(), leg=false, ylims=[-0.05,0.4],fg_color_grid=:red, axiscolor=:blue,
title="Distribución Normal estándar")
plot!([-1.96; -1.96], [0; .058], lw=2, lc=:green, legend=false)
plot!([1.96; 1.96], [0; 0.058], lw=2, lc=:green, legend=false)
annotate!(0,0.1, text("1-α"))
annotate!(-3,.05,text("α/2"))
annotate!(3,0.05, text("α/2"))
annotate!(-1.96,-.02,text("-Z"))
annotate!(1.96,-0.02, text("Z"))
plot(TDist(7), label="t₍ₙ₎", ylims=[-0.05,0.4],fg_color_grid=:red, axiscolor=:blue, xlims=[-3.5,3.5])
plot!([-1.96; -1.96], [0; .0669], lw=2, lc=:green, legend=false)
plot!([1.96; 1.96], [0; 0.0669], lw=2, lc=:green, legend=false)
annotate!(0,0.1, text("1-α"))
annotate!(-3,.05,text("α/2"))
annotate!(3,0.05, text("α/2"))
annotate!(-1.96,-.02,text("-t"))
annotate!(1.96,-0.02, text("t"))
annotate!(2,0.3, text("t (n-1)gl"))
y1 = randn(25) .* 15 .+ 50
n1 = length(y1)
α = 0.05
Li, Ls = mean(y1) .+ [-1,1] .* quantile(TDist(n1-1),1-α/2) .* std(y1) ./√(n1)
2-element Vector{Float64}: 42.56364995600533 56.62055771169354
Usando el paquete HypothesisTests
de Julia, se puede calcular el intervalo de confianza para la media poblacional:
test1 = OneSampleTTest(y1)
confint(test1; level = 1-α, tail=:both)
(42.563649956005335, 56.620557711693536)
p = 0.35
n2 = 100
Li2, Ls2 = p .+ [-1,1].* quantile(Normal(),1-α/2) .* √(p*(1-p)/n2)
2-element Vector{Float64}: 0.2565156760890941 0.44348432391090586
Con 95% de confianza la proporción poblacional está entre 0.25 y 0.44
plot(Chisq(4),0,15, ylims=[-0.025,0.2],axiscolor=:blue, fg_color_grid=:red)
plot!([2; 2], [0; .184], lw=2, lc=:green, legend=false)
plot!([10; 10], [0; 0.016], lw=2, lc=:green, legend=false)
annotate!(5,0.05, text("1-α"))
annotate!(0.7,.05,text("α/2"))
annotate!(11,0.01, text("α/2"))
annotate!(10,-.01,text("χ²₂"))
annotate!(2,-0.01, text("χ²₁"))
annotate!(10,0.12, text("χ²₍ₙ₋₁₎ gl"))
Li1, Ls1 = (n1-1)*var(y1)./[quantile(Chisq(n1-1),1-α/2), quantile(Chisq(n1-1),α/2)]
2-element Vector{Float64}: 176.76410521489822 561.089554695506
Con 95% de confianza la varianza poblacional está entre 189.89 y 603.05
li2, ls2 = √(Li1), √(Ls1)
(13.295266270928845, 23.687328990316868)
Con 95% de confianza la desviación estándar poblacional está entre 13.78 y 24.55
Un director de personal ha observado que históricamente las puntuaciones de los tests de aptitud realizados a los solicitantes de empleo en los niveles de entrada siguen una distribución normal con una desviación típica de 32.4 puntos. Una muestra aleatoria de nueve puntuaciones del grupo actual de solicitantes tenía una puntuación media de 187.9 puntos.
Halle el intervalo de confianza al 80 por ciento de la media poblacional de las puntuaciones del grupo actual de solicitantes.
Tenemos X: puntaje del test de aptitud
$\sigma=32.4$, $n=9$, $\bar{X}=187.9$ y $1-\alpha=0.8$
187.9 .+ [-1,1] .* quantile(Normal(),0.9) .* 32.4 ./√(9)
2-element Vector{Float64}: 174.05924309211832 201.7407569078817
Con 80% de confianza el puntaje promedio del test está entre 174.05 y 201.74
Preocupa la velocidad a la que se conduce en un determinado tramo de una autopista. El radar indica la siguiente velocidad de una muestra aleatoria de siete automóviles en kilómetros por hora:
79 73 68 77 86 71 69
Suponiendo que la población sigue una distribución normal, halle el margen de error del intervalo de confianza al 95 por ciento de la velocidad media de todos los automóviles que circulan por este tramo de la autopista.
X: velocidad de los autos en ese tramo de la carretera (km/h)
vel=[79,73,68,77,86,71,69]
nvel=length(vel)
mvel = mean(vel)
dsvel = std(vel)
conf=0.95
mvel .+ [-1,1] .* quantile(TDist(nvel-1),conf+(1-conf)/2) .* std(vel) ./√(nvel)
2-element Vector{Float64}: 68.79926542136756 80.62930600720385
Con 95% de confianza la velocidad promedio en ese tramo de la carretera está entre 68.79 y 80.62 km/h
En una muestra aleatoria de 95 empresas manufactureras, 67 han indicado que su empresa ha obtenido la certificación ISO en los dos últimos años. Halle el intervalo de confianza al 99 por ciento para la proporción poblacional de empresas que han recibido la certificación en los dos últimos años.
X : Número de empresas con certificación ISO
Tenemos $n=95$, $p=\frac{67}{95}$ y $1-\alpha=0.95$
67/95 .+ [-1,1].* quantile(Normal(),0.95+(1-0.95)/2) .* √((67/95)*(1-(67/95))/95)
2-element Vector{Float64}: 0.6135822088884246 0.796944106901049
Con 95% de confianza la proporción de empresas con certificación ISO está entre 0.61 y 0.79
Un fabricante se dedica a recubrir con plástico superficies de metal. Se toma una muestra aleatoria de nueve observaciones sobre el grosor del recubrimiento de plástico de la producción de una semana; el grosor (en milímetros) de estas observaciones es el siguiente:
19.8 21.2 18.6 20.4 21.6 19.8 19.9 20.3 20.8
Halle el intervalo de confianza al 90 por ciento para la varianza poblacional suponiendo que la población sigue una distribución normal.
X : grosor de la capa de plástico (mm)
gro = [19.8,21.2,18.6,20.4,21.6,19.8,19.9,20.3,20.8]
ngro = length(gro)
vgro = var(gro)
Lv1, Lv2 = (ngro-1)*var(gro)./[quantile(Chisq(ngro-1),0.95), quantile(Chisq(ngro-1),0.05)]
2-element Vector{Float64}: 0.4062599353804301 2.3054655543635745
Con 90% de confianza la varianza del grosor de la capa de plástico está entre 0.40 y 2.30 $mm^2$
Si se necesita el intervalo para la desviación estándar, obtenga la raíz cuadrada dee cada uno de los límites de la varianza.
(√(Lv1), √(Lv2))
(0.6373852331050901, 1.5183759594921062)
Con 90% de confianza la desviación estándar del grosor de la capa de plástico esta entre 0.63 y 1.51 mm