ESTIMACIÓN |
Llamaremos así al procedimiento utilizado cuando se quiere conocer las características de un parámetro poblacional, a partir del conocimiento de la muestra.
Imaginemos
que hemos hecho la
encuesta a la que se
aludía en el
apartado anterior, y
queremos saber cual
es la verdadera
media del instituto.
Podemos hacer una
primera
aproximación,
utilizando la media
muestral km.
Sin embargo , este
valor está sesgado
debido a que solo
representa a una
muestra.
Podríamos decir que la media buscada es próxima a 3, pero ¿cuánto de próxima?. ¿Digamos que 200 metros más o menos?. Esto significaría que la media estaría entre 2,8 y 3,2. Esto último se denomina estimar por intervalo, y es el método que ahora vamos a ver.
INTERVALO DE CONFIANZA Se llama así a un intervalo en el que sabemos que está un parámetro, con un nivel de confianza específico |
Si dijéramos que la media se encuentra en el intervalo (2,8 , 3,2) con un nivel de confianza del 95%, lo que decimos es que si hiciéramos muestras de tamaño 40, y fuéramos contabilizando sus medias, a la larga, en el 95% de los casos, la media calculada estaría en dicho intervalo.
Además, al valor 0,2 (200 metros), que mide la mitad de la anchura del intervalo, se le denomina error máximo de la estimación. Lo anteriormente argumentado se expresa en términos estadísticos como:
"A
un nivel de
confianza del 95%,
la media poblacional
es 3 km, con un
error máximo de
estimación de km."
Por tanto:
NIVEL DE CONFIANZA Probabilidad de que el parámetro a estimar se encuentre en el intervalo de confianza. |
Los valores que se suelen utilizar para el nivel de confianza son el 95%, 99% y 99,9%
ERROR DE ESTIMACIÓN MÁXIMO Es el radio de anchura del intervalo de confianza. |
Este valor nos dice en qué margen de la media muestral se encuentra la media poblacional al nivel de confianza asignado.
Durante este curso aprenderemos a realizar estimaciones sobre la media y la proporción de una característica en una población. La estimación de otros parámetros poblacionales, tales como la desviación típica, quedará fuera de nuestro estudio.
ESTIMACIÓN DE LA MEDIA DE UNA POBLACIÓN
Para estimar la media poblacional por medio de intervalos de confianza, será necesario recordar que el Teorema Central del Límite nos daba información de como se hallaban distribuidas las medias muestrales: "normalmente" con una media igual a la de la población original m (que es la que ahora tratamos de conocer) y desviación típica
Supongamos
que hemos analizado
la muestra ya
nombrada de media Km.,
y que sabemos que la
desv. típica de la
población es de s=0,4
km., y que nos
planteamos estimar
la media de todo el
instituto, con un
nivel de confianza
del 95% .El proceso
para realizar la
estimación es el
siguiente:
Sabemos por el T.C.L. que las medias muestrales se distribuyen según
La siguiente figura nos ilustrará:
Hallamos el valor k de forma que p(-k<Z<k)=0,95 , o lo que es lo mismo p(Z<k)=0,975. Consultando nuestra tabla de la distribución normal, encontraremos que k=1.96 .
Este
valor nos dice que
la medias muestrales
se encuentran en un
95% de los casos
como máximo a 1.96
desviaciones
típicas de la media
buscada,
es decir,
nuestra media
,
en un 95% de los
casos, dista de la
media poblacional
menos de
1,96.0,063=0,124 km.
Si tomamos un intervalo con centro en dicha media muestral , y radio 0,124, en un 95% de los casos la media buscada estará dentro del intervalo.
Encontramos por tanto que a un nivel de confianza del 95%, la media poblacional es de 3 km. con un error máximo de
o lo que es lo mismo, existe una probabilidad del 95%, de que la media buscada se encuentre en el intervalo de confianza (3-0,124 , 3+0,124) = (2,976 , 3,124 ).
Así pues en general para un proceso de estimación de la media, el intervalo de confianza será:
(
-
E ,
+
E)
siendo
la
media de la muestra,
y
el
error de
estimación.
|
Para
entender
mejor
el
proceso,
observa
el
gráfico
interactivo
en
el
que
se
supone
que
la
verdadera
media
de
la
población
es
µ=3.1
km.
Comenzamos
con
el
valor
k=1,96,
que
corresponde
a
una
confianza
del
95%.
Luego
hallamos
el
área
roja,
que
corresponde
a
las
medias
muestrales
que
tienen
una
probabilidad
de
aparición
del
95%.
Si
la
media
muestral
(mm)
obtenida
es,
como
en
el
caso
que
nos
ocupa,
Varía el nivel de confianza, y anota que le ocurre al intervalo de confianza. Así mismo, puedes variar el valor de la media muestral, e investigar, qué valores dan lugar a intervalos que no contienen a la media de la población y cuál es la probabilidad de ocurrencia de dichos valores. |
TAMAÑO DE LA MUESTRA
Pero imaginemos ahora, que nos disponemos a elegir una muestra para poder determinar con un 95% de confianza la media, con un margen de error de 50 metros. Desde luego hará falta una muestra mayor para tener tan poco margen de error ¿Cuál deberá ser el tamaño de la muestra para conseguirlo? .
Despejando en
obtenemos que
Como k=1,96 , E=0,05 y s=0,4 calculando obtendremos que n=245,8 es decir, redondeando, hará falta una muestra correspondiente a 246 estudiantes para que el margen de error sea de tan sólo 50 metros.
De la expresión del tamaño de la muestra, se deduce muy fácilmente, que deberá ser mayor cuanto mayor sea:
a) El nivel de confianza asignado
b) El grado de variabilidad de los datos originales
Por el contrario, cuanto mayor sea el tamaño de la muestra, menor será el error de la estimación.
Resultará muy interesante que además de las siguientes, realices las actividades de la hoja de cálculo "Estimación de la media"