Hay dos tipos de estimaciones para cada parámetro de población: la estimación puntual y la estimación del intervalo de confianza (IC). Ambas variables continuas (por ejemplo, media de población) y variables dicotómicas (por ejemplo, proporción de población), uno calcula primero la estimación puntual de una muestra. Recuerde que las medias de muestra y las proporciones de muestra son estimaciones imparciales de los parámetros de población correspondientes.
Para las variables continuas y dicotómicas, la estimación del intervalo de confianza (IC) es un rango de valores probables para el parámetro de población basado en:
- la estimación puntual, por ejemplo, la media de la muestra
- El nivel de confianza deseado del investigador (más comúnmente del 95%, pero se puede seleccionar cualquier nivel entre 0-100%)
- y la variabilidad de muestreo o el error estándar de la estimación de puntos.
Hablando estrictamente, un intervalo de confianza del 95% significa que si tuviéramos que tomar 100 muestras diferentes y calcular un intervalo de confianza del 95% para cada muestra, entonces aproximadamente 95 de los 100 intervalos de confianza contendrán el valor medio verdadero (μ). En la práctica, sin embargo, seleccionamos una muestra aleatoria y generamos un intervalo de confianza, que puede o no contener la media verdadera. El intervalo observado puede ser sobre o subestimar μ. En consecuencia, el IC del 95% es el rango probable del parámetro verdadero y desconocido. El intervalo de confianza no refleja la variabilidad en el parámetro desconocido. Más bien, refleja la cantidad de error aleatorio en la muestra y proporciona un rango de valores que probablemente incluirán el parámetro desconocido. Otra forma de pensar en un intervalo de confianza es que es el rango de valores probables del parámetro (definido como la estimación puntual + margen de error) con un nivel específico de confianza (que es similar a una probabilidad).
¿Cuando el nivel de confianza pasa de 95% a 99% el intervalo?
Parece tener sentido, ¿verdad? ¡Obtenga el nivel de confianza tan alto como pueda! Bueno, a medida que aumenta el nivel de confianza, aumenta el margen de error. Eso significa que el intervalo es más amplio. Por lo tanto, ¡puede ser que el intervalo sea tan grande que sea inútil! Por ejemplo, ¿qué pasa si dije que tengo un 99% seguro de que obtendrá un puntaje entre 10 y 100 en su próximo examen? ¿Qué tan útil es eso al predecir su rendimiento? El intervalo es simplemente demasiado amplio. Hay algunos casos en los que no importa tanto, pero eso es caso por caso.
Por esta razón, los intervalos de confianza del 95% son los más comunes. A veces verá el 80% u otros en los libros de texto, pero en aplicaciones reales casi siempre es un intervalo del 95% con intervalos ocasionales del 90% y del 99%.
Los intervalos de confianza se pueden calcular para muchos otros parámetros de población y la interpretación sigue siendo generalmente las mismas. Usando la taquigrafía «estamos 95% seguros de que…», afirmaremos que estamos «bastante seguros» de que el parámetro (la media, la proporción de la población, etc.) está dentro del rango dado.
Como ejemplo, supongamos que tenemos un intervalo de confianza del 99% de (0.122, 0.141) para la proporción de votantes probables que aprueban una nueva medida. Entonces podríamos decir:
«Tenemos un 99% de confianza de que la proporción de todos los votantes probables que aprueban la nueva medida es entre 0.122 y 0.141»
«Tenemos un 99% confiando en que el porcentaje de todos los votantes probables que aprueban la nueva medida es entre el 12.2% y el 14.1%»
¿Cuál es el intervalo de confianza del 99%?
Los intervalos de confianza son estimaciones que se calculan a partir de los datos de la muestra para determinar los rangos que probablemente contengan el parámetro de población (media, desviación estándar) de interés. Por ejemplo, si nuestra población es (2,6), un intervalo de confianza de la media sugiere que la media de la población es probable entre 2 y 6. y ¿con qué confianza podemos decir esto? Obviamente 100%, ¿verdad? Porque conocemos todos los valores y podemos calcularlo muy fácilmente.
Pero en problemas de la vida real, este no es el caso. No siempre es factible o posible estudiar toda la población. ¿Asi que que hacemos? Tomamos datos de muestra. ¿Pero podemos confiar en una muestra? No, porque diferentes muestras de los mismos datos producirán una media diferente.
Por lo tanto, tomamos numerosas muestras aleatorias (de la misma población) y calculamos los intervalos de confianza para cada muestra y un cierto porcentaje de estos rangos contendrá el verdadero parámetro de población.
Este cierto porcentaje se llama nivel de confianza. Un nivel de confianza del 95% significa que de 100 muestras aleatorias tomadas, espero que 95 de los intervalos de confianza contengan el verdadero parámetro de población.
¿Sigo confundido? Entendamos esto a través de un ejemplo.
Supongamos que trabaja en una compañía de artículos deportivos que fabrica baloncesto. Hay varias plantas de fabricación y cada planta produce 10,000 bolas todos los días. Tienes que probar las bolas antes de que la compañía empaquete y las envíe.
Uno de los procedimientos de la industria estándar es verificar la primera altura de rebote de las bolas. Su colega sugiere tomar una muestra aleatoria (de la misma planta de fabricación) y formar un intervalo de confianza alrededor de la altura media de rebote.
Artículos Relacionados: