Formula de muestreo estratificado: la guía completa

El muestreo aleatorio estratificado es la técnica de romper la población de interés en grupos (llamados estratos) y seleccionar una muestra aleatoria de cada uno de estos grupos. Romper la población en estratos ayuda a garantizar que se seleccione una combinación representativa de unidades de la población y se asigne suficiente muestra a los grupos sobre los que desea formar estimaciones. Por ejemplo, es posible que desee estratificar por geografía (por ejemplo: estado) para garantizar que se seleccione una buena combinación de áreas geográficas o para ayudar a producir estimaciones para diferentes áreas geográficas. Para obtener más información sobre la estratificación, consulte el Manual de diseño de encuestas básicas en el sitio web de ABS haciendo clic aquí.

Ejemplo

Tiene un presupuesto asignado de $ 10,000 para determinar qué tan satisfechos están sus clientes. Ha decidido ejecutar una encuesta y desea producir estimaciones para clientes comerciales grandes, medianos y pequeños. Su base de datos muestra que tiene 10,000 grandes clientes comerciales, 20,000 clientes de negocios medianos y 8,000 clientes de pequeñas empresas. La encuesta del año pasado determinó:
– El 40% de las empresas de gran tamaño estaban satisfechas
– El 50% de las empresas de tamaño mediano fueron satisfechos
– El 60% de las empresas de tamaño pequeño estaban satisfechos
– 49% de satisfacción en todas las empresas

También decide que desea que su margen de error para cada grupo sea más/menos 3 puntos porcentuales, con una confianza del 95%. Esto significa que puede estar seguro de que en el 95% de las muestras, el intervalo de confianza cubrirá el verdadero valor de la satisfacción del cliente.

Para determinar el tamaño total de la muestra requerido, debe ingresar detalles en la calculadora de tamaño de la muestra para cada estrato a la vez.

¿Cómo calcular la varianza para muestreo estratificado?

La varianza es un valor numérico utilizado para
Mida la variabilidad de las observaciones en un grupo. Si las observaciones individuales varían mucho de la media del grupo,
La varianza es grande; y viceversa.

Dada una muestra aleatoria estratificada, necesitamos calcular la varianza de la muestra dentro de cada estrato (S2H):

donde S2H es una estimación de muestra de la varianza de la población en el estrato h,
xih es el valor del elemento ésimo de Stratum H,
XH es la media de muestra de Stratum H,
y NH es el número de observaciones de muestra del estrato h.

Con una proporción, la varianza dentro de cada estrato se puede estimar a partir de una muestra como:

donde S2H es una estimación de muestra de la varianza dentro del estrato h,
NH es el número de observaciones del estrato h en la muestra,
y el pH es una estimación de muestra de la proporción es el estrato h.

¿Por qué nos importa la varianza dentro de cada estrato? Se necesita varianza del estrato para calcular el error estándar. Y por que hacemos
¿Te importa el error estándar? Sigue leyendo.

Cuando estimamos una media o una proporción de una muestra aleatoria estratificada, el error estándar (SE) de la estimación es:

donde nh es el número de observaciones de muestra del estrato h,
NH es el número de elementos del estrato h en la población,
N es el número de elementos en la población,
y S2H es una estimación de muestra de la varianza de la población en el estrato h.

Piense en el error estándar como la desviación estándar
de una estadística de muestra.
En el muestreo de la encuesta, generalmente hay muchos subconjuntos diferentes de la población que podríamos elegir para el análisis. Cada uno diferente
La muestra podría producir una estimación diferente del valor de un parámetro de población. El error estándar proporciona una cuantitativa
medida de la variabilidad de esas estimaciones.

¿Cómo se calcula el muestreo estratificado?

La precisión y el costo de un diseño estratificado están influenciados por el camino
que los elementos de muestra se asignan a los estratos.

Un enfoque es la estratificación proporcional. Con estratificación proporcional,
El tamaño de la muestra de cada estrato es proporcional a la población
tamaño del estrato. Estratos
Los tamaños de muestra están determinados por la siguiente ecuación:

Donde NH es el tamaño de la muestra para Stratum H, NH
es el tamaño de la población para el estrato h, n es el tamaño total de la población y n
es el tamaño total de la muestra.

Otro enfoque es la estratificación desproporcionada, que puede ser una mejor opción (por ejemplo,
Menos costo, más precisión) si los elementos de muestra se asignan correctamente a los estratos.
Para aprovechar la estratificación desproporcionada, los investigadores necesitan
Responda preguntas como:

  • Dado un presupuesto fijo, ¿cómo se debe asignar la muestra para obtener la mayor precisión?
    de una muestra estratificada?
  • Dado un tamaño de muestra fijo, ¿cómo se debe asignar la muestra para obtener más
    ¿Precisión de una muestra estratificada?
  • Dado un presupuesto fijo, ¿cuál es la mayor precisión que puedo obtener de un
    muestra estratificada?
  • Dado un tamaño de muestra fijo, ¿cuál es la mayor precisión que puedo obtener de un
    muestra estratificada?
  • ¿Cuál es el tamaño de muestra más pequeño que proporcionará un nivel determinado de encuesta?
    ¿precisión?
  • ¿Cuál es el costo mínimo para lograr un nivel dado de precisión de la encuesta?
  • Dado un plan de asignación de muestra particular, ¿qué nivel de precisión puedo
    ¿suponer?

¿Cómo calcular una muestra estratificada en Excel?

Acabo de buscar en Google la pregunta anterior y no encontré nada más que un mar de confusión, software de propiedad y (para mí) macros incomprensibles. Un poco más de pensar y la investigación surgió con una respuesta bastante simple, por lo que quería documentarla aquí para cualquier otro profesional de M&E amante de Excel perdido. Supongo un conocimiento de todas las funciones que menciono a continuación, si no las entiendes Google o me envía un correo electrónico y lo explicaré. También puede descargar un ejemplo de Excel anotado de muestreo aleatorio estratificado aquí.

Comience resolviendo qué tan grande desea que sea su muestra en cada categoría. Esta debería ser una tarea relativamente fácil. Ejecute un tiroteo en sus datos (o use Countifs, si es de la vieja escuela); esto debería revelar el número total de cada categoría en su marco de muestreo. Por ejemplo, si está probando a las personas en función de la ubicación, puede encontrar 100 en la ubicación A, 200 en la ubicación B y 200 en la ubicación C. Elabere el porcentaje que cada grupo contribuye al todo (en este ejemplo A es el 20% , B es 40%, y C otro 40%) y multiplique esto por el tamaño total de su muestra para brindarle el tamaño de la muestra deseado por categoría.

A continuación, asigne cada entrada en su marco de muestreo un número aleatorio, utilizando la función rand (). Probablemente desee copiar esta columna y pegar como valor, para detener los valores que cambian cada vez que haga clic en cualquier parte. Esta será la base de su muestreo. Si estuviera haciendo un muestreo aleatorio normal, simplemente clasificaría estos números aleatorios y elegiría los pocos principales. Sin embargo, dado que está haciendo una muestra estratificada, deberá usar una función Rankif. Esto no es de serie en Excel, pero es fácil de replicar usando esta excelente guía. Use el RankIF para clasificar los datos, de acuerdo con cuán grande es el número aleatorio dentro de la categoría de muestreo. En el ejemplo anterior, terminará con una lista clasificada para la ubicación A, B y C independientemente del otro. )

¿Cómo se hace un muestreo estratificado en Excel?

En estadísticas, a menudo tomamos muestras de una población y usamos los datos de la muestra para sacar conclusiones sobre la población en su conjunto.

Un método de muestreo comúnmente utilizado es el muestreo aleatorio estratificado, en el que una población se divide en grupos y un cierto número de miembros de cada grupo se seleccionan al azar para ser incluidos en la muestra.

El siguiente ejemplo paso a paso muestra cómo realizar un muestreo aleatorio estratificado en Excel.

Primero, ingresemos el siguiente conjunto de datos en Excel:

A continuación, realizaremos un muestreo aleatorio estratificado en el que seleccionamos aleatoriamente a dos jugadores de cada equipo de baloncesto que se incluirán en la muestra final.

A continuación, creemos una nueva columna titulada Random y escriba en = rand () para el primer valor:

A continuación, pase el ronda sobre la esquina inferior derecha de la celda hasta que aparezca una pequeña cruz ( +) y haga doble clic para pegar la fórmula = rand () en todas las celdas restantes en la columna.

Desafortunadamente, cada vez que llegamos a los valores de la celda aleatoria cambiarán. Para evitar esto, copie cada valor en la columna E, haga clic derecho y elija Pegar los valores en la misma columna para que los valores aleatorios ya no cambien.

A continuación, resalte todos los datos. Luego haga clic en la pestaña Datos a lo largo de la cinta superior. Luego haga clic en el botón Ordenar dentro del Grupo Sort y Filtro.

En la nueva ventana que aparece, ordene primero por equipo de A a Z, luego ordene al azar de la más pequeña a la más grande.

Una vez que haga clic en Aceptar, los datos se ordenarán en consecuencia.

¿Cómo se elabora el muestreo estratificado?

La idea básica detrás del muestreo estratificado es dividir una población heterogénea en grupos o subpoblaciones más pequeñas, de modo que las unidades de muestreo son homogéneas con respecto a la característica en estudio. Estos grupos homogéneos se llaman colectivamente estratos. Cada grupo se considera separado y se extrae una muestra aleatoria de tamaño predeterminado de cada estrato.

una. Divida la población de N unidades en K grupos homogéneos (estratos) con cada grupo que contiene unidades Nₖ. Cada estrato consiste en unidades no superpuestas que son homogéneas con respecto a la característica en estudio de tal manera que

b. Dibuje una muestra aleatoria de tamaño Nᵢ de cada estrato independientemente de otros estratos.

C. Todas las unidades de muestreo extraídas de cada estrato agrupado constituyen una muestra estratificada de tamaño

Muestreo estratificado: Imagen del autor

Entendamos el concepto usando un ejemplo. Supongamos que estamos interesados ​​en conocer el peso promedio de los estudiantes en una escuela de clase 1 a la Clase 12. El peso de los estudiantes, en general, varía según su edad. Los estudiantes más jóvenes tenderán a tener pesos más bajos en comparación con los estudiantes de alto nivel. Una forma de determinar el peso promedio de los estudiantes podría ser medir el peso de todos los estudiantes y luego tomar el promedio, sin embargo, es intensivo en recursos y toma tiempo. Definitivamente no es factible cuando el número de estudiantes es muy grande. El muestreo estratificado es útil en estas situaciones. Uno puede dividir a todos los estudiantes en diferentes estratos, como

¿Qué se hace en un muestreo estratificado?

Descripción: El muestreo estratificado es una técnica de muestreo común utilizada por los investigadores cuando intentan sacar conclusiones de diferentes subgrupos o estratos. Los estratos o subgrupos deben ser diferentes y los datos no deben superponerse. Mientras usa un muestreo estratificado, el investigador debe usar un muestreo de probabilidad simple. La población se divide en varios subgrupos, como la edad, el género, la nacionalidad, el perfil laboral, el nivel educativo, etc. El muestreo estratificado se utiliza cuando el investigador quiere comprender la relación existente entre dos grupos.

El investigador puede representar incluso el subgrupo más pequeño de la población. Hay dos tipos de muestreo estratificado: uno es un muestreo aleatorio estratificado proporcional y otro es un muestreo aleatorio estratificado desproporcionado. En el muestreo aleatorio proporcional, cada estrato tendría la misma fracción de muestreo. Por ejemplo, tiene tres subgrupos con un tamaño de población de 150, 200, 250 sujetos en cada subgrupo respectivamente. Ahora, para hacerlo proporcional, el investigador utiliza una fracción específica o un porcentaje que se aplicará en sus subgrupos de población. La muestra para el primer grupo sería 150*0.5 = 75, 200*0.5 = 100 y 250*0.5 = 125. Aquí el factor constante es la ración de proporción para cada subconjunto de población.

La única diferencia es la fracción de muestreo en la técnica de muestreo estratificada desproporcionada. El investigador podría usar diferentes fracciones para varios subgrupos dependiendo del tipo de investigación o conclusión que quiere derivar de la población. La única desventaja para eso es el hecho de que si el investigador pone demasiado énfasis en un subgrupo, el resultado podría estar sesgado.

Artículos Relacionados:

Más posts relacionados:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *