Ejemplos de muestreo estratificado: cómo seleccionar la muestra perfecta

Publicado en
18 de septiembre de 2022
por
Lauren Thomas.
Revisado en
21 de julio de 2022.

En una muestra estratificada, los investigadores dividen una población en subpoblaciones homogéneas llamadas estratos (el plural del estrato) basado en características específicas (por ejemplo, raza, identidad de género, ubicación, etc.). Cada miembro de la población estudiada debe estar exactamente en un estrato.

Cada estrato se muestrean utilizando otro método de muestreo de probabilidad, como un grupo o muestreo aleatorio simple, lo que permite a los investigadores estimar las medidas estadísticas para cada subpoblación.

Los investigadores confían en el muestreo estratificado cuando las características de una población son diversas y quieren asegurarse de que cada característica esté representada adecuadamente en la muestra.

Para usar un muestreo estratificado, debe poder dividir su población en subgrupos mutuamente excluyentes y exhaustivos. Eso significa que cada miembro de la población puede clasificarse claramente en exactamente un subgrupo.

El muestreo estratificado es la mejor opción entre los métodos de muestreo de probabilidad cuando cree que los subgrupos tendrán diferentes valores medios para las variables que está estudiando. Tiene varias ventajas potenciales:

Una muestra estratificada incluye sujetos de cada subgrupo, asegurando que refleje la diversidad de su población. Es teóricamente posible (aunque poco probable) que esto no suceda al usar otros métodos de muestreo, como un muestreo aleatorio simple.

Si desea que los datos recopilados de cada subgrupo tengan un nivel de varianza similar, necesita un tamaño de muestra similar para cada subgrupo.

¿Dónde se aplica el muestreo estratificado?

Supongamos que tenemos que apreciar el número promedio de votos para cada candidato en una elección. Suponiendo que un país tiene 3 ciudades: la ciudad A tiene 1 millón de trabajadores de fábrica, la ciudad B tiene 2 millones de trabajadores de consultorio y City C tiene 3 millones de pensionistas. Podemos elegir una muestra aleatoria de tamaño 60 sobre toda la población, pero hay una cierta manera de que la muestra aleatoria resultante está mal equilibrada en estas ciudades y, por lo tanto, está distorsionada, lo que conduce a una evaluación significativa (si el resultado es un resultado diferente es Diferente distribución en relación con los parámetros entre las ciudades). Si extraemos una muestra aleatoria de 10, 20 o 30 de las ciudades A, B y C, podemos crear un error de estimación más pequeño con el mismo tamaño de muestra total. Este método generalmente se usa cuando una población no es un grupo homogéneo.

En la asignación proporcional, se utiliza una acción de muestra en cada una de las capas que es proporcional a la de la población total. Por ejemplo, si la población consta de un total de individuos, de los cuales M son hombres y f mujeres (y con m + f = n), entonces el tamaño relativo de las dos muestras (x 1 = m/n masculina, x 2 = F/ N Las mujeres) deben reflejar esta proporción.
Asignación óptima (o asignación desproporcionada): la proporción de muestra de cada capa es proporcional a la participación (como anterior) y la desviación estándar de la distribución de las variables. Se dibujan muestras más grandes en las capas con la mayor variabilidad para crear la varianza de muestra total más baja posible.

Un ejemplo práctico del uso de muestras en capas sería una encuesta política. Si los encuestados tuvieran que reflejar la diversidad de la población, el investigador trataría particularmente de involucrar a los participantes de varios grupos minoritarios como la raza o la religión, en función de su relación con la población total, como se mencionó anteriormente. Por lo tanto, una encuesta en capas podría aumentar el reclamo de ser más representativo de la población que una encuesta con una muestra aleatoria simple o un muestreo sistemático.

En la asignación proporcional, se utiliza una acción de muestra en cada una de las capas que es proporcional a la de la población total. Por ejemplo, si la población consta de un total de individuos, de los cuales M son hombres y f mujeres (y con m + f = n), entonces el tamaño relativo de las dos muestras (x 1 = m/n masculina, x 2 = F/ N Las mujeres) deben reflejar esta proporción.
Asignación óptima (o asignación desproporcionada): la proporción de muestra de cada capa es proporcional a la participación (como anterior) y la desviación estándar de la distribución de las variables. Se dibujan muestras más grandes en las capas con la mayor variabilidad para crear la varianza de muestra total más baja posible.

Si las mediciones dentro de las capas tienen una desviación estándar más baja (en comparación con la desviación estándar total en la población), la estratificación da como resultado un error de estimación más bajo.

Para muchas aplicaciones, las mediciones se vuelven más manejables y/o más baratas si la población se agrupa en capas.

Si es deseable tener estimaciones de la población, parámetros en la población para grupos – pruebas en capas.

Si la densidad de población fluctúa fuertemente dentro de una región, la muestra en capas asegura que las estimaciones en diferentes partes de la región se puedan hacer con la misma precisión y comparaciones de subregiones se pueden hacer con el mismo significado estadístico. En Ontario, por ejemplo, una encuesta realizada en toda la provincia podría usar una mayor participación de la muestra en el norte menos poblado, ya que la diferencia de población entre el norte y el sur es tan grande que una proporción de muestra basada en toda la muestra provincial es la recopilación de solo un puñado de datos al norte.

¿Cómo se realiza el muestreo estratificado?

El muestreo para la aleatorización estratificada se lleva a cabo al estudiar un personaje que, presumiblemente o notablemente, está influenciado por un cierto factor presente en la población.
En la práctica, antes de llevar a cabo la muestra, la población se divide en capas basadas en el factor que influye en el personaje a estudiar. Entonces, dentro de cada capa, elige una muestra con un método que garantice la aleatoriedad, como, por ejemplo, el método de aleatorización simple o sistemática.

El siguiente esquema resume el procedimiento de selección de muestra, en el que se supone que la raza de animales es un factor que influye en el factor que deberá estudiarse.

Una muestra obtenida por estratificación tiene la ventaja de representar mejor la población de la que se extrajo. Sin embargo, el número reducido de las diversas capas puede hacer que las estimaciones referidas a las capas individuales no sean muy confiables.

El muestreo para la aleatorización estratificada es más flexible que el realizado con una aleatorización simple, ya que se puede elegir un porcentaje diferente en las diferentes capas (por ejemplo, 2% en una capa, 5% en otra, etc.).

La estratificación trae, en general, otra ventaja importante: obtener, dentro de cada capa, una varianza (y, en consecuencia, un error estándar) inferior a la varianza general de la población. Es una ventaja que, a primera vista, puede parecer sin importancia, pero que es esencial para aumentar la precisión de la estima que se obtendrá del estudio de la muestra. Este tema se mencionará en una unidad posterior.

¿Cuándo puede aplicarse una estratificación efectiva?

La estratificación a menudo se usa en diseños de muestras complejas. En un diseño de muestra aleatorio estratificado, las unidades en el marco de muestreo se dividen primero en grupos, llamados estratos, y se toma un SRS separado en cada estrato para formar la muestra total. Los estratos se forman para mantener juntas unidades similares, por ejemplo, un estrato femenino y un estrato masculino. En este diseño, las unidades no necesitan tener las mismas posibilidades de ser seleccionados y algunos estratos pueden exagerar deliberadamente. Por ejemplo, en la primera Encuesta Nacional de Examen de Salud y Nutrición (NHANES I), las personas mayores, las personas en las áreas de pobreza y las mujeres en edad fértil fueron sobremollados para proporcionar un número suficiente de estos grupos para el análisis en profundidad (NCHS 1973). Si se hubiera utilizado un SRS, es probable que muy pocas personas en estos grupos hubieran sido seleccionadas para permitir cualquier análisis en profundidad de estos grupos.

Otra ventaja de la estratificación es que puede reducir la variabilidad de las estadísticas de muestra sobre la de un SRS, reduciendo así el tamaño de la muestra requerido para el análisis. Esta reducción en la variabilidad ocurre cuando las unidades en un estrato son similares, pero hay variación entre los estratos. Otra forma de decir esto es que la reducción ocurre cuando la variable utilizada para formar los estratos está relacionado con la variable que se mide. Consideremos un pequeño ejemplo que ilustra este punto.

En este ejemplo, deseamos estimar el peso promedio de las personas en la población. La población contiene seis personas: tres mujeres y tres hombres. Los pesos de las hembras en la población son 110, 120 y 130 libras, y los pesos de los machos son 160, 170 y 180 libras. Formaremos nuestra estimación del peso promedio de la población tomando una muestra de tamaño dos sin reemplazo.

Si usamos un SRS, la estimación más pequeña posible es 115 libras (= [110 + 120]/2), y la estimación más grande posible es 175 (= [170 + 180]/2). Como alternativa, podríamos usar una muestra aleatoria estratificada donde los estratos se forman en función del género. Si una persona se selecciona aleatoriamente de cada estrato, la estimación más pequeña es de 135 libras (= [110 + 160]/2), y la estimación más grande es de 155 libras (= [130 + 180]/2). Las estimaciones del enfoque de muestra estratificado tienen menos variación, es decir, tienen una mayor precisión que el enfoque SRS en este caso.

¿Cuándo es muestreo estratificado?

Los tipos de muestreo se pueden distinguir de acuerdo con diferentes criterios. Esto significa que se puede hacer una distinción de acuerdo con la tecnología para seleccionar el subgrupo:

Las observaciones se seleccionan sobre la base del azar, es decir, accidentalmente. En esta categoría encontramos:

Muestra aleatoria simple: todos los individuos de la población tienen la misma probabilidad de ser incluidas en la muestra. Tiene ventajas como el hecho de que los sistemas informáticos lo pueden hacer fácilmente. Sin embargo, se requiere una lista completa de toda la población, y si la muestra es muy pequeña, la selección puede no ser representativa.
Sistemático: una observación se selecciona intervalos numéricos aleatorios y se utilizan para seleccionar la muestra restante. Eso significa, suponiendo que tengo una población de 10,000 y elijo al azar 600, según los cuales puedo tener en cuenta los intervalos de 30 observaciones. En este caso, tomaría las observaciones 600, 630, 660, 690, 720, 750, 780, etc.
Coincidencia estratificada: la población se divide en capas, estos son grupos con características comunes e incluso más homogéneas que la población total. Luego, se seleccionó al azar o seleccionó sistemáticamente una muestra dentro de cada capa. El objetivo es lograr una representatividad de cada capa.
Según conglomerados o grupos: consiste en la formación de grupos que son más pequeños que la población que reflejan o comparten todas las características de la población. Luego seleccionamos uno de los grupos como muestra y lo analizamos en detalle.

La selección de la muestra no depende de la probabilidad, sino de la decisión de los investigadores. Podemos distinguir algunas subcategorías:

Muestra aleatoria simple: todos los individuos de la población tienen la misma probabilidad de ser incluidas en la muestra. Tiene ventajas como el hecho de que los sistemas informáticos lo pueden hacer fácilmente. Sin embargo, se requiere una lista completa de toda la población, y si la muestra es muy pequeña, la selección puede no ser representativa.
Sistemático: una observación se selecciona intervalos numéricos aleatorios y se utilizan para seleccionar la muestra restante. Eso significa, suponiendo que tengo una población de 10,000 y elijo al azar 600, según los cuales puedo tener en cuenta los intervalos de 30 observaciones. En este caso, tomaría las observaciones 600, 630, 660, 690, 720, 750, 780, etc.
Coincidencia estratificada: la población se divide en capas, estos son grupos con características comunes e incluso más homogéneas que la población total. Luego, se seleccionó al azar o seleccionó sistemáticamente una muestra dentro de cada capa. El objetivo es lograr una representatividad de cada capa.
Según conglomerados o grupos: consiste en la formación de grupos que son más pequeños que la población que reflejan o comparten todas las características de la población. Luego seleccionamos uno de los grupos como muestra y lo analizamos en detalle.

Método de confianza en temas disponibles: es que el investigador registra los temas disponibles para él. Esto, por ejemplo, en un punto geográfico en un momento determinado.

Opinión o método deliberado: el investigador usa su juicio o criterios para elegir quién participa en la muestra. En otras palabras, para continuar usando el ejemplo anterior, el investigador podría recopilar el ensayo en cierto lugar y en un momento determinado. Sin embargo, en vista de los objetivos de investigación, puede elegir incluir solo personas casadas entre las edades de 20 y 30 años.

Causal o accidental: el investigador selecciona a las personas que serán parte de la muestra. Por ejemplo, a los estudiantes de una escuela. Esto porque pueden acceder fácilmente a él.

Bola de nieve: Es que el investigador le pide ayuda (o ella) después de encontrar el primer sujeto (o los primeros sujetos) de la muestra, para obtener ayuda con la identificación de otras personas con las mismas características. Es una técnica que se usa cuando es difícil encontrar un determinado grupo debido al uso de datos confidenciales, por ejemplo, inmigrantes ilegales.

En cuotas: teniendo en cuenta la composición de la población y distribuyendo de acuerdo con grupos o capas, el investigador realiza una selección proporcional de la muestra. Por ejemplo, imagine que el 40% de las personas menores de 25 años, el 35% de las personas entre 25 y 50 años y el 25% de las personas durante 50 años tienen más de 50 años. Una muestra de 4.000 personas tendría 1,600 personas menores de 25 años, 1,400 entre 25 y 50 años y 1,000 adultos durante 50 años. Cabe señalar que las personas que cubren cada tarifa son seleccionadas por un método no probabilístico, i. H. Una de las técnicas explicadas anteriormente.

También se debe tener en cuenta que el muestreo puede ser simple si solo se lleva a cabo una vez; Doble si se registran dos muestras (la segunda se puede usar si la primera no proporciona resultados finales); O múltiple (es similar al doble, pero con más de dos muestras).

¿Cuando un muestreo es estratificado?

El muestreo del clúster se define como una técnica de muestreo en la que la población se divide en agrupaciones existentes (grupos), por lo tanto, la población selecciona una muestra del grupo al azar. El término grupo se refiere a una agrupación natural pero heterogénea, intacta de los miembros de la población.

Las variables más comunes utilizadas en la población de agrupación son el área geográfica, edificios, escuela, etc. La heterogeneidad del clúster es una característica importante de un diseño ideal de muestras de clúster. Los tipos de muestreo del clúster se indican a continuación:

Muestreo de muestreo con estadio único
Muestreo de clúster de dos etapas
Muestreo de clúster multiestadio

Las diferencias entre el muestreo estratificado y el montón de muestreo se pueden tomar claramente por las siguientes razones:

Muestreo de muestreo con estadio único
Muestreo de clúster de dos etapas
Muestreo de clúster multiestadio

Un procedimiento de muestreo probabilístico en el que la población se separa en diferentes segmentos homogéneos llamados «capas» y, por lo tanto, la muestra es elegida al azar por cada capa aleatoria, se llama muestreo en capas. El muestreo de clúster es una técnica de muestreo en la que las unidades de la población son seleccionadas al azar por grupos existentes llamados «grupos».

En el muestreo estratificado, las personas son seleccionadas al azar por todas las capas, para constituir la muestra. Por otro lado, el muestreo del clúster, la muestra se forma cuando todos los individuos se toman de grupos seleccionados al azar.

En el muestreo del grupo, los elementos de la población se seleccionan en agregados, sin embargo, en el caso del muestreo estratificado, los elementos de la población son seleccionados individualmente por cada capa.

En el muestreo estratificado, hay homogeneidad dentro del grupo, mientras que en el caso del muestreo en la homogeneidad del grupo se encuentra entre los grupos.

La heterogeneidad ocurre entre los grupos en el muestreo estratificado. Por el contrario, los miembros del grupo son heterogéneos en el muestreo del clúster.

Cuando el método de muestreo adoptado por el investigador está en capas, las categorías son impuestas por él. Por el contrario, las categorías ya son grupos existentes en el muestreo del clúster.

El muestreo estratificado tiene como objetivo mejorar la precisión y la representación. A diferencia del muestreo para el clúster, cuyo objetivo es mejorar la efectividad de los costos y la eficiencia operativa.

Para concluir la discusión, podemos decir que una situación preferible para el muestreo estratificado es cuando la identidad dentro de una capa individual y las capas significan que varían entre sí. Por otro lado, la situación estándar para muestrear el clúster ocurre cuando la diversidad dentro de los grupos y el clúster no deben variar entre sí.

Además, los errores de muestreo se pueden reducir en el muestreo estratificado si se aumentan las diferencias entre los grupos entre las capas, mientras que las diferencias entre los grupos entre los grupos deben reducirse al mínimo para reducir los errores de muestreo en el muestreo de los clústeres.

¿Qué es un análisis estratificado?

El análisis estratificado es un poderoso enfoque estadístico que le permite probar la confusión y la interacción, pero a diferencia de la regresión logística, es bastante simple y no lo distingue de sus datos. Puede ‘ver’ las asociaciones y disfrutar de las ideas obtenidas del análisis.

Este enfoque es útil cuando está interesado en probar la asociación entre dos variables categóricas, digamos la exposición y la enfermedad, ajustando una tercera variable categórica. Si se hace correctamente, también le permite investigar si la tercera variable es un factor de confusión o un modificador de efecto.

Por ejemplo, podría estar interesado en evaluar una asociación entre la obesidad y la enfermedad cardiovascular después de estratificar por edad o es posible que desee investigar las tasas de aceptación para hombres y mujeres en un programa universitario estratificado por departamento. En ambas situaciones, puede realizar un análisis estratificado para identificar la confusión y la interacción.

Un enfoque sistemático para el análisis estratificado implica los siguientes pasos:

Prueba de asociación cruda de la variable explicativa con la variable de resultado o respuesta, es decir, realizar una prueba de chi-cuadrado para evaluar la importancia de la asociación y calcular una probabilidad cruda o riesgo relativo (junto con sus intervalos de confianza) para medir la fuerza de la asociación .
Realice un análisis estratificado después de estratificar los datos por la tercera variable. Similar al primer paso, esto incluye probar la importancia y la medición de la resistencia de la asociación, pero para cada tabla de contingencia creada después de la estratificación.

Ejemplos de muestreo estratificado: cómo seleccionar la muestra perfecta

¿Dónde se aplica el muestreo estratificado?

¿Cómo se realiza el muestreo estratificado?

¿Cuándo puede aplicarse una estratificación efectiva?

¿Cuándo es muestreo estratificado?

¿Cuando un muestreo es estratificado?

¿Qué es un análisis estratificado?

Más posts relacionados:

Unidad de observación estadística: ¿Qué es y cómo se usa?

Aprende a elegir el muestreo adecuado para tu investigación: guía de muestreo en estadística inferencial

Deja una respuesta Cancelar la respuesta