Formas de Muestreo No Probabilístico: ¿Cuáles Son y Cómo Funcionan?

La gestión de una investigación a gran escala puede ser una tarea complicada. Por un lado, los resultados deben ser representativos de toda una población, por otro, es difícil investigar a todas las personas a las que le gustaría recibir una respuesta.

Una solución utilizada en el mundo real es el muestreo no probabilístico, que SurveyMonkey conoce muy bien. Gracias a la audiencia del panel, que en cualquier momento puede contar con más de medio millón de personas dispuestas a responder cuestionarios, SurveyMonkey tiene el campeón no probabilístico más amplio en los Estados Unidos.

En un muestreo no profesional, un grupo de encuestados es seleccionado por una extensa población, sabiendo que algunos miembros de esa población no tendrán posibilidad de ser probados. Esto no está permitido en el muestreo probabilístico, lo que proporciona que todos en la población elegida tengan una probabilidad diferente de ser seleccionada.

Ya sea que se trate de un panel como SurveyMonkey Audience o cualquier otro modelo de muestreo no probabilístico, el método de selección de encuestados siempre implica la exclusión de algunos miembros de la población.

A veces, estas exclusiones son obvias, como cuando las personas tienen derecho a elegir si participar o no en una investigación. Por ejemplo, puede pedirle a sus clientes que proporcionen sus direcciones de correo electrónico para permitirles expresar sus comentarios. Algunos probablemente se negarán, lo que significa que no tendrán la oportunidad de ser incluidos en la muestra.

¿Cómo se saca el muestreo no probabilístico?

Como se discutió en el ejemplo anterior, es muy importante asegurarse de que su encuesta y sus invitaciones funcionen sin problemas a través de cualquier medio o en cualquier dispositivo que sus posibles encuestados puedan usar. Es mucho más probable que las personas ignoren las solicitudes de encuestas si los tiempos de carga son largos, las preguntas no encajan correctamente en sus pantallas, o tienen que trabajar para que la encuesta sea compatible con su dispositivo. El mejor consejo es reconocer las diferentes formas de software y dispositivos de comunicación de su muestra y preprobar sus encuestas e invitaciones a cada una, asegurando que su encuesta se ejecute sin problemas para todos sus encuestados.

Una de las peores cosas que un investigador puede hacer es limitar su tiempo de recopilación de datos para cumplir con una fecha límite estricta. El nivel de sesgo de no respuesta de su estudio aumentará dramáticamente si no es flexible con el tiempo, los encuestados deben responder a su encuesta. Afortunadamente, la flexibilidad es una de las principales ventajas para las encuestas en línea, ya que no requieren entrevistas (teléfono o en persona) que deben completarse en ciertos momentos del día. Sin embargo, mantener su encuesta en vivo solo por unos pocos días puede limitar severamente la capacidad de un encuestado potencial para responder. En cambio, se recomienda extender un período de recolección de encuestas a al menos dos semanas para que los participantes puedan elegir cualquier día de la semana para responder de acuerdo con su propia apretada agenda.

Se ha demostrado que enviar algunos correos electrónicos de recordatorio durante su período de recopilación de datos recopila efectivamente más respuestas completadas. Es mejor enviar su primer correo electrónico de recordatorio a mitad del período de recolección y el segundo cerca del final del período de recolección. ¡Asegúrese de no acosar a las personas en su lista de correo electrónico que ya han completado su encuesta! Puede administrar sus recordatorios e invitaciones en fluidsurveys a través de las opciones de activación que se encuentran en la herramienta de invitación.

¿Cuál es la fórmula del muestreo probabilistico?

El PSM es más complejo computacionalmente que los ofrecidos por los enfoques de Centro de Población de Código ZCTA y Código postal. Sin embargo, el método aprovecha la distribución conocida de la población dentro de la región de residencia del sujeto y calcula una distribución de estimaciones de distancia para cada sujeto, a partir de la cual es posible calcular los límites de confianza de la estimación de distancia de cada sujeto. Además, este método permite viajar a instalaciones alternativas que están cerca del individuo, ofreciendo así más información sobre el acceso al servicio para aquellos con responsabilidades para interpretar y usar la información. Las estimaciones de distancia del método PSM juntas mejoran el centroide ZCTA, ya que representan el centro de población dentro de un código postal en lugar del área de tierra, y mejoran los puntos del centro de población de código postal al proporcionar una variedad de ubicaciones posibles en lugar de un solo punto. Además, este método se puede utilizar para soportar los bloques muestreados en función de la información demográfica disponible, lo que permite representar el centro de diferentes tipos de poblaciones, como las mujeres de cierta edad. El PSM capitaliza el aumento de los detalles espaciales que a menudo están disponibles en datos demográficos espaciales en comparación con el detalle espacial utilizado para representar la ubicación de los participantes cuya salud es preocupante. Finalmente, este método probablemente no dará como resultado resultados sesgados de la distancia de 0, ya que no se asignan ubicaciones residenciales y de servicio para compartir una sola ubicación en el espacio. La selección de la distancia media calculada es probablemente más representativa de la verdadera distancia recorrida, ya que es resistente a las distancias atípicas calculadas a partir de ubicaciones muestreadas que es poco probable que sea la verdadera ubicación residencial de la mujer.

Nuestra afirmación de que el PSM es más preciso que otros métodos utilizados hasta la fecha, incluidos los dos métodos utilizados en este documento, no se basa en ningún hallazgo empírico, sino en la lógica de que hemos utilizado la distribución espacial de las características sociodemográficas dentro de los más grandes. Área residencial y que hemos generado la posible distribución de distancias a la instalación más cercana para la persona en cuestión. Esta lógica nos permite concluir que podemos inferir las proporciones de los casos en que la distancia en cuestión alcanzará los estándares de acceso geográfico conocido o dado. Otros métodos no probabilísticos de estimación de distancia no pueden abordar esta importante pregunta. Las pruebas empíricas de este método serían valiosas, ya que reforzarían esta afirmación e ilustrarían la escala del beneficio adicional del conocimiento de la distribución de distancias que ofrece el uso del PSM. Las pruebas empíricas también contribuirían a comprender el beneficio diferencial brindado en diferentes entornos geográficos, como en entornos urbanos versus rurales.

Nuestra prueba limitada del algoritmo PSM desmiente las muchas situaciones en las que podría usarse. Este tipo de método probabilístico, que no requiere direcciones individuales, será cada vez más importante con mayores esfuerzos para proteger la confidencialidad de los datos de salud. La agregación espacial de los datos de salud de los individuos es el método más utilizado para proteger la privacidad de los datos de salud individuales. Implementado en la etapa de adquisición de datos; p.ej. «¿Cuál es su código postal?» o en la etapa de difusión de datos «Ubicación del sujeto: código postal», los nombres de las regiones realizan la función de una máscara geográfica, preservando la confidencialidad de la información prometida al sujeto y aplicado por la ley [20].

Hay una serie de situaciones en las que anticiparíamos los resultados de un enfoque de muestreo probabilístico para diferir aún más significativamente de los cálculos de Centro de Código ZCTA o Código Zip. En Iowa, los ZCTA tienen un tamaño geográfico relativamente constante; Esto no es cierto en todo Estados Unidos. En los estados en los que ZIP/ZCTA son bastante grandes geográficamente, uno esperaría más disparidad entre los cálculos utilizando diferentes métodos. Además, en los casos en que un ZCTA contiene más de un lugar altamente poblado, es probable que los cálculos que usan el punto central de población del código postal difieran significativamente de los cálculos utilizando nuestra metodología, especialmente si estos dos lugares poblados están lejos de los demás. Finalmente, en las comunidades que están altamente segregadas por la edad, el sexo, la raza, el origen étnico o cualquier otra característica de un encuestado utilizado para soportar los bloqueos del censo muestreado, o se dividen en zonas para separarse severamente de las áreas comerciales, es más probable que el PSM Lograrán resultados diferentes que los métodos de Centro de Código ZCTA o Código ZIP.

La Tabla 2 ilustra las muchas situaciones en las que se podría usar el algoritmo PSM. Se encuentran situaciones típicas donde los datos espaciales se recopilan y se diseminan en una jerarquía espacial donde las áreas más pequeñas anidan dentro de regiones más grandes que, a su vez, anidan dentro de regiones aún más grandes. Ahora existe una gran literatura sobre métodos para desagregarse espacialmente los datos utilizando atributos sintomáticos y ciencia de la información geográfica [21–23]. La última línea en esta tabla hace referencia a uno de esos métodos que se ha difundido ampliamente recientemente [21].

¿Cómo se saca el muestreo probabilistico?

Como seguimiento de la publicación de ayer sobre muestras de probabilidad, revisaré muestras de no probabilidad. Estos métodos no proporcionan el mismo nivel de representación justa, pero ciertamente tienen su propio propósito en la industria de la investigación de mercado. Estos tipos de muestras se prestan a formas preliminares de investigación, eliminando la necesidad de que se generalizaran a la población en general.

1) Muestreo de conveniencia. Tal como parece, este método de muestra se desarrolla para la conveniencia del proceso de investigación. El proceso implica realizar encuestas/investigaciones en áreas de tráfico convenientes o de alto. Esto se usa comúnmente y se realiza mejor en áreas que contienen la población del público objetivo.

Ejemplo: una gran universidad está buscando aprender más sobre la satisfacción de sus estudiantes con las instalaciones del campus. Trabajan con una firma de investigación de mercado independiente para desarrollar una encuesta. Luego se recopilan los datos configurando la estación en la biblioteca, el centro de recreación de estudiantes y la cafetería, donde desmayan las encuestas.

2) Muestras de juicio. Esta es otra forma de muestreo no aleatorio; Los encuestados son elegidos en función de las observaciones del entrevistador. El proceso es bastante subjetivo ya que el entrevistador tiene que usar su experiencia y conocimiento para determinar qué personas son representativas de la muestra deseada.

Ejemplo: un centro minorista busca proporcionar una nueva línea de accesorios para los ojos. Quieren realizar una investigación preliminar para comprender los pensamientos de su público objetivo. Para realizar su investigación, entrevistan a personas fuera de su tienda y seleccionan solo a los encuestados que usan anteojos.

¿Qué es el muestreo fórmula?

Los siguientes pasos son necesarios para calcular el tamaño de la muestra:

  • Determinación de la precisión absoluta
    Se debe determinar la precisión absoluta requerida (E). Esto significa la desviación máxima permitida del valor determinado por la muestra en comparación con el valor de la población
  • Estimación de la desviación estándar
    La (s) desviación estándar (s) indica la dispersión de los valores individuales en consideración. Esto solo se puede calcular después de que se lleva a cabo la muestra, por lo que debe estimarse para calcular el tamaño de la muestra. Esto se puede hacer con la siguiente regla general:
  • Determinación de la probabilidad de declaraciones (nivel de confianza)
    Se determina la probabilidad de instrucción deseada y se determina el valor Z asociado.
  • Cálculo del tamaño de la muestra
    Si se determinan todos los valores requeridos, se puede calcular el tamaño (s) de la muestra, que debe seleccionarse de la (s) población (s). Para este propósito, los valores previamente determinados se utilizan en la fórmula correspondiente:
  • Con una población finita:
  • Con una población infinita:

Estadísticamente hablando, el tamaño de la muestra debe ser al menos n. En la práctica, se debe tomar un valor ligeramente más alto en muchos valores. De esta manera, se pueden tener en cuenta más factores, por ejemplo, cuestionarios completados incorrectamente para encuestas.

Para determinar el alcance necesario de la muestra, se sigue de la siguiente manera:

  • Determinación de la precisión absoluta
    Se debe determinar la precisión absoluta requerida (E). Esto significa la desviación máxima permitida del valor determinado por la muestra en comparación con el valor de la población
  • Estimación de la desviación estándar
    La (s) desviación estándar (s) indica la dispersión de los valores individuales en consideración. Esto solo se puede calcular después de que se lleva a cabo la muestra, por lo que debe estimarse para calcular el tamaño de la muestra. Esto se puede hacer con la siguiente regla general:
  • Determinación de la probabilidad de declaraciones (nivel de confianza)
    Se determina la probabilidad de instrucción deseada y se determina el valor Z asociado.
  • Cálculo del tamaño de la muestra
    Si se determinan todos los valores requeridos, se puede calcular el tamaño (s) de la muestra, que debe seleccionarse de la (s) población (s). Para este propósito, los valores previamente determinados se utilizan en la fórmula correspondiente:
  • Con una población finita:
  • Con una población infinita:
  • Determinación de la precisión absoluta
    Dado que la precisión relativa será del 5 por ciento, la precisión absoluta se puede determinar de la siguiente manera:
  • Estimación de la desviación estándar
    La desviación estándar del tiempo de procesamiento se estima en 10 minutos
  • Determinación de la probabilidad de declaraciones (nivel de confianza)
    La probabilidad deseada de declaración debe ser del 95 por ciento. El valor Z asociado es:
  • Cálculo del tamaño de la muestra
    El tamaño de la muestra ahora se puede calcular con la fórmula correspondiente:
  • Estadísticamente, el tamaño de la muestra tendría que tener al menos 31 (siempre redondeado) para obtener un resultado significativo con respecto al tiempo de procesamiento promedio.

    Artículos Relacionados:

    Más posts relacionados:

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *