Sesgos estadísticos: tipos y ejemplos

  • Sesgo de selección
  • Sesgo de supervivencia
  • Sesgo variable omitido
  • Sesgo de recuerdo
  • Sesgo del observador
  • Sesgo de financiación

El sesgo de selección es el fenómeno de seleccionar individuos, grupos o datos para el análisis de tal manera que no se logra la aleatorización adecuada, lo que finalmente resulta en una muestra que no es representativa de la población. [1]

Dentro del sesgo de selección, hay varios tipos de sesgo de selección:

  • Sesgo de selección
  • Sesgo de supervivencia
  • Sesgo variable omitido
  • Sesgo de recuerdo
  • Sesgo del observador
  • Sesgo de financiación
  • Muestreo de muestreo: se refiere a una muestra sesgada causada por un muestreo no aleatorio. Para dar un ejemplo, imagine que hay 10 personas en una habitación y usted pregunta si prefieren uvas o plátanos. Si solo encuestó a las tres mujeres y concluyó que a la mayoría de las personas les gustan las uvas, habría demostrado un sesgo de muestreo.
  • Iconos proporcionados por Freepik
    • Sesgo de selección
    • Sesgo de supervivencia
    • Sesgo variable omitido
    • Sesgo de recuerdo
    • Sesgo del observador
    • Sesgo de financiación
  • Muestreo de muestreo: se refiere a una muestra sesgada causada por un muestreo no aleatorio. Para dar un ejemplo, imagine que hay 10 personas en una habitación y usted pregunta si prefieren uvas o plátanos. Si solo encuestó a las tres mujeres y concluyó que a la mayoría de las personas les gustan las uvas, habría demostrado un sesgo de muestreo.
  • Sesgo del intervalo de tiempo: sesgo causado por especificar intencionalmente un cierto rango de tiempo para apoyar la conclusión deseada. Por ejemplo, concluir el número promedio de tweets por horas de una muestra tomada de las horas pico (9-12 a.m.) es un ejemplo de sesgo de intervalo de tiempo.
  • Sesgo de susceptibilidad: incluye sesgo de susceptibilidad clínica, sesgo protopático y sesgo de indicación, que se relacionan con la idea de mezclar potencialmente causa y efecto y correlación.
  • El fenómeno donde solo aquellos que «sobrevivieron» un proceso largo se incluyen o excluidos en un análisis, creando así una muestra sesgada.

    Un gran ejemplo proporcionado por Sreenivasan Chandrasekar es el siguiente:

    “Nos inscribimos para la membresía del gimnasio y asistimos por unos días. Vemos las mismas caras de muchas personas que están en forma, motivadas y haciendo ejercicio todos los días cada vez que vamos al gimnasio. Después de unos días, nos deprimimos por qué no podemos cumplir con nuestro horario y motivación más de una semana cuando la mayoría de las personas que vimos en el gimnasio pudieron. Lo que no vimos fue que muchas de las personas que se habían inscrito para la membresía del gimnasio también habían dejado de aparecer en el gimnasio justo después de una semana y no las vimos «.

    ¿Qué es sesgo en estadística ejemplos?

    Una compañía que produce café de lujo, permanece prensado, quiere realizar un estudio para probar las marcas de café favoritas de los consumidores. Al establecer el estudio, los investigadores prensados ​​de estadía piden a un gran grupo de participantes que prueben tres marcas diferentes de café y las califiquen en una escala fija. Al elegir marcas para competir, el equipo de investigación de Stay Pressed solo selecciona marcas de café que no son de lujo. Esta ventaja injusta conduce a un sesgo de financiación, ya que los resultados del estudio están a favor de Stay Pressed.

    Una compañía de tecnología quiere probar la usabilidad de su última aplicación, con la esperanza de mejorar sus propiedades fáciles de usar. Al reclutar a los participantes para su estudio, la compañía se acerca a los estudiantes universitarios de ciencias de la computación, quienes están de acuerdo en que la aplicación de la compañía es fácil de usar. La compañía solo está considerando la perspectiva de los participantes que probablemente tengan habilidades tecnológicas, por lo que estos resultados pueden no reflejar la usabilidad real de la aplicación.

    El Departamento de Recursos Humanos (HR) de una empresa quiere recompensar a los gerentes de mejor rendimiento. Para decidir a quién recompensar, el departamento de recursos humanos envía encuestas a cada departamento. Todos estos profesionales nominan a sus gerentes, lo que permite al gerente con el departamento más grande ganar el premio. El departamento de recursos humanos no considera las perspectivas sesgadas de los participantes, por lo que su sistema de premios no es tan eficiente y preciso como podría ser.

    ¿Cuáles son los tipos de sesgos estadísticos?

    Estos son los tipos más importantes de sesgo en las estadísticas. Hay muchos sesgos en las estadísticas. Es bastante difícil cubrir todos los tipos de sesgo en una sola publicación de blog.

    Por lo tanto, voy a compartir con ustedes los 8 principales tipos de sesgo en estadísticas. Estos sesgos generalmente afectan a la mayoría de su trabajo como analista de datos y científico de datos. Si quieres ser uno de ellos, estad atentos con nosotros. Exploremos los 8 principales tipos de sesgo en las estadísticas.

    Cuando selecciona el conjunto incorrecto de datos, se produce un sesgo de selección. Se puede hacer mientras intenta obtener la muestra del subconjunto de su audiencia aparte de todo el conjunto de la audiencia.

    De esta manera, el cálculo que puede realizar no indicará ni representará todos los datos de la población. Hay muchas otras razones detrás del sesgo de selección, pero la razón principal de esto es que la recopilación de datos de una fuente de fácil acceso. Por lo tanto, cada vez que los datos pueden obtener de la fuente incorrecta.

    Por ejemplo, suponga que está haciendo una encuesta sobre cuál es la opinión de la persona con respecto a la presidencia de Donald Trump. Usted ha recopilado los datos en los que varias personas tienen respuestas bien detalladas e inmediatas a esta pregunta. Pero, desafortunadamente, varios de ellos tienen una fuente principal para su respuesta de Facebook. No se considera confiable ya que no es la opinión pública, sino la opinión de sus amigos. Por lo tanto, este tipo de datos se puede clasificar como un sesgo de selección clásica al que se puede acceder fácilmente pero solo para subconjuntos no representativos y específicos de la población general.

    ¿Cómo analizar el sesgo en estadística?

    Los sesgos estadísticos son principalmente la falacia técnica que caemos inconscientemente al hacer análisis.

    • Sesgo de selección: el sesgo introducido por la selección de individuos, grupos para datos para el análisis de tal manera que no se logra la aleatorización adecuada, lo que garantiza que la muestra obtenida no sea representativa de la población destinada a ser analizada (fuente: Wikipedia). Para los analistas de datos, esto ocurre en gran medida en la experimentación del producto. Hay casos en los que los experimentos ocurren segmentos de clientes de alto rendimiento preseleccionados, pero el despliegue real es para todos los segmentos de clientes, lo que arrojó resultados diferentes. O cuando el experimento se realizó en unos pocos días de marco de tiempo, lo que no captura la estacionalidad semanal de la naturaleza del producto.
    • Sesgo de supervivencia: el error lógico de concentrarse en las personas o cosas que pasaron por algún proceso de selección y pasando por alto a los que no lo hicieron, típicamente por su falta de visibilidad (fuente: Wikipedia). Este sesgo de supervivencia puede conducir a una falsa creencia sobre el impacto positivo dado por el tratamiento. Por ejemplo, está analizando el comportamiento de los clientes leales en su producto. Usted descubre que la mayoría de estos clientes leales son los que provienen de las referencias de los clientes y, en conclusión, recomiendo que las referencias de los clientes obtengan clientes potencialmente leales. Puede olvidar el hecho de que las referencias de los clientes constituyen una gran parte de su nueva adquisición de clientes de todos modos.
    • Sesgo de variable omitido: una versión más estadísticamente específica del sesgo de selección, este es el caso en el que un modelo estadístico deja de lado una o más variables (confusas). En el modelado de datos, esto podría hacer que el modelo esté subestimado. O cuando se ajusta, es posible que no sea lo suficientemente robusto con el tiempo debido a las variables que quedan fuera.

    Cuando se identifica y entiende, estos sesgos estadísticos se pueden prevenir más fácilmente en lugar de sesgos cognitivos, ya que los tecnicismos se pueden notar y fijar.

    Entonces, ahora que conoce los diferentes sesgos que pueden ocurrir durante un proceso de análisis de datos, podría cuestionar «¿qué debo hacer entonces?». Aquí hay algunos consejos que puede usar para ser más conscientes de los sesgos y evitar que obstruyan la objetividad del análisis.

    ¿Cómo se determina el sesgo?

    Los síntomas agudos que indican la distorsión que ha estado en la apariencia inmediata de un dolor intenso en el nivel de la articulación en cuestión, que irradia en las áreas circundantes, acompañada de un desarrollo igualmente repentino y progresivo de hinchazón, más o menos acentuado en relación con La gravedad del trauma.

    En las distorsiones de la temporada moderada también puede haber un hematoma, correspondiente a una acumulación de sangre al nivel de la articulación y en los tejidos vecinos, determinados por la ruptura de vasos sanguíneos menores durante el trauma.

    Los signos y síntomas enumerados empeoran gradualmente en las primeras horas posteriores al trauma y normalmente van acompañados de inflamación y limitación funcional, que, en distorsiones de cierta importancia, puede ser considerable y evitar la articulación distorsionada, si no frente a una otra cosa. Notable empeoramiento del dolor.

    La extensión de las manifestaciones se correlaciona tendencionalmente con la gravedad del daño articular presente. En particular, tomar como parámetro el número de fibras de ligamentos comprometidos, se puede distinguir distorsiones de primer grado o mínimo (ligamento de sufrimiento, pero sin fibra dañada), 2º grado o participante (diferentes fibras dañadas) y tercer grado o completa (rotura de todas fibras ligament). Sin embargo, el alcance del dolor percibido también depende de la sensibilidad individual y los factores psicológicos. Todas las distorsiones caracterizadas por un dolor intenso deben someterse a una evaluación médica inmediatamente después del trauma.

    Artículos Relacionados:

    Más posts relacionados:

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *