Errores estadísticos más comunes y cómo evitarlos

Una prueba perfecta tendría cero falsos positivos y cero falsos negativos. Sin embargo, los métodos estadísticos son probabilísticos, y no se puede saber con certeza si las conclusiones estadísticas son correctas. Cada vez que existe incertidumbre, existe la posibilidad de cometer un error. Teniendo en cuenta esta naturaleza de la ciencia estadística, todas las pruebas de hipótesis estadística tienen la probabilidad de cometer errores de tipo I y tipo II. [6]

La tasa de error tipo I o el nivel de significancia es la probabilidad de rechazar la hipótesis nula dado que es cierto. Se denota por la letra griega α (alfa) y también se llama nivel alfa. Por lo general, el nivel de significancia se establece en 0.05 (5%), lo que implica que es aceptable tener una probabilidad del 5% de rechazar incorrectamente la verdadera hipótesis nula. [7]
La tasa del error tipo II se denota por la letra griega β (beta) y se relaciona con el poder de una prueba, que es igual a 1 – β. [8]

Estos dos tipos de tasas de error se negocian entre sí: para cualquier conjunto de muestras dado, el esfuerzo por reducir un tipo de error generalmente da como resultado aumentar el otro tipo de error. [9]

La misma idea se puede expresar en términos de la tasa de resultados correctos y, por lo tanto, se utiliza para minimizar las tasas de error y mejorar la calidad de la prueba de hipótesis. Para reducir la probabilidad de cometer un error tipo I, hacer que el valor alfa (p) sea más estricto es bastante simple y eficiente. Para disminuir la probabilidad de cometer un error tipo II, que está estrechamente asociado con la potencia de los análisis, ya sea aumentar el tamaño de la muestra de la prueba o relajar el nivel alfa podría aumentar la potencia de los análisis. [10] Una estadística de prueba es robusta si se controla la tasa de error tipo I.

El valor de umbral diferente (corte) variable también podría usarse para hacer que la prueba sea más específica o más sensible, lo que a su vez eleva la calidad de la prueba. Por ejemplo, imagine una prueba médica, en la que un experimentador podría medir la concentración de una determinada proteína en la muestra de sangre. El experimentador podría ajustar el umbral (línea vertical negra en la figura) y las personas serían diagnosticadas que tengan enfermedades si se detecta cualquier número por encima de este cierto umbral. Según la imagen, cambiar el umbral daría lugar a cambios en falsos positivos y falsos negativos, correspondientes al movimiento en la curva. [11]

¿Qué son los errores en la estadística?

El error (error estadístico) describe la diferencia entre un valor obtenido de un proceso de recopilación de datos y el valor ‘verdadero’ para la población. Cuanto mayor sea el error, menos representantes son los datos de la población.

Los datos pueden verse afectados por dos tipos de error: error de muestreo y error de no muestreo.

El error de muestreo ocurre únicamente como resultado del uso de una muestra de una población, en lugar de realizar un censo (enumeración completa) de la población. Se refiere a la diferencia entre una estimación de una población basada en datos de una muestra y el valor ‘verdadero’ para esa población que resultaría si se tomara un censo. Los errores de muestreo no ocurren en un censo, ya que los valores del censo se basan en toda la población.

El error de muestreo puede ocurrir cuando:

Las proporciones de diferentes características dentro de la muestra no son similares a las proporciones de las características de toda la población (es decir, si estamos tomando una muestra de hombres y mujeres y sabemos que el 51% de la población total son mujeres y el 49% son hombres , entonces debemos apuntar a tener proporciones similares en nuestra muestra);
La muestra es demasiado pequeña para representar con precisión a la población; y
El método de muestreo no es aleatorio.

El error de no muestreo es causado por factores distintos a los relacionados con la selección de muestras. Se refiere a la presencia de cualquier factor, ya sea sistémico o aleatorio, que resulta en los valores de datos que no reflejan con precisión el valor «verdadero» para la población.

¿Cuáles son los tipos de errores estadísticos?

El error de una medida puede ser de dos tipos: sistemático o aleatorio. Un error sistemático es un error resultante de factores intrínsecos del sistema, método o instrumento de medición y, por esta razón, ocurre sistemáticamente para cada evento de medición. Dado que estos errores se producen sistemáticamente a cada tamaño, puede ser difícil reconocerlos y detectarlos a tiempo. Estos errores contribuyen a reducir la precisión del sistema de medición. Un ejemplo de error sistemático es lo que se obtiene cuando se usa una herramienta no perfectamente calibrada (por ejemplo, escala con un cero tácito). Los errores instrumentales sistemáticos, es decir, debido a la herramienta de medición, pueden interceptarse y restablecerse a través de operaciones de calibración periódica.

Un error aleatorio es, en cambio, un error cuya entidad depende de variaciones aleatorias en el sistema de medición del universo de objetos + (temperatura, campo eléctrico/magnético, etc.). En general, estos son errores que no se pueden eliminar, ya que no es posible controlar las fluctuaciones estadísticas de todos los parámetros involucrados en el sistema. Sin embargo, la ejecución de múltiples medidas permite reducir el error asociado con la medida gracias al hecho de que las fluctuaciones positivas y negativas se cancelan entre sí. Por esta razón, el error aleatorio también se llama error estadístico. El error aleatorio influye en la precisión del sistema de medición. Una herramienta muy precisa se caracteriza por errores aleatorios muy bajos.

Junto con los conceptos de error aleatorio y error sistemático, también hablamos sobre precisión y precisión. Para profundizar el vínculo entre estos conceptos, recomendamos leer la siguiente nota.

¿Cuál es el mal uso que se le da a la estadística?

A la pregunta «¿Se pueden manipular las estadísticas?», Podemos abordar 8 métodos a menudo utilizados, a propósito o no, que sesgaron el análisis y los resultados. Aquí hay tipos comunes de mal uso de las estadísticas:

Encuestas defectuosas
Correlaciones defectuosas
Pesca de datos
Visualización de datos engañosa
Sesgo propósito y selectivo
Usando un cambio porcentual en combinación con un pequeño tamaño de muestra
Truncando un eje
Elegir estratégicamente el período de tiempo

Ahora que los conoce, será más fácil detectarlos y cuestionar todas las estadísticas que se le dan todos los días. Del mismo modo, para asegurarse de mantener una cierta distancia a los estudios y encuestas que lee, recuerde las preguntas para hacerse: quién investigó y por qué, quién lo pagó, cuál fue la muestra.

Si bien está bastante claro que los datos estadísticos tienen el potencial de ser mal utilizados, también puede impulsar éticamente el valor de mercado en el mundo digital. Big Data tiene la capacidad de proporcionar a las empresas de la era digital una hoja de ruta para la eficiencia y la transparencia, y finalmente, la rentabilidad. Las soluciones de tecnología avanzada como el software de informes en línea pueden mejorar los modelos de datos estadísticos y proporcionar a las empresas de la era digital un paso adelante en su competencia.

Ya sea para inteligencia de mercado, experiencia del cliente o informes comerciales, el futuro de los datos es ahora. Tenga cuidado de aplicar datos de manera responsable, ética y visual, y observa crecer su identidad corporativa transparente. ¡Revise esta perspectiva lista de malos ejemplos de estadísticas de vez en cuando para recordarle la importancia de usar los datos de manera adecuada!

¿Cuáles son los tipos de errores más comunes al realizar una investigación estadística?

En la terminología estadística, el error tipo I se refiere a una decisión incorrecta cuando una prueba rechaza una hipótesis nula verdadera y también se conoce como un error del primer tipo. Se puede comparar con la aparición de falsos positivos en situaciones de prueba. Se representa con la letra griega α (alfa) y denota la probabilidad de error tipo I.

Un error de tipo II se refiere a una decisión incorrecta cuando una prueba no puede rechazar una hipótesis nula falsa y también se conoce como un error del segundo tipo. Se puede comparar un error tipo II con el llamado falso negativo en otras situaciones de prueba. Se representa con la letra griega β (beta), y forma el complemento del poder de la prueba.

El objetivo de la prueba es determinar si la hipótesis nula puede ser rechazada. Una prueba estadística puede rechazar (probar falso) o no rechazar (no probar falso) una hipótesis nula, pero nunca probarlo verdadero (es decir, no rechazar la hipótesis nula no lo demuestra verdadero).

La estimación del tamaño de la muestra es muy crucial para determinar la importancia y el impacto del resultado. Los errores alfa y beta elegidos convencionalmente son arbitrarios y han llegado a ser utilizados por la tradición en lugar de cualquier validez científica. Además, estas herramientas y técnicas estadísticas deben elegirse individualmente para cada pregunta de investigación. Sin embargo, yendo por tradición, un pequeño tamaño de muestra puede no ser capaz de detectar la verdadera diferencia en el estudio que puede denominarse falso-Ve o tipo II o β-error. La cantidad máxima de resultados falsos debe ser del 20% para cualquier población de muestra estudiada y mantener la prueba de importancia (es decir, p> 0.05). Este cálculo proporciona el poder del estudio que se puede expresar simplemente como 1 – β u 80% o más para la detección de diferencias verdaderas en las variables estudiadas. Aunque un tamaño de muestra grande puede ser apropiado para disminuir el error tipo II, aumenta el costo de todo el proyecto y también retrasa la finalización de las actividades de investigación en un período de tiempo estipulado. Además, el tamaño de muestra grande puede no adherirse a los costos estimados del proyecto y puede dar lugar a un retraso indebido en la finalización del estudio de investigación. La elección de una prueba estadística particular se rige por pocos factores importantes, como la comparación de la media o los porcentajes, el número de grupos de estudio, el tipo de datos, los datos pareados o no emparejados y la distribución de datos. [16,17,18,19]

El cegamiento de la actividad de investigación garantiza resultados y observaciones no imparciales. [20] El proceso de aleatorización y muestreo debe explicarse en la sección Material y métodos para eliminar cualquier sesgo durante la recopilación de datos que sea una parte esencial de la metodología de investigación. [1,21] Al seleccionar los grupos, factores de comparabilidad que se especifican en Los criterios de inclusión deben elegirse estrictamente para minimizar las diferencias y errores en los resultados obtenidos. [21,22] Estas diferencias en los resultados pueden minimizarse aún más mediante la aplicación de análisis multivariado durante el cálculo de los resultados. [23] Los errores en las pruebas estadísticas se remedian fácilmente, si los datos sin procesar están disponibles, pero requiere un reanálisis. La comparación de los atributos demográficos y otros en el grupo de estudio y control puede mostrar diferencias insignificantes, pero para validar la comparación, calcular el poder estadístico del estudio puede ayudar a lograr los resultados precisos en un pequeño grupo de estudio. [24] Por lo tanto, es esencial que durante el diseño del estudio, el cálculo del tamaño de la muestra, los participantes que se retiran del estudio, una clara descripción de la hipótesis nula, descripción del proceso de aleatorización, métodos de cegamiento, selección apropiada del grupo de estudio y control y selección apropiada de las pruebas estadísticas para comparar las características basales se formularán de manera clara y elaborativa.

¿Qué son los errores en la investigación?

Las fotografías de la escena del crimen son permanentes y
evidencia integral, que pueden presentarse en un tribunal de justicia para
probar o refutar un hecho en cuestión. Durante la etapa preliminar del homicidio
Investigación Es imposible determinar todas las cosas, que pueden convertirse
relevante o importante más adelante. Por lo tanto, es imperativo que las fotos sean
tomado de toda el área y ubicación donde tuvo lugar el crimen, incluido cualquier
Sitios contiguos con el crimen original.

Te recuerdo
Solo obtenga una oportunidad en la escena del crimen de homicidios, así que obtenga tanto
información y documentación como sea posible.

Muchas veces no se tomaron suficientes fotografías
porque el caso no se manejó como una investigación de homicidio o porque era
se supone que es un suicidio o natural. En cualquier caso que nunca puedas recrear
La escena del crimen original no vuelve para obtener estas fotos importantes.

El viejo adagio, «Una imagen vale más que mil palabras», es
ciertamente apropiado al considerar el valor de la escena del crimen
fotografía. Del mismo modo, nunca puedes tomar demasiadas calidad
fotografías. La muerte puede ser un homicidio y todo lo que tienes son
Algunas fotos iniciales tomadas en la escena por los primeros respondedores.

El investigador debe hacerse cargo de la escena de crímenes y
Observe el proceso CSU y la recuperación de la evidencia. No mantener la «cadena
de custodia ”y la documentación adecuada de la evidencia es responsabilidad del
detective asignado. Los investigadores y el personal no deben utilizar el
Instalaciones dentro de la escena de crímenes. Si tienes que usar el baño,
Salga de la escena y vaya a otro lado. No traiga comida o bebida al
escena. No beba el agua del residente.

¿Que no se debe hacer en estadística?

Pequeños tamaños de muestra, hacking P y correlaciones espurias son notorios en la publicación científica. También son errores fáciles de hacer cuando están bajo presión para publicar resultados de investigación con impacto, dice el neurocientífico Jean-Jacques Orban de Xivry.

«Es mucho más fácil publicar resultados significativos que los experimentos que no funcionan. Esa es una declaración desafortunada, pero es la verdad «.

Las fallas en el proceso metodológico, como la ausencia de un grupo de control adecuado y el uso de pequeños tamaños de muestra, son grandes.

Inflar las unidades de análisis (donde diferentes grupos, por ejemplo, jóvenes y mayores, se combinan para crear un tamaño de muestra más grande pero tergiversativo) es otro, y el análisis circular, también conocido como doble inmersión, también características.

Orban De Xivry describe el análisis circular como «analizar sus datos basados en lo que ve en los datos».

Nature Index habló con Orban de Xivry sobre estos errores y los efectos que pueden tener en la integridad de la investigación.

Mi coautor, Tamar Makin, originalmente estaba utilizando esta lista en el club de revistas de su laboratorio para ayudar a los investigadores a determinar la confiabilidad de los documentos que estaban leyendo.

Muchos investigadores, incluido yo mismo, han cometido estos errores, y a menudo es solo con el entrenamiento y el tiempo que te das cuenta de que has cometido un error.

No es que sepamos todo o que seamos perfectos. Es más que hemos aprendido estas cosas a lo largo de los años y pensamos que compartirlas podría ayudar a hacer que la investigación sea más confiable.

Errores estadísticos más comunes y cómo evitarlos

¿Qué son los errores en la estadística?

¿Cuáles son los tipos de errores estadísticos?

¿Cuál es el mal uso que se le da a la estadística?

¿Cuáles son los tipos de errores más comunes al realizar una investigación estadística?

¿Qué son los errores en la investigación?

¿Que no se debe hacer en estadística?

Más posts relacionados:

Unidad de observación estadística: ¿Qué es y cómo se usa?

Aprende a elegir el muestreo adecuado para tu investigación: guía de muestreo en estadística inferencial

Deja una respuesta Cancelar la respuesta