En las pruebas de hipótesis, hay ciertos pasos que uno debe seguir. Debajo de estos se resumen en seis de estos pasos para realizar una prueba de una hipótesis.
- Configure las hipótesis y verifique las condiciones: cada prueba de hipótesis incluye dos hipótesis sobre la población. Una es la hipótesis nula, notada como (H_0 ), que es una declaración de un valor de parámetro particular. Se supone que esta hipótesis es cierta hasta que haya evidencia que sugiera lo contrario. La segunda hipótesis se llama alternativa, o hipótesis de investigación, notada como (H_A ). La hipótesis alternativa es una declaración de un rango de valores alternativos en el que el parámetro puede caer. También se debe verificar que cualquier condición (suposición) necesaria para ejecutar la prueba se haya cumplido, p. Normalidad de datos, independencia y número de resultados de éxito y fracaso.
- Decida el nivel de significancia, ( alpha ): este valor se utiliza como un límite de probabilidad para tomar decisiones sobre la hipótesis nula. Este valor alfa representa la probabilidad de que estemos dispuestos a hacer en nuestra prueba para tomar una decisión incorrecta con respecto a rechazar la hipótesis nula. El valor más común ( alpha ) es 0.05 o 5%. Otras opciones populares son 0.01 (1%) y 0.1 (10%).
- Calcule la estadística de prueba: recopile datos de muestra y calcule una estadística de prueba donde el estadístico de muestra se compara con el valor del parámetro. El estadístico de prueba se calcula bajo el supuesto de que la hipótesis nula es verdadera e incorpora una medida de error estándar y supuestos (condiciones) relacionados con la distribución de muestreo.
- Calcule el valor de probabilidad (valor p), o encuentre la región de rechazo: se encuentra un valor p utilizando el estadístico de prueba para calcular la probabilidad de que los datos de la muestra produzcan dicha estadística de prueba o una más extrema. La región de rechazo se encuentra utilizando alfa para encontrar un valor crítico; La región de rechazo es el área que es más extrema que el valor crítico. Discutimos la región de valor p y rechazo con más detalle en la siguiente sección.
- Tomar una decisión sobre la hipótesis nula: en este paso, decidimos rechazar la hipótesis nula o decidimos no rechazar la hipótesis nula. Observe que no tomamos una decisión en la que aceptaremos la hipótesis nula.
- Indique una conclusión general: una vez que hayamos encontrado el valor p o la región de rechazo, y tomamos una decisión estadística sobre la hipótesis nula (es decir, rechazaremos el nulo o no rechazaremos el nulo), luego queremos resumir nuestros resultados en una Conclusión general para nuestra prueba.
Seguiremos estos seis pasos para el resto de esta lección. En las lecciones futuras, se seguirán los pasos, pero es posible que no se expliquen explícitamente.
El paso 1 es un paso muy importante para configurar correctamente. Si sus hipótesis son incorrectas, su conclusión será incorrecta. En la siguiente sección, practicamos con el paso 1 para las situaciones de muestra.
¿Cuáles son los pasos para realizar una prueba de hipótesis?
Ahora que entendemos la idea general de cómo funciona las pruebas de hipótesis estadística, volvamos a cada uno de los pasos y profundicemos un poco más profundos, obteniendo más detalles y aprendiendo alguna terminología.
En los tres ejemplos, nuestro objetivo es decidir entre dos puntos de vista opuestos, la reivindicación 1 y el reclamo 2. En las pruebas de hipótesis, la reclamación 1 se llama hipótesis nula (denota «ho»), y la reclamación 2 juega el papel de la alternativa Hipótesis (denota «HA»). Como vimos en los tres ejemplos, la hipótesis nula sugiere que no está sucediendo nada especial; En otras palabras, no hay cambios en el status quo, no hay diferencia con el estado de cosas tradicional, no hay relación. Por el contrario, la hipótesis alternativa no está de acuerdo con esto, afirmando que algo está sucediendo, o hay un cambio en el status quo, o hay una diferencia con el estado de cosas tradicional. La hipótesis alternativa, HA, generalmente representa lo que queremos verificar o lo que sospechamos que realmente está sucediendo.
Volvamos a nuestros tres ejemplos y apliquemos la nueva notación:
- HO: La proporción de fumadores en GU es 0.20.
- HA: La proporción de fumadores en GU es inferior a 0,20.
- HO: La concentración media en el envío es el requerido 245 ppm.
- HA: La concentración media en el envío no es el requerido 245 ppm.
- HO: El rendimiento en el SAT no está relacionado con el género (los hombres y las hembras anotan lo mismo).
Este paso es bastante obvio. De esto se trata la inferencia. Observa los datos muestreados para sacar conclusiones sobre toda la población. En el caso de las pruebas de hipótesis, basadas en los datos, saca conclusiones sobre si hay o no suficiente evidencia para rechazar HO.
¿Qué es la prueba de la hipótesis?
La hipótesis nula señalada H0 es la hipótesis de que
Queremos controlar: consiste en decir que no hay diferencia entre
parámetros comparados o que la diferencia observada no es significativa
y se debe a fluctuaciones de muestreo.
Esta hipótesis está formulada para ser rechazada.
Si queremos comparar la frecuencia de los fumadores en la población estudiantil (P) con el
frecuencia de fumadores en la población en
General (señalado P0), la hipótesis nula
probado es el siguiente:
La diferencia de frecuencia en los fumadores no es
significativamente diferente entre las dos poblaciones comparadas.
La hipótesis alternativa observó a H1est el
Negación de H0, es equivalente decir «H0est
falso «. La decisión de rechazar H0signifiy que H1est
realizado o h1est verdadero.
Esto solo refleja la opinión de que no hay evidencia clara de
Una prueba lleva a rechazar o no rechazar una hipótesis cero a nunca aceptarla desde el principio.
La naturaleza de H0determine la forma de formular H1ET
En consecuencia, la naturaleza unilateral o bilateral de la prueba.
Si H0Consist digo que la población estudiantil con la frecuencia de los fumadores P es representativa de la población con la frecuencia de los fumadores P0, luego posamos:
La prueba será bilateral porque
Consideramos que la frecuencia P puede ser superior
o más bajo que la frecuencia P0.
La región criticó
En verde corresponde a una probabilidad A/2 en ambos lados de la curva.
¿Cuál es la utilidad de la prueba de hipótesis?
Data Science tiene dos partes «datos» y «ciencia». Solo ambos tienen sus significados individuales, pero cuando se combinan juntos, los «datos» obtienen potencia. Sí, lo escuchaste bien, pero la pregunta aquí es cómo los «datos» obtienen potencia. Los datos por sí solos no son interesantes, es la interpretación y las ideas de los datos los que lo hacen digno. Cómo lograr eso es otra pregunta que reflexiona en nuestras mentes. Entonces diría que las estadísticas son la respuesta a esta pregunta.
La ciencia de datos es la carrera más solicitada en la era actual. Incluso los estudiantes universitarios quieren construir su carrera en ciencias de los datos. En notas similares, sería correcto citar a Thomas H. Davenport y D.J. Patil en uno de los artículos de Harvard Business Review que, «Científico de datos: el trabajo más sexy del siglo XXI».
Con tecnologías en evolución y herramientas/algoritmos de automatización se han establecido, lo que hace que la creación de modelos de aprendizaje automático sea bastante simple. Aún así, los conceptos fundamentales son bastante confusos y entre ellos son pruebas de hipótesis.
En este artículo, estoy tratando de aclarar el concepto de pruebas de hipótesis y su importancia en el mundo de la ciencia de datos.
Ronald Coase dijo «torturar los datos, y confesará cualquier cosa». Para esa confesión de datos, las pruebas de hipótesis podrían usarse para interpretar y sacar conclusiones sobre la población utilizando datos de muestra. Una prueba de hipótesis ayuda a tomar una decisión sobre qué declaración mutuamente excluyente sobre la población es mejor respaldada por datos de muestra.
¿Cuándo se hace una prueba de hipótesis?
De una hipótesis dada, la construcción de una prueba estadística requiere tres elementos principales:
- una estadística que mide la diferencia en las observaciones en relación con la hipótesis nula;
- la distribución de esta estadística bajo la hipótesis nula; y
- Un umbral de significancia.
En el ejemplo visto al comienzo de este curso, calculamos las estadísticas (t ) cuya distribución teórica sabemos, lo que nos permitió determinar un valor (p ), es decir, la probabilidad de obtener una desviación igual a o mayor que la observada, si la hipótesis nula fuera cierta.
El umbral de significado ( ( alpha )) corresponde a una probabilidad que consideremos lo suficientemente pequeña como para rechazar la hipótesis nula si (p leq alpha ). Por razones históricas, el umbral más utilizado en IS ( alfa = 0.05 ). Esto corresponde a una probabilidad de 5% de rechazo erróneo de la hipótesis cero.
El umbral ( alpha ) debe elegirse antes del análisis de datos.
Para una prueba bilateral, se rechaza una fracción ( alfa / 2 ) de cada distribución extrema (como para el intervalo de confianza). Para una prueba unilateral, una fracción ( alpha ) se rechaza de una distribución extrema. Aquí hay una ilustración de los dos casos con ( alfa = 0.05 ).
Estos son los cuatro escenarios posibles dependiendo de si (H_0 ) es verdadero o falso y si es rechazado o no:
Nota: La verdad de (H_0 ) para una hipótesis cero del tipo ( mu = 0 ) es más bien una abstracción. En la práctica, la diferencia entre dos tratamientos puede ser muy baja, pero casi nunca será perfectamente cero. Sin embargo, podemos concebir una hipótesis cero que es fiel a cierta precisión.
¿Cuándo se hace la prueba de hipótesis?
En estadísticas, una prueba de hipótesis es un enfoque que consiste en rechazar o aceptar una hipótesis estadística, llamada hipótesis nula, dependiendo de un conjunto de datos (muestra).
Esquemáticamente, generalmente distinguimos las pruebas de homogeneidad y las pruebas de cumplimiento.
- En el caso de una prueba de homogeneidad, queremos comparar dos muestras entre ellas. La hipótesis nula H0 supondrá la homogeneidad de las dos muestras. Por ejemplo, compararemos dos promedios.
- En el caso de una prueba de conformidad, queremos determinar si una muestra (en general, una muestra es una pequeña cantidad de un asunto, información o…) sigue una ley estadística (las estadísticas son tanto en una ciencia formal, un método y una técnica. Ella…) conocida. La hipótesis nula H0 supondrá la adecuación de la muestra a esta ley.
- Cálculo de una variable (en matemáticas y lógica, una variable está representada por un símbolo. Es…) de la decisión correspondiente a una medida de la distancia entre las dos muestras en el caso de la homogeneidad, o entre la muestra y la ley estadística (( Una estadística es, a primera vista, un número calculado sobre una muestra…) en el caso de la conformidad. Cuanto mayor sea esta distancia y menos probable es probable que sea la hipótesis.
- El cálculo de la probabilidad (la probabilidad (de las probabilitas latinas) es una evaluación de la naturaleza probable de A…) para obtener un valor de la variable de decisión como extremo o más extremo como el valor obtenido, suponiendo que H0 sea verdadero. Esta probabilidad, generalmente llamada riesgo de la primera especie y anotada α0, corresponde al riesgo de rechazar erróneamente H0 si H0 es realmente cierto.
- Conclusión de la prueba, dependiendo de un riesgo umbral αseuil, por debajo del cual estamos listos para rechazar H0. A menudo, un riesgo de 5% se considera aceptable (es decir, en el 5% de los casos cuando H0 es verdadero, el experimentador se equivocará y lo rechazará). Pero la elección del umbral que se utilizará dependerá de la certeza deseada y la probabilidad de las alternativas.
La probabilidad de que H0 se acepte mientras es falso es β, el riesgo de segunda especie. Este es el riesgo de no rechazar H0 cuando debe rechazarlo. Su valor depende del contexto (el contexto de un evento incluye las circunstancias y condiciones que lo rodean;…), y es muy difícil de evaluar (si no imposible de evaluar), por lo que solo el riesgo se usa como un Criterio de decisión.
Hay muchas pruebas estadísticas convencionales entre las que podemos citar:
- En el caso de una prueba de homogeneidad, queremos comparar dos muestras entre ellas. La hipótesis nula H0 supondrá la homogeneidad de las dos muestras. Por ejemplo, compararemos dos promedios.
- En el caso de una prueba de conformidad, queremos determinar si una muestra (en general, una muestra es una pequeña cantidad de un asunto, información o…) sigue una ley estadística (las estadísticas son tanto en una ciencia formal, un método y una técnica. Ella…) conocida. La hipótesis nula H0 supondrá la adecuación de la muestra a esta ley.
- Cálculo de una variable (en matemáticas y lógica, una variable está representada por un símbolo. Es…) de la decisión correspondiente a una medida de la distancia entre las dos muestras en el caso de la homogeneidad, o entre la muestra y la ley estadística (( Una estadística es, a primera vista, un número calculado sobre una muestra…) en el caso de la conformidad. Cuanto mayor sea esta distancia y menos probable es probable que sea la hipótesis.
- El cálculo de la probabilidad (la probabilidad (de las probabilitas latinas) es una evaluación de la naturaleza probable de A…) para obtener un valor de la variable de decisión como extremo o más extremo como el valor obtenido, suponiendo que H0 sea verdadero. Esta probabilidad, generalmente llamada riesgo de la primera especie y anotada α0, corresponde al riesgo de rechazar erróneamente H0 si H0 es realmente cierto.
- Conclusión de la prueba, dependiendo de un riesgo umbral αseuil, por debajo del cual estamos listos para rechazar H0. A menudo, un riesgo de 5% se considera aceptable (es decir, en el 5% de los casos cuando H0 es verdadero, el experimentador se equivocará y lo rechazará). Pero la elección del umbral que se utilizará dependerá de la certeza deseada y la probabilidad de las alternativas.
En estadísticas y probabilidad, varianza
En termodinámica, varianza
) en una parte «explicable» y una parte de «error», supuestamente distribuida de acuerdo con la ley normal (en probabilidad, se dice que una variable aleatoria real X sigue una ley normal (o…). Esta prueba se usa particularmente en Ciencias Humanas y Sociales (SHS), Ciencias Cognitivas, Ciencias Médicas y Ciencias Vivientes.
En los métodos bayesianos se utiliza mucho el psi-test (medida de la distancia en el espacio de posibilidades), cuyo Chi-2 se muestra como una muy buena aproximación de…) asintótica cuando hay un gran número ( La noción de número en lingüística se trata en el artículo “Número…) de observaciones (Observación es la acción de vigilar atentamente los fenómenos, sin voluntad de los…).
¿Cómo se realiza la prueba de hipótesis?
- El tipo de variable de resultado que se analiza (continuo, dicotómico, discreto)
- el número de grupos de comparación en la investigación
- Si los grupos de comparación son independientes (es decir, físicamente separados, como hombres versus mujeres) o dependientes (es decir, coincidentes o emparejados, como evaluaciones previas y posteriores a los mismos participantes).
En estimación, nos centramos explícitamente en las técnicas para una y dos muestras y discutimos la estimación para un parámetro específico (por ejemplo, la media o proporción de una población), para las diferencias (por ejemplo, la diferencia de medias, la diferencia de riesgo) y las proporciones (por ejemplo, el riesgo relativo y odds ratio). Aquí nos centraremos en los procedimientos para una y dos muestras cuando el resultado sea continuo (y nos enfocamos en medios) o dicotómicos (y nos centramos en las proporciones).
Los Centros para el Control de Enfermedades (CDC) informaron sobre tendencias de peso, altura e índice de masa corporal desde la década de 1960 hasta 2002.1 La tendencia general era que los estadounidenses eran mucho más pesados y ligeramente más altos en 2002 en comparación con 1960; Tanto hombres como mujeres ganaron aproximadamente 24 libras, en promedio, entre 1960 y 2002. En 2002, el peso medio para los hombres se informó en 191 libras. Supongamos que un investigador plantea la hipótesis de que los pesos son aún más altos en 2006 (es decir, que la tendencia continuó durante los 4 años posteriores). La hipótesis de la investigación es que el peso medio en los hombres en 2006 es más de 191 libras. La hipótesis nula es que no hay cambios en el peso y, por lo tanto, el peso medio sigue siendo 191 libras en 2006.
Para probar las hipótesis, seleccionamos una muestra aleatoria de hombres estadounidenses en 2006 y medimos sus pesos. Supongamos que tenemos recursos disponibles para reclutar n = 100 hombres en nuestra muestra. Pesamos cada participante y calculamos estadísticas de resumen sobre los datos de la muestra. Supongamos que en la muestra determinamos lo siguiente:
- El tipo de variable de resultado que se analiza (continuo, dicotómico, discreto)
- el número de grupos de comparación en la investigación
- Si los grupos de comparación son independientes (es decir, físicamente separados, como hombres versus mujeres) o dependientes (es decir, coincidentes o emparejados, como evaluaciones previas y posteriores a los mismos participantes).
¿Los datos de la muestra respaldan la hipótesis nula o de investigación? La media de muestra de 197.1 es numéricamente más alta que 191. Sin embargo, ¿es esta diferencia más de lo esperado por casualidad? En las pruebas de hipótesis, suponemos que la hipótesis nula se mantiene hasta que se demuestre lo contrario. Por lo tanto, necesitamos determinar la probabilidad de observar una media de muestra de 197.1 o superior cuando la media de la población verdadera es 191 (es decir, si la hipótesis nula es verdadera o bajo la hipótesis nula). Podemos calcular esta probabilidad utilizando el teorema del límite central. Específicamente,
Artículos Relacionados: