- Calcule el estadístico de prueba utilizando las propiedades relevantes de su muestra.
- Especifique las características de la distribución de muestreo de la estadística de prueba.
- Coloque su estadística de prueba en la distribución de muestreo para encontrar el valor P.
Antes de pasar al ejemplo de cálculos, resumiré el propósito para cada paso. Esta parte te dice el «por qué». En la sección de cálculos de ejemplo, muestro el «cómo».
Todas las pruebas de hipótesis reducen sus datos de muestra a un solo número conocido como estadística de prueba. Las pruebas t usan valores T. Las pruebas F usan valores F. Las pruebas de chi-cuadrado usan valores de chi-cuadrado. Elegir el correcto depende del tipo de datos que tenga y de cómo desea analizarlos. Antes de que pueda encontrar el valor P, debe determinar qué prueba de hipótesis y estadística de prueba utilizará.
Las estadísticas de prueba evalúan cuán consistentes son los datos de su muestra con la hipótesis nula. A medida que una estadística de prueba se vuelve más extrema, indica una mayor diferencia entre los datos de su muestra y la hipótesis nula.
La forma en que calcula el estadístico de prueba depende de cuál esté utilizando. Como era de esperar, el método para calcular las estadísticas de prueba varía según el tipo de prueba. En consecuencia, para calcular el valor P para cualquier prueba, deberá conocer la fórmula estadística de prueba correcta.
Para obtener más información sobre las estadísticas de prueba y cómo calcularlas para otras pruebas, lea mi artículo, estadísticas de prueba.
Las estadísticas de prueba no son unitarias, lo que hace que sean difíciles de interpretar por su cuenta. Debe colocarlos en un contexto más amplio para comprender cuán extremos son.
¿Qué es el p valor de una prueba de hipótesis?
Recientemente, implementé una nueva metodología en mi trabajo. Hice algunos experimentos, analicé los resultados y con algunos cálculos estadísticos que probé, la nueva metodología es mejor que la existente…
Creo en mantener las cosas simples, y este es el enfoque simplificado para comprender las pruebas de hipótesis…
Siendo humanos, siempre tenemos preguntas sobre casi todo. Se trata de comprar una casa, un automóvil o simplemente comer un helado. Siempre pensamos, si el helado de chocolate es mejor que la vainilla o un auto deportivo es mejor que una camioneta simple. Del mismo modo, las empresas e investigadores también tienen preguntas como la nueva metodología es mejor o no, si el nuevo producto generará más ingresos que el existente y así sucesivamente…
Para poder responder tales preguntas, necesitamos traducirlas en algo conocido como hipótesis. Luego necesitamos recopilar los datos a través de experimentos, encuestas y procesos. Después de realizar algunas pruebas estadísticas, al final, podemos responder a las preguntas planteadas.
La prueba de hipótesis es un método estadístico que se utiliza para tomar una decisión sobre la población completa, con la ayuda de solo datos de muestra. Para tomar esta decisión, se nos ocurrió un valor llamado Valor P…
Las pruebas de hipótesis ayudan a las empresas e investigadores a tomar mejores decisiones basadas en datos.
En todo este artículo, consideremos un ejemplo, lo que hace que las cosas sean fáciles de entender.
Hay una compañía ABC, que quiere saber si el nuevo diseño de la página web de bienvenida da como resultado una mayor cantidad de suscripciones del sitio web o no. Entonces, consideremos la siguiente notación.
¿Qué es el valor p en la prueba de hipótesis?
Para usar el valor p en las pruebas de hipótesis, siga los pasos a continuación:
- Determine su nivel de importancia (α). El nivel de importancia generalmente debe elegirse durante los primeros pasos del diseño de una prueba de hipótesis. Los niveles de significación más comunes incluyen 0.10, 0.05 y 0.01.
- Calcule el valor p. Existen numerosas aplicaciones de software que ofrecen el cálculo. Por ejemplo, Microsoft Excel permite el cálculo del valor p utilizando el análisis de análisis de datos.
- Compare el valor p obtenido con el nivel de significancia (α) y extrae las conclusiones relevantes. La regla general aquí es si la cifra es menor que el nivel de importancia, entonces hay evidencia suficiente para rechazar la hipótesis nula de un experimento.
El grado de significación estadística generalmente varía según el nivel de significación. Por ejemplo, un valor p que es más de 0.05 se considera estadísticamente significativo, mientras que una cifra que es inferior a 0.01 se considera altamente estadísticamente significativa.
En estadísticas, el valor p puede considerarse realmente como uno de los conceptos más malinterpretados. El mayor error sobre el concepto es que es una probabilidad de que la hipótesis nula sea verdadera (o es una probabilidad de que la hipótesis alternativa sea falsa).
En realidad, el valor p no determina la probabilidad de que la hipótesis nula sea verdadera, pero simplemente indica la probabilidad de encontrar los resultados de un estudio al menos tan extremos como los resultados realmente observados si la hipótesis nula es verdadera. En otras palabras, indica la probabilidad de tener suficiente evidencia para rechazar o no rechazar la hipótesis nula.
¿Cómo calcular el valor p en una prueba de hipótesis?
Para realizar este método, primero formulamos las hipótesis nulas y alternativas.
Alpha o el nivel de significancia es la probabilidad de cometer un error en las pruebas de hipótesis cuando la hipótesis nula es cierta. También especifica la región crítica o la región de rechazo de la hipótesis nula en la distribución. Si la media de la muestra se encuentra en esa región crítica, rechazamos la hipótesis nula y aceptamos la hipótesis alternativa.
El alfa comúnmente utilizado es 0.05 (5 %), pero puede variar según los requisitos comerciales. Si la prueba es una prueba de 2 colas, dividimos el alfa por 2 para distribuir igualmente el nivel de significancia en el corte inferior y superior. En el caso de una prueba de 1 cola, mantenemos el alfa tal como está.
Luego, calculamos el error estándar de la muestra, que es la desviación estándar de la población dividida por la raíz cuadrada del tamaño de la muestra (N).
Después de encontrar el error estándar, tomamos una muestra y la media de esa muestra y luego encontramos el puntaje Z asociado con ese valor medio.
Z = (media de muestra - media de población)/ (error estándar)
Ahora, encontramos el valor p asociado con el puntaje Z que calculamos. Luego remitimos la tabla Z para encontrar la probabilidad de la puntuación Z calculada. Luego, para encontrar el valor p, restamos esa probabilidad de 1.
Valor p = 1-probabilidad (puntaje z)
Finalmente, verificamos si el valor p calculado es mayor que el nivel de significancia o no.
¿Cómo calcular p value t Student?
Recuerde que el valor p es la probabilidad (calculada bajo el supuesto de que la hipótesis nula es verdadera) de que el estadístico de prueba producirá valores al menos tan extremo como el puntaje T producido para su muestra. Como las probabilidades corresponden a las áreas bajo la función de densidad, el valor P de la prueba t se puede ilustrar bien con la ayuda de las siguientes imágenes:
Las siguientes fórmulas dicen cómo calcular el valor P de la prueba t. Por CDFT, d denotamos la función de distribución acumulativa de la distribución del estudio t con d grados de libertad:
o, de manera equivalente: valor p = 2 – 2 * cdft, d (| tscore |)
Sin embargo, el CDF de la distribución T viene dada por una fórmula algo complicada. Para encontrar el valor p a mano, necesitaría recurrir a tablas estadísticas, donde se recopilan valores de CDF aproximados o al software estadístico especializado. ¡Afortunadamente, nuestra calculadora de prueba t determina el valor p de la prueba t para ti en un abrir y cerrar de ojos!
Recuerde que en el enfoque de valores críticos para las pruebas de hipótesis, debe establecer un nivel de significancia, α, antes de calcular los valores críticos, lo que a su vez dan lugar a regiones críticas (también conocidas como regiones de rechazo).
Las fórmulas para valores críticos emplean la función cuantil de distribución t, es decir, la inversa del CDF:
Valor crítico para la prueba t de cola derecha: CDFT, D-1 (1-α)
Valores críticos para la prueba t de dos colas: ± CDFT, D-1 (1-α/2)
Para decidir el destino de la hipótesis nula, simplemente verifique si su puntaje T se encuentra dentro de la región crítica:
Si su puntaje T pertenece a la región crítica, rechace la hipótesis nula y acepte la hipótesis alternativa.
¿Cómo se calcula el p value?
Wikihow es un «wiki»; Esto significa que muchos de nuestros artículos son el resultado de la colaboración de múltiples autores. Para crear este artículo, 15 personas, algunas de forma anónima, colaboraron haciendo cambios para mejorarlo con el tiempo.
El P, o el valor del valor de probabilidad es una medida estadística que ayuda a los científicos a determinar la corrección de su hipótesis. P se usa para comprender si los resultados de un experimento se encuentran dentro del rango normal de valores para el evento bajo observación. Por lo general, si el valor de P de un cierto conjunto de datos cae por debajo de un cierto nivel pre -establecido (por ejemplo 0.05), los científicos rechazan «la hipótesis nada» [1] Xfonte de su experimento, en otras palabras, excluyen la hipótesis cuya variable no es significativa para los resultados. Puede usar una tabla para encontrar el valor P, después de calcular otros valores estadísticos. Uno de los valores estadísticos a determinar primero es cuya pintura.
- Por ejemplo: Digamos que estudios anteriores han demostrado que, a nivel nacional, los conductores de automóviles rojos han tomado más multas debido a la exceso de velocidad en comparación con los conductores de automóviles azules, en una proporción de 2: 1. Desea comprender si la policía de su ciudad «respeta» estas estadísticas y prefiere a los autos rojos finos. Si toma una muestra aleatoria de 150 multas por exceso de velocidad asignada a autos rojos y azules, debe esperar que 100 sean para los rojos y 50 para el azul, si la policía de su ciudad respeta la tendencia nacional.
- Por ejemplo: en su ciudad, las 150 multas aleatorias por exceso de velocidad que ha tenido en cuenta se dividen en 90 para automóviles rojos y 60 para el azul. Estos datos fluyen desde el promedio nacional (y previsto) 100 y 50. Nuestra manipulación del experimento (en este caso cambiamos al campeón de nacional a local) fue la causa de esta diferencia, o es la policía de la ciudad la que sí lo hace. ¿No sigues el promedio nacional? ¿Estamos observando un comportamiento diferente o hemos introducido una variable significativa? El valor P nos dice exactamente esto.
- Ejemplo: su experimento tiene dos categorías, una para autos rojos y el otro para el azul. Entonces tienes 2-1 = 1 grado de libertad. Si hubiera tenido en cuenta los autos rojos, azules y verdes, habría tenido 2 grados de libertad, etc.
- Tenga en cuenta que la ecuación incluye el símbolo σ (Sigma). En otras palabras, debe calcular ((| o-e |, 05) 2/e) para cada resultado posible y luego agregar los resultados para obtener la imagen cuya imagen. En el ejemplo, estamos considerando que tenemos dos resultados: el automóvil que tomó la multa es azul o rojo. Luego calculamos ((o-e) 2/e) dos veces, uno para los rojos y el otro para el azul.
- Por ejemplo: insertamos los valores esperados y observados en la ecuación x2 = σ ((o-e) 2/e). Recuerde que, dado que está el símbolo Sigma, debe realizar el cálculo dos veces, uno para autos rojos y el otro para los azules. Así es como tienes que hacer:
- Por convención, los científicos determinan su nivel de importancia a 0.05 o 5%. Esto significa que los datos experimentales tienen, como máximo, el 5% de la posibilidad de ser aleatorio. En otras palabras, hay el 95% de las posibilidades de que los resultados han sido influenciados por la manipulación de las pruebas de la prueba por parte de los científicos. Para la mayoría de los experimentos, la seguridad del 95% que existe una correlación entre dos variables demuestra de manera «satisfactoria» que la correlación realmente existe.
- Por ejemplo: en su prueba de automóviles rojos y azules, siga el acuerdo de la comunidad científica y establezca su nivel de importancia en 0.05.
- Las tablas de distribución de cuya pintura está disponible en casi todas partes, puede encontrarlas en línea o en textos de ciencias y estadísticas. Si no puede obtenerlos, use la de la foto de arriba o use este enlace.
- Por ejemplo: su quién es 3. Entonces use la tabla de distribución en la foto de arriba y encuentre el valor aproximado de P. Dado que sabe que su experimento tiene solo 1 grado de libertad, comenzará desde la línea más alta. Muévase de la izquierda a la derecha en la tabla hasta que encuentre un valor mayor que 3 (su batidor). El primer número que conoce es 3.84. Vuelva a subir en la columna y nota que corresponde a un valor de 0.05. Esto significa que nuestro valor P está entre 0.05 y 0.1 (el número más grande que sigue en la tabla).
- Por ejemplo: el valor P está entre 0.05 y 0.1, por lo tanto, ciertamente no es inferior a 0.05. Esto significa que no puede rechazar su hipótesis nada y que no ha alcanzado el umbral de seguridad mínimo del 95% para decidir si la policía de su ciudad da multas a autos rojos y azules con una proporción significativamente diferente que el promedio nacional.
- En otras palabras, existe una posibilidad del 5-10% de que los datos obtenidos fueran el resultado del caso y no el hecho de que cambió la muestra (de nacional a local). Dado que se ha impuesto un límite máximo de inseguridad del 5%, no se puede decir que la policía de su ciudad está menos «impedida» hacia los automovilistas que conducen un automóvil rojo.
- El uso de una calculadora científica facilitará mucho los cálculos. También puede encontrar calculadoras en línea.
- Es posible calcular el valor P utilizando diferentes programas, como el software de hoja de cálculo común o el más especializado para el cálculo estadístico.
Para calcular el valor P, compare los resultados esperados del experimento con los observados. Calcular este valor lo ayuda a comprender si los resultados son parte de un intervalo normal. Una vez que se encuentra el valor de P aproximado, puede decidir si rechazar o mantener su «hipótesis nada». Si el valor P es menor que una cantidad predeterminada (por ejemplo 0.05), debe rechazar la hipótesis nada del experimento.
¿Cómo calcular el valor de t Student?
El valor p se calcula a partir de la distribución de datos que generalmente es estudiante o normal. Sigue la fórmula de cálculo del valor p en el caso de una Z normal:
Esta fórmula se puede adaptar al caso de una distribución de Student T reemplazando Z con T. Proporcionamos un ejemplo que hace que el procedimiento calcule el valor p más claro y, por lo tanto, para obtener el resultado de una prueba estadística.
Desea verificar la hipótesis ninguno $ h_0: mu = 175 $ contra la hipótesis alternativa $ h_1: mu> 175 $. $ Sigma $ es desconocido. Se extrae una muestra de 10 elementos cuyo promedio de muestra es $ mu_0 = 181.5 $ y cuya varianza de muestra correcta $ S^2 = $ 95.5067. La prueba se realiza a un nivel de significancia $ alpha = $ 0.05.
Construimos la prueba de estadísticas a partir de la estimación natural del valor esperado, o el promedio de muestra de $ sobreline {x} = mu_0 $. Estandarización de la estandarización obtenemos la prueba de estadísticas:
Observamos en las tablas que $ 1,833 Por lo tanto, podemos aproximar el valor p calculando el valor que se encuentra al 63% de la distancia entre 0.025 y 0.05: la distancia entre 0.025 y 0.05 es igual a su diferencia en el valor absoluto, es decir, 0.025; El 63% de esta distancia es 0.01575. Sin embargo, mientras que en el primer caso aumentan los valores (de 1.833 a 2,262), ahora disminuyen (de 0.05 a 0.025), por lo tanto, para encontrar el punto cuya distancia de 0.05 es 63% de la distancia de 0.025, debo Retire de 0.05 el valor 0.01575: Del valor p obtenido podemos decir que, como es más bajo que el nivel de importancia $ alpha = $ 0.05, la hipótesis se puede rechazar. La prueba también es estadísticamente significativa. Artículos Relacionados:
