En estadísticas, el valor p es la probabilidad de obtener resultados al menos tan extremos como los resultados observados de una prueba de hipótesis estadística, suponiendo que la hipótesis nula es correcta. El valor p sirve como una alternativa a los puntos de rechazo para proporcionar el nivel más pequeño de importancia en el que se rechazará la hipótesis nula. Un valor p más pequeño significa que hay evidencia más fuerte a favor de la hipótesis alternativa.
El valor P a menudo se usa para promover la credibilidad de los estudios o informes de las agencias gubernamentales. Por ejemplo, la Oficina del Censo de los Estados Unidos estipula cualquier análisis con un valor p superior a 0.10 debe ir acompañado de una declaración de que la diferencia no es estadísticamente diferente de cero, la Oficina del Censo también tiene estándares establecidos para los que los valores P son aceptables. Varias publicaciones.
- Un valor p es una medición estadística utilizada para validar una hipótesis contra los datos observados.
- Un valor p mide la probabilidad de obtener los resultados observados, suponiendo que la hipótesis nula es cierta.
- Cuanto menor sea el valor p, mayor es la importancia estadística de la diferencia observada.
- Un valor p de 0.05 o inferior generalmente se considera estadísticamente significativo.
- El valor P puede servir como una alternativa o además de los niveles de confianza preseleccionados para las pruebas de hipótesis.
Los valores P generalmente se encuentran utilizando tablas de valor P o hojas de cálculo/software estadístico. Estos cálculos se basan en la distribución de probabilidad supuesta o conocida de la estadística específica probada. Los valores p se calculan a partir de la desviación entre el valor observado y un valor de referencia elegido, dada la distribución de probabilidad de la estadística, con una mayor diferencia entre los dos valores correspondientes a un valor p más bajo.
Matemáticamente, el valor p se calcula utilizando un cálculo integral del área bajo la curva de distribución de probabilidad para todos los valores de estadísticas que están al menos tan lejos del valor de referencia como el valor observado, en relación con el área total bajo la curva de distribución de probabilidad .
El cálculo para un valor p varía según el tipo de prueba realizada. Los tres tipos de prueba describen la ubicación en la curva de distribución de probabilidad: prueba de cola baja, prueba de cola superior o prueba de dos lados.
¿Qué significa el valor de p?
Uno de los conceptos más importantes en las estadísticas es la interpretación del valor p. Me gustaría compartir mi comprensión del valor p en términos más simples.
Supongamos que una compañía afirma que el chocolate «X» que produce tiene 70 gm de nuez en 1 bar de chocolate. Pero algunos clientes se quejan de que las barras de chocolate tienen menos nueces que 70 gm. Queremos probar si el reclamo de la compañía sobre el peso medio de las nueces en el chocolate x es correcto. Intentemos resolver este problema.
Tomamos una muestra de 20 barras de chocolate y encontramos la cantidad media de nueces en esas barras (media de muestra) para hacer que las inferencias sobre la población media. ¿Diferencia entre población y muestra? Vea abajo:
Hay diferentes formas de muestreo de la población. Aquí tomamos una muestra aleatoria de barras disponibles en la tienda más cercana.
La media de la población (no conocida) es la media de las nueces contenidas en todas las barras producidas por la compañía, que en realidad no es factible de calcular. Presumimos un valor para ello que es 70 gm (media hipotética, lo que la compañía ha reclamado) en nuestro ejemplo.
Supongamos que obtenemos una media de nuez de 68.5 para las 20 barras que probamos. ¿Podemos concluir que las afirmaciones del cliente son ciertas? ¿Esto proporciona suficiente evidencia de que las barras no tengan nueces o este resultado podría ser de suerte? Para responder a esto hacemos pruebas de hipótesis.
Hipótesis nula: la media de la población de las nueces en las barras de chocolate es de 70 gm. (Esto es lo que estamos tratando de proporcionar evidencia).
¿Cómo se interpreta el valor de p?
Aunque los valores de P son resúmenes convenientes y populares de los resultados experimentales, podemos ser extraviados si los consideramos como nuestra única métrica1. Incluso en el caso ideal de un estudio aleatorizado rigurosamente diseñado para un modelo predeterminado, los valores de P aún deben complementarse con otra información para evitar una interpretación errónea.
Un valor de P es una declaración de probabilidad sobre la muestra observada en el contexto de una hipótesis, no sobre las hipótesis que se están probando. Por ejemplo, supongamos que deseamos saber si la enfermedad afecta el nivel de un biomarcador. El valor de P de una comparación de los niveles medios de biomarcadores en muestras sanas versus enfermas sería la probabilidad de que una diferencia en las medias al menos tan grandes como la observada se pueda generar a partir de muestras aleatorias si la enfermedad no afecte el nivel medio de biomarcadores. No es la probabilidad de que los medios de nivel de biomarcador en las dos muestras son iguales, son o no son iguales.
Sin embargo, esta relación entre los valores de P y la inferencia sobre las hipótesis es un punto crítico: la interpretación del análisis estadístico depende de ello. Es uno de los temas clave en la declaración de la Asociación Estadística Americana sobre la significación estadística y los valores de P2, publicado para mitigar el mal uso generalizado y la mala interpretación de los valores de P. Esta relación se discute en algunos de los 18 comentarios breves que acompañan a la declaración, de las cuales surgen tres ideas principales para usar, interpretar e informar los valores de P: el uso de límites de valor P más estrictos respaldados por el análisis bayesiano, el uso del valor P observado para estimar la tasa de descubrimiento falso (FDR) y la combinación de valores de P y tamaños de efectos para crear intervalos de confianza más informativos. Las primeras dos de estas ideas son actualmente más útiles como pautas para evaluar cuán fuertemente los datos admiten hipótesis nulas versus alternativas, mientras que el tercero podría usarse para evaluar cuán fuertemente los valores de los parámetros de soporte de datos en el intervalo de confianza. Sin embargo, al igual que los valores de P, estos métodos estarán sesgados hacia la hipótesis alternativa cuando se use con un valor P seleccionado de las pruebas o modelos más significativos 1.
¿Qué es el p valor y cómo se calcula?
La valoración puede ser un proceso largo y detallado que consiste en varios pasos y tareas. Los requisitos varían pero generalmente consisten en organizar estados financieros, determinar si los activos se tienen en cuenta y elegir un método de valoración. Algunos métodos también pueden requerir investigación dentro de la industria al hacer comparaciones. Las empresas pueden realizar un análisis del mercado u otras empresas dentro de la industria para una mejor comprensión de cómo sus activos se miden con los demás.
Para crear una valoración comercial, se necesitan documentos financieros y declaraciones para revisar los datos utilizados para valorar la empresa. Esto puede incluir estados financieros, como balances y estados de ingresos, así como otros documentos financieros, como impuestos.
Es importante asegurarse de que todos los activos se tengan en cuenta para que la valoración sea una verdadera representación del valor de la Compañía. Los activos tangibles, que son de forma física, generalmente se enumeran en los estados financieros de la Compañía. Incluyen cosas como equipos y suministros. Los activos intangibles son aquellos que no se pueden registrar, ya que generalmente se refieren a conceptos e ideas. Aunque no se les da un valor numérico, los activos intangibles aún pueden aportar valor a una empresa, ya que consiste en cosas como la reputación de la marca, las listas de clientes y la propiedad intelectual.
Para determinar el valor de una empresa, hay varios métodos para elegir. Seleccionar un método dependerá del motivo de la valoración y otros factores.
¿Qué significa el valor por p valor?
La hipótesis alternativa es la que creerías si la hipótesis nula se concluye como falsa. La evidencia en el juicio son sus datos y las estadísticas que lo acompañan. Todas las pruebas de hipótesis finalmente usan un valor p para sopesar la fuerza de la evidencia (lo que los datos le están diciendo sobre la población). El valor p es un número entre 0 y 1 e interpretado de la siguiente manera:
Un pequeño valor p (típicamente ≤ 0.05) indica una fuerte evidencia contra la hipótesis nula, por lo que rechaza la hipótesis nula.
Un gran valor p (> 0.05) indica evidencia débil contra la hipótesis nula, por lo que no puede rechazar la hipótesis nula.
Los valores P muy cerca del corte (0.05) se consideran marginales (podrían ir en cualquier dirección). Siempre informe el valor p para que sus lectores puedan sacar sus propias conclusiones.
Prueba aleatoriamente algunos tiempos de entrega y ejecuta los datos a través de la prueba de hipótesis, y su valor p resulta ser 0.001, que es mucho menor que 0.05. En términos reales, existe la probabilidad de 0.05 de que rechazará por error la afirmación del Pizza Place de que su tiempo de entrega es menor o igual a 30 minutos.
¿Cómo calcular el valor?
El proceso exacto que utiliza para calcular el valor agregado dependerá de la fórmula que use y con qué información está trabajando. Sin embargo, el proceso general para calcular el valor agregado es el mismo para todas las fórmulas.
Considere la información que desea saber, identifique qué fórmula proporcionará esa información y recopilará datos para las variables. Por ejemplo, si desea calcular el MVA para su empresa, deberá reunir la cantidad total de capital invertido y el valor de mercado, incluidos el capital y la deuda para su empresa.
Usando la fórmula que eligió, reemplace la información en la fórmula con la información que tiene. Por ejemplo, si la fórmula es MVA = V – K, reemplace la V con su valor de mercado, incluyendo capital y deuda y reemplace la K con su monto total de capital invertido. Su fórmula puede verse algo así: MVA = $ 12 millones – $ 8 millones.
Ahora que tiene sus propios valores ingresados en la fórmula, realice los procedimientos matemáticos indicados en la fórmula. Con MVA = $ 12 millones – $ 8 millones, restará $ 12 millones menos $ 8 millones por una diferencia de $ 4 millones. Esto significa que su MVA, o valor agregado de mercado, es de $ 4 millones.
Si desea calcular el valor económico agregado de su empresa, puede seguir estos pasos:
Mire la fórmula EVA y recopile la información de su empresa para NOPAT, CE y WACC. Es posible que deba hacer algunos de sus propios cálculos para obtener un valor total para cada uno de estos elementos. Para este ejemplo, el NOPAT de su empresa es de $ 70,000, el CE de su empresa es de $ 30,000 y el WACC de su empresa es de 8.53%.
¿Qué es una prueba de p?
El enfoque de valor p implica determinar «probable» o «improbable» determinando la probabilidad, suponiendo que la hipótesis nula fuera cierta, de observar una estadística de prueba más extrema en la dirección de la hipótesis alternativa que la observada. Si el valor p es pequeño, digamos menos de (o igual a) ( alpha ), entonces es «poco probable». Y, si el valor p es grande, digamos más que ( alpha ), entonces es «probable».
Si el valor p es menor que (o igual a) ( alpha ), entonces la hipótesis nula se rechaza a favor de la hipótesis alternativa. Y, si el valor p es mayor que ( alpha ), entonces la hipótesis nula no es rechazada.
Específicamente, los cuatro pasos involucrados en el uso del enfoque de valor p para realizar cualquier prueba de hipótesis son:
- Especifique las hipótesis nulas y alternativas.
- Usando los datos de la muestra y suponiendo que la hipótesis nula sea cierto, calcule el valor de la estadística de prueba. Nuevamente, para realizar la prueba de hipótesis para la media de la población μ, usamos la estadística t (t^*= frac { bar {x}- mu} {s/ sqrt {n}} ) que sigue Una distribución t con n – 1 grados de libertad.
- Usando la distribución conocida de la estadística de prueba, calcule el valor p: «Si la hipótesis nula es verdadera, ¿cuál es la probabilidad de que observemos una estadística de prueba más extrema en la dirección de la hipótesis alternativa que nosotros?» (Tenga en cuenta cómo esta pregunta es equivalente a la pregunta respondida en juicios penales: «Si el acusado es inocente, ¿cuál es la posibilidad de que observemos evidencia penal tan extrema?»)
- Establezca el nivel de significancia, ( alpha ), la probabilidad de hacer que un error tipo I sea pequeño: 0.01, 0.05 o 0.10. Compare el valor p con ( alpha ). Si el valor p es menor que (o igual a) ( alpha ), rechace la hipótesis nula a favor de la hipótesis alternativa. Si el valor p es mayor que ( alpha ), no rechace la hipótesis nula.
En nuestro ejemplo sobre el promedio de calificación media, supongamos que nuestra muestra aleatoria de n = 15 estudiantes que se especializan en matemáticas produce una estadística de prueba t* que iguala 2.5. Desde n = 15, nuestra estadística de prueba T* tiene n – 1 = 14 grados de libertad. Además, supongamos que establecemos nuestro nivel de significancia α en 0.05, de modo que solo tenemos un 5% de posibilidades de cometer un error tipo I.
¿Qué es el valor p en Epidemiologia?
El valor p no es la probabilidad de que la hipótesis nula sea verdadera, y esto se debe a que las hipótesis no tienen probabilidades en las estadísticas clásicas. Además, el valor p no es la probabilidad de rechazar falsamente la hipótesis nula. Rechazar falsamente la hipótesis mull es un error de tipo I. Este error es una versión de la llamada «falacia del fiscal». La tasa de error tipo I está estrechamente relacionada con el valor p ya que rechazamos la hipótesis nula cuando el valor p es menor que un nivel predefinido, α. El valor p no indica el tamaño o la importancia del efecto observado. Por lo tanto, un valor p muy pequeño, digamos 0.000… (generalmente presentado como <0.001) no significa necesariamente una asociación fuerte (en comparación con el tamaño del efecto, que es una medida de la resistencia de la relación entre 2 variables, por ejemplo, odds ratio, Riesgo relativo, coeficiente de correlación, Cohen's D, etc. [5, 6]). Además, el valor p está influenciado por el tamaño de la muestra. Por ejemplo, la Fig. (11) ilustra la impresionante disminución en el valor p de acuerdo con el tamaño de la muestra, manteniendo constantes los hallazgos observados. Se puede ver que si el tamaño de la muestra inicial se duplica (es decir, n = 200 por brazo de tratamiento) los resultados del estudio alcanzan importancia.
Ejemplo teórico de valores p en relación con el tamaño de la muestra para la misma diferencia en los datos.
Otro problema importante que influye en la toma de decisiones médicas es el problema de comparaciones múltiples que ocurre cuando una familia de inferencias estadísticas se considera simultáneamente. Por ejemplo, con solo una prueba de hipótesis realizada a un nivel de significancia del 5%, solo hay una probabilidad del 5% de obtener un resultado al menos tan extremo como el que se observó cuando la hipótesis nula es cierta. Sin embargo, con 100 pruebas realizadas con todas las hipótesis nulas como ciertas, es más probable que al menos una hipótesis nula sea rechazada. Estos errores se denominan falsos positivos, y se han desarrollado muchas técnicas matemáticas para controlarlos. La mayoría de estas técnicas modifican el nivel de significación α, para tener en cuenta la inflación de la tasa de error tipo I y hacer que la comparación del valor p sea más precisa.
¿Qué es valor de p en Epidemiologia?
P es por probabilidad. Si uno considera que la probabilidad implica incertidumbre, saber que P es un valor de probabilidad es el primer paso para evitar errores comunes en la interpretación estadística. Un valor de probabilidad cuantifica, pone un número a la incertidumbre, pero no puede eliminar la incertidumbre. Aunque los valores de P se pueden calcular en muchos lugares decimales, son solo estimaciones de un valor de probabilidad verdadero desconocido e incognable. Conclusiones basadas en evaluaciones de probabilidad estimadas deben ser necesariamente tentativas y siempre se pueden equivocar.
Comencemos con algunas respuestas populares pero inválidas. Una respuesta común es que p <0.05 es "estadísticamente significativo", pero esto se convierte en una tautología cuando la significación estadística se define como p <0.05. Con mucho, la respuesta más común que he encontrado de los médicos es que un valor P es "la probabilidad de que los resultados del estudio se deban al azar". Una interpretación común de esta definición incorrecta es que si la probabilidad de que los resultados se deben al azar sean suficientemente bajos, entonces se puede concluir con la confianza de que los resultados son "reales" o "verdaderos".
Esto está mal en varios recuentos. Primero, lo contrario de «Chance» no es «verdadero».
Todo tipo de errores sistemáticos y sin obstáculos ocurren en la investigación.2 Hay tantos «sesgos» comunes (el sesgo es un error sistemático) en la investigación que muchos tienen sus propios nombres: selección, recuperación, observador, respuesta, determinación, medición y muchos más. Los valores de P estiman un tipo de posibilidad muy específico que se discutirá en detalle a continuación. Innumerables ocurrencias casuales ocurren rutinariamente durante un estudio de investigación que podría efectuar los resultados. Por ejemplo, tal vez, por casualidad, un sujeto de estudio que viene para una medición de BP se perdió el autobús el día de la visita al estudio. Molesto por llegar tarde, la PA registrada del paciente puede ser sustancialmente más alta de lo habitual. Quizás por casualidad, la enfermera de estudio regular estaba enferma y el sustituto registró por error una lectura más baja de lo que debería haber sido. Tales errores casuales ocurren todo el tiempo y uno espera que estén equilibrados entre los grupos que se comparan y se cancelan. Pero, siendo la oportunidad, es posible que no se equilibren y los valores P no tienen nada que decir sobre tales posibilidades.
Otra definición popular de P es que «es la probabilidad de que la hipótesis nula sea cierta» o que sea «la probabilidad de rechazar una hipótesis nula que sea verdadera». Aunque es correcto que los valores de P se deriven con respecto a una «hipótesis nula», estas respuestas más informadas también se quedan cortas. Para entender por qué, requiere una explicación más detallada de la hipótesis nula.
¿Qué indica el valor de p?
Entonces, el valor p inferior a 0.05 no es una fuente de certeza, pero ¿qué decir sobre un valor p mayor de 0.05? Regresamos aquí al discurso de depender. Hay algunos casos en los que un valor p más alto que el umbral de 0.05 no solo es positivo, sino que para simplificar el siguiente trabajo estadístico es deseable. Un ejemplo clásico es el valor p de la prueba de normalidad de Shapiro-Wilk.
La hipótesis de nada de la prueba de Shapiro-Wilk establece que la variable observada normalmente se distribuye, es decir, si esto es cierto, podemos aplicar todas las pruebas estadísticas más bellas, desde la prueba t de Student hasta la correlación de Pearson, sin mencionar el Uso de estas variables en los modelos de regresión. Pero si esta no es la hipótesis, ¿cómo nos gustaría el valor p? Obviamente, mayor a 0.05, es decir, un valor p que nos permite afirmar que no hay evidencia de que la variable se distribuya de manera no normal. Un valor p menos de 0.05 nos obligaría a rechazar la hipótesis nada y, por lo tanto, perder esa hermosa contribución que las variables distribuidas normalmente proporcionan a los investigadores, especialmente a las más inexpertas.
Antes de concluir, quiero señalar un detalle: al apoyar la hipótesis nada, no dije que la variable se distribuya normalmente, pero escribí que no tengo pruebas de que no se distribuya normalmente. En otras palabras, el valor p superior a 0.05 no proporciona un nuevo escenario, sino que solo le permite afirmar lo que no puedo apoyar porque no hay evidencia.
Artículos Relacionados:
