Metodología para la prueba de hipótesis estadística inferencial

La prueba de hipótesis es un análisis estadístico que utiliza datos de muestra para evaluar dos teorías mutuamente excluyentes sobre las propiedades de una población. Los estadísticos llaman a estas teorías la hipótesis nula y la hipótesis alternativa. Una prueba de hipótesis evalúa su estadística de muestra y los factores en una estimación del error de muestra para determinar qué hipótesis apoyan los datos.

Cuando puede rechazar la hipótesis nula, los resultados son estadísticamente significativos, y sus datos respaldan la teoría de que existe un efecto a nivel de población.

El efecto es la diferencia entre el valor de la población y el valor de hipótesis nula. El efecto también se conoce como efecto de población o la diferencia. Por ejemplo, la diferencia media entre el resultado de salud para un grupo de tratamiento y un grupo de control es el efecto.

Por lo general, no conoce el tamaño del efecto real. Sin embargo, puede usar una prueba de hipótesis para ayudarlo a determinar si existe un efecto y estimar su tamaño. Las pruebas de hipótesis convierten el efecto de su muestra en una estadística de prueba, que evalúa la significación estadística. Obtenga más información sobre las estadísticas de prueba.

Un efecto puede ser estadísticamente significativo, pero eso no necesariamente indica que es importante en un sentido práctico y importante. Para obtener más información, lea mi publicación sobre el significado estadístico frente a la práctica.

¿Qué es la prueba de hipótesis en estadística inferencial?

Antes de observar los datos, se deben establecer las hipótesis nulas y alternativas, se debe elegir un nivel de significancia (α) (a menudo igual a 0.05), y el estadístico de prueba que resumirá la información en la muestra también debe elegirse. Según las hipótesis, la estadística de prueba y la distribución de muestreo de la estadística de prueba, podemos encontrar la región crítica de la estadística de prueba, que es el conjunto de valores para la prueba estadística que muestran evidencia a favor de la hipótesis alternativa y contra la nula . Esta región se elige de tal manera que la probabilidad de que la estadística de prueba caiga en la región crítica cuando la hipótesis nula es correcta (error tipo I) es igual al nivel de significación previamente elegido (α).

Si el valor de la estadística de prueba cae dentro de la región crítica, entonces la hipótesis nula se rechaza en el nivel de significancia elegido.
Si el valor de la estadística de prueba se encuentra fuera de la región crítica, entonces no hay suficiente evidencia para rechazar la hipótesis nula en el nivel de significancia elegido.

El valor p, la probabilidad de un resultado de la prueba al menos tan extremo como el observado si la hipótesis nula era verdadera, también se puede calcular.

Ejemplo: prueba t de cambio en el colesterol de 1952 a 1962

D es la diferencia en el colesterol para cada individuo de 1952 a 1962

H0: No hay cambios, en promedio, en el nivel de colesterol de 1952 a 1962

H1: Hay un cambio promedio no cero en el nivel de colesterol desde 1952 hasta 1962

¿Qué es una prueba de hipótesis y tipos?

Las pruebas de hipótesis en estadísticas se refieren a analizar una suposición sobre un parámetro de población. Se utiliza para hacer una suposición educada sobre una suposición utilizando estadísticas. Con el uso de datos de muestra, las pruebas de hipótesis suponen cuán verdadera es la suposición para toda la población desde donde se toma la muestra.

Cualquier declaración hipotética que hacemos puede o no ser válida, y entonces es nuestra responsabilidad proporcionar evidencia de su posibilidad. Para abordar cualquier hipótesis, seguimos estos cuatro pasos simples que prueban su validez.

Primero, formulamos dos declaraciones hipotéticas de tal manera que solo una de ellas es verdadera. Al hacerlo, podemos verificar la validez de nuestra propia hipótesis.

El siguiente paso es formular el análisis estadístico a seguir en función de los puntos de datos.

Luego analizamos los datos dados utilizando nuestra metodología.

El paso final es analizar el resultado y juzgar si la hipótesis nula será rechazada o es verdadera.

Se observa que el tiempo de recuperación promedio para un paciente de cirugía de rodilla es de 8 semanas. Un médico cree que después de una cirugía de rodilla exitosa si el paciente va a fisioterapia dos veces por semana en lugar de tres veces por semana, el período de recuperación será más largo. Realizar hipótesis para esta declaración.

David es un joven de diez años que termina un estilo libre de 25 yardas mientras tanto de 16.43 segundos. El padre de David compró gafas para su hijo, creyendo que le ayudaría a reducir su tiempo. Luego registró un total de quince estilo libre de 25 yardas para David, y el tiempo promedio llegó a ser de 16 segundos. Realizar una hipótesis.

¿Qué es una hipótesis de estadística?

Hipótesis estadística: una declaración sobre la naturaleza de una población. A menudo se establece en términos de un parámetro de población.

Hipótesis nula: una hipótesis estadística que se debe probar.

Hipótesis alternativa: la alternativa a la hipótesis nula.

Estadística de prueba: una función de los datos de muestra. Dependiendo de su valor, la hipótesis nula será rechazada o no rechazada.

Región crítica: si el valor de la estadística de prueba cae en esta región, entonces se rechaza la hipótesis nula.

Nivel de significancia: un pequeño valor establecido antes de la prueba. Representa la máxima probabilidad de rechazar la hipótesis nula cuando es cierto.

Prueba z: una prueba de la hipótesis nula de que la media de una población normal que tiene una varianza conocida es igual a un valor específico.

Valor P: el nivel de significancia más pequeño en el que se rechaza la hipótesis nula.

Pruebas unilaterales: pruebas de hipótesis estadística en las que la hipótesis nula o alternativa es que un parámetro de población es menor o igual (o mayor o igual a) algún valor especificado.

Prueba t: una prueba de la hipótesis nula de que la media de una población normal que tiene una varianza desconocida es igual a un valor específico.

Una hipótesis estadística es una afirmación formal sobre un estado de naturaleza estructurado en el marco de un modelo estadístico. Por ejemplo, uno podría afirmar que el tiempo medio hasta el fracaso de la electromigración (acce]) de la población de chips descrita en la Sección 6.1.4 es de al menos 60 horas, tal vez para abordar la pregunta I de la Tabla II, donde 60 horas representa un requisito de confiabilidad .

¿Qué metodos utiliza la estadística inferencial?

Con estadísticas inferenciales, está tratando de llegar a conclusiones que se extienden más allá de los datos inmediatos. Por ejemplo, utilizamos estadísticas inferenciales para tratar de inferir de los datos de la muestra lo que la población podría pensar. O bien, utilizamos estadísticas inferenciales para hacer juicios sobre la probabilidad de que una diferencia observada entre los grupos sea confiable que podría haber sucedido por casualidad en este estudio. Por lo tanto, utilizamos estadísticas inferenciales para hacer inferencias de nuestros datos a condiciones más generales; Utilizamos estadísticas descriptivas simplemente para describir lo que está sucediendo en nuestros datos.

Aquí, me concentro en estadísticas inferenciales que son útiles en el diseño de investigación experimental y cuasi-experimental o en la evaluación de resultados del programa. Quizás una de las pruebas inferenciales más simples se use cuando desea comparar el rendimiento promedio de dos grupos en una sola medida para ver si hay una diferencia. Es posible que desee saber si los niños y niñas de octavo grado difieren en los puntajes de las pruebas de matemáticas o si un grupo de programas difiere en la medida de resultado de un grupo de control. Siempre que desee comparar el rendimiento promedio entre dos grupos, debe considerar la prueba t para obtener diferencias entre grupos.

La mayoría de las principales estadísticas inferenciales provienen de una familia general de modelos estadísticos conocidos como modelo lineal general. Esto incluye la prueba t, el análisis de varianza (ANOVA), el análisis de covarianza (ANCOVA), el análisis de regresión y muchos de los métodos multivariados como el análisis de factores, la escala multidimensional, el análisis de clúster, el análisis de funciones discriminantes, etc. Dada la importancia del modelo lineal general, es una buena idea que cualquier investigador social serio se familiarice con sus trabajos. La discusión del modelo lineal general aquí es muy elemental y solo considera el modelo de línea recta más simple. Sin embargo, lo familiarizará con la idea del modelo lineal y lo ayudará a prepararlo para los análisis más complejos que se describen a continuación.

Una de las claves para comprender cómo se comparan los grupos se incorpora en la noción de la variable «ficticia». ¡El nombre no sugiere que estamos usando variables que no son muy inteligentes o, lo que es peor, que el analista que las usa es un «ficticio»! Quizás estas variables se describirían mejor como variables de «proxy». Esencialmente, una variable ficticia es aquella que utiliza números discretos, generalmente 0 y 1, para representar diferentes grupos en su estudio. Las variables ficticias son una idea simple que permite que algunas cosas bastante complicadas sucedan. Por ejemplo, al incluir una variable ficticia simple en un modelo, puedo modelar dos líneas separadas (una para cada grupo de tratamiento) con una sola ecuación. Para ver cómo funciona esto, consulte la discusión sobre variables ficticias.

Uno de los análisis más importantes en las evaluaciones de resultados del programa implica comparar el programa y el grupo no programado en la variable de resultado o variables. Cómo hacemos esto depende del diseño de investigación que utilizamos. Los diseños de investigación se dividen en dos tipos principales de diseños: experimental y cuasi-experimental. Debido a que los análisis difieren para cada uno, se presentan por separado.

¿Cuáles son los elementos de la estadística inferencial?

2 Pruebas de hipótesis La prueba dehipótesis es una forma de inferencia estadística para llegar a conclusiones sobre problemas científicos. La prueba de hipótesis es el mecanismo que actualiza y prueba los principios científicos y refina estos principios. Esta a su vez es la base del avance de la investigación científica. La prueba de la validez de la muestra es crucial para la aplicación de estadísticas inferenciales, por lo tanto, debemos poder probar nuestras muestras.

4 Estado Hipótesis nula y alternativa El nulo es el valor establecido: 0: = μ o 0: − μ = 0 establece que el valor medio de la hipótesis nula es igual a la media real. Por lo tanto, si restas la media hipotética de la media, entonces el valor debería igual a cero. La hipótesis alternativa y la nula son mutuamente excluyentes. viene en tres variaciones, una no direccional y dos direccionales ≠ 0 Por lo tanto, el alternativo es cualquier valor que sea valor. pero el valor nulo. < 0 o > 0 Por lo tanto, se elige el alternativo para establecerse como mayor o menor que la hipótesis nula dependiendo del experimento.

5 Prueba de hipótesis Dirección de la elección Este gráfico representa una prueba no direccional. La prueba solo está interesada si la hipótesis alternativa no es igual a la hipótesis nula. En el caso de A que el escenario, la curva solo estaría sombreada en el lado de la hipótesis alternativa. Mayor de la media daría la cola derecha, menos que la izquierda.

6 Error en las pruebas de hipótesis en las pruebas de hipótesis Estamos utilizando una muestra para retener o rechazar una hipótesis nula. Debido a que es de una muestra, siempre habrá una probabilidad de error al rechazar o no rechazar la hipótesis nula. Type I Error I Tipo I ocurre cuando la hipótesis nula se rechaza cuando es realmente cierto. La probabilidad de que esto ocurra es alfa – Este nivel se selecciona antes de la hipótesis TestType II Error de error tipo II ocurre cuando la hipótesis nula no se rechaza, pero la hipótesis nula es realmente falsa. La probabilidad de este error es beta –

¿Qué es la metodologia para las pruebas de hipotesis para dos muestras?

Se utiliza dos pruebas de hipótesis de T de dos muestras también conocidas como prueba t independiente para analizar la diferencia entre dos medios de población desconocidos. La prueba t de dos muestras se usa cuando las dos muestras pequeñas (n <30) se toman de dos poblaciones diferentes y se comparan. El gráfico subyacente utiliza la distribución T.

La muestra debe seleccionarse al azar de las dos población.
Las muestras son independientes entre sí
Dos tamaños de muestra me deben menos de 30
Las muestras recolectadas de la población se distribuyen normalmente

La prueba t de dos muestras probablemente se usa para comparar dos medias de proceso, cuando los datos tienen una variable nominal y una variable de medición. Es una prueba de hipótesis de medios. Use dos pruebas de muestra Z si el tamaño de la muestra es más de 30.

Las dos pruebas t de hipótesis de muestra se usan para comparar dos medias de población, mientras que el análisis de varianza (ANOVA) es la mejor opción si se comparan más de dos medios grupales.

Se realizan dos pruebas de hipótesis de T de muestra cuando las dos muestras de grupo son estadísticamente independientes entre sí, mientras que la prueba t pareada se usa para comparar las medias de dos grupos dependientes o emparejados.

La muestra debe seleccionarse al azar de las dos población.
Las muestras son independientes entre sí
Dos tamaños de muestra me deben menos de 30
Las muestras recolectadas de la población se distribuyen normalmente

Dos pruebas de hipótesis T de muestra (igual varianza)

La varianza de dos poblaciones son iguales

Dos pruebas de hipótesis T de muestra (varianza desigual)

La varianza de dos poblaciones no es igual

El mejor método para determinar la varianza de la población es igual o desigual mediante el uso de una prueba F apropiada.

¿Qué es la metodología para las pruebas de hipótesis?

Las hipótesis son declaraciones sobre el problema dado. La prueba de hipótesis es un método estadístico utilizado para tomar una decisión estadística utilizando datos experimentales. La prueba de hipótesis es esencialmente una hipótesis que formulamos en relación con un parámetro de población. Evalúa dos declaraciones mutuamente excluyentes relacionadas con una población para determinar qué declaración es mejor respaldada por los datos de la muestra. Ejemplo: usted dice que un estudiante de clase media tiene 30 años o que un niño es más grande que las niñas. Todos estos son un ejemplo en el que asumimos o necesitamos un medio estadístico para probarlos. Necesitamos una conclusión matemática, todo lo que suponemos que es cierto.

La necesidad de una prueba de hipótesis, la prueba de suposición es un procedimiento estadístico importante. La prueba de hipótesis evalúa dos declaraciones de población mutuamente excluyentes para determinar qué declaración es la más apoyada por los datos de la muestra. Cuando decimos que los resultados son estadísticamente significativos, es gracias a los supuestos de hipótesis. Parámetros de prueba de hipótesis

Hipótesis nula (H0): en estadísticas, la hipótesis nula es una declaración general dada o una posición predeterminada según la cual no existe una relación entre dos casos medidos o ninguna relación entre los grupos. En otras palabras, esta es una hipótesis básica o realizada sobre la base del conocimiento del problema. Ejemplo: la producción de una empresa es = 50 unidades/por día, etc.
Hipótesis alternativa (H1): la hipótesis alternativa es la hipótesis utilizada en la prueba de hipótesis que es contraria a la hipótesis nula. Ejemplo: La producción de una empresa no es igual a 50 unidades/día, etc.
Nivel de significado Se refiere al grado de significado en el que aceptamos o rechazamos la hipótesis nula. El 100 % de precisión no es posible aceptar una hipótesis, por lo que seleccionamos un nivel de significado que generalmente es del 5 %. Esto normalmente se indica por y en general, es 0.05 o 5%, lo que significa que su salida debe ser un 95% segura para dar un tipo similar de resultado en cada muestra.
Valor P El valor P, o la probabilidad calculada, es la probabilidad de encontrar los resultados observados/extremos cuando la hipótesis nula (H0) de un problema de estudio dado es cierto. Si su valor P es más bajo que el nivel de significado elegido, rechaza la hipótesis nula, es decir que acepta que su muestra afirma apoyar la hipótesis alternativa.

Ejemplo: dada una moneda y no sabemos si es justa o delicada, entonces decida la hipótesis nula y alternativa

Hipótesis nula (H0): en estadísticas, la hipótesis nula es una declaración general dada o una posición predeterminada según la cual no existe una relación entre dos casos medidos o ninguna relación entre los grupos. En otras palabras, esta es una hipótesis básica o realizada sobre la base del conocimiento del problema. Ejemplo: la producción de una empresa es = 50 unidades/por día, etc.
Hipótesis alternativa (H1): la hipótesis alternativa es la hipótesis utilizada en la prueba de hipótesis que es contraria a la hipótesis nula. Ejemplo: La producción de una empresa no es igual a 50 unidades/día, etc.
Nivel de significado Se refiere al grado de significado en el que aceptamos o rechazamos la hipótesis nula. El 100 % de precisión no es posible aceptar una hipótesis, por lo que seleccionamos un nivel de significado que generalmente es del 5 %. Esto normalmente se indica por y en general, es 0.05 o 5%, lo que significa que su salida debe ser un 95% segura para dar un tipo similar de resultado en cada muestra.
Valor P El valor P, o la probabilidad calculada, es la probabilidad de encontrar los resultados observados/extremos cuando la hipótesis nula (H0) de un problema de estudio dado es cierto. Si su valor P es más bajo que el nivel de significado elegido, rechaza la hipótesis nula, es decir que acepta que su muestra afirma apoyar la hipótesis alternativa.

Hipótesis nula (H0): una parte es una habitación justa.

Hipótesis alternativa (H1): una pieza es una pieza delicada.

Ahora iniciemos la parte y calculemos el valor P (valor de probabilidad).

Hipótesis nula (H0): en estadísticas, la hipótesis nula es una declaración general dada o una posición predeterminada según la cual no existe una relación entre dos casos medidos o ninguna relación entre los grupos. En otras palabras, esta es una hipótesis básica o realizada sobre la base del conocimiento del problema. Ejemplo: la producción de una empresa es = 50 unidades/por día, etc.
Hipótesis alternativa (H1): la hipótesis alternativa es la hipótesis utilizada en la prueba de hipótesis que es contraria a la hipótesis nula. Ejemplo: La producción de una empresa no es igual a 50 unidades/día, etc.
Nivel de significado Se refiere al grado de significado en el que aceptamos o rechazamos la hipótesis nula. El 100 % de precisión no es posible aceptar una hipótesis, por lo que seleccionamos un nivel de significado que generalmente es del 5 %. Esto normalmente se indica por y en general, es 0.05 o 5%, lo que significa que su salida debe ser un 95% segura para dar un tipo similar de resultado en cada muestra.
Valor P El valor P, o la probabilidad calculada, es la probabilidad de encontrar los resultados observados/extremos cuando la hipótesis nula (H0) de un problema de estudio dado es cierto. Si su valor P es más bajo que el nivel de significado elegido, rechaza la hipótesis nula, es decir que acepta que su muestra afirma apoyar la hipótesis alternativa.

Hipótesis nula (H0): una parte es una habitación justa.

Hipótesis alternativa (H1): una pieza es una pieza delicada.

Lanzar una habitación por primera vez y suponga que el resultado está frente a P-Value = (porque la cara y la cara tienen una probabilidad igual))

Lanza una habitación por segunda vez y suponga que el resultado es opuesto, ahora P-Value =

Y del mismo modo, hemos lanzado 6 veces consecutivas y hemos obtenido el resultado como todos los cabezales, ahora P-Value = pero hemos definido nuestro nivel de significado como tasa de error que autorizamos y aquí vemos que estamos más allá de este nivel, es decir Para decir que nuestra hipótesis cero no se mantiene bien, debemos rechazar y proponer que esta pieza es una pieza delicada que es de hecho porque nos da 6 caras consecutivas.

¿Qué son las pruebas para dos muestras relacionadas?

Hola Elena, gracias por la pregunta. Para calcular el número de cada clase, simplemente debe contar el número de elementos encontrados en una clase de fecha: en la primera clase: [20, 25] encuentre valores 20 y 24, por lo tanto, el número (o frecuencia) de la primera clase es igual a 2 en la segunda clase: (25, 30] encuentre valores 27 y 28, por lo tanto, el número (o frecuencia) de la primera clase es igual a 2 en la primera clase: (30, 35] encontrar valores 31 y 31, por lo tanto, la numerosidad (o frecuencia) de la primera clase sigue siendo igual a 2. En la primera clase: (35, 40] encuentre los valores 36 y 38, por lo tanto, el número (o frecuencia) del La primera clase es igual a 2 en la primera clase: (40, 45] Encuentre el valor 41, por lo tanto, el primer (o frecuencia) de la primera clase es igual a 1 en la última clase (45, 50] Encuentre el valor 46, Por lo tanto, el número (o frecuencia) de la primera clase es igual a 1

Para calcular la altura (absoluta) a cada clase, es suficiente que divide el número de la clase para su número. Todas las clases tienen un ancho de 5. Dado que las primeras 4 clases tienen el mismo número, la altura en términos absolutos de estos es igual a 2/5. En las últimas dos clases solo hay un elemento, por lo tanto, la altura es igual a 1/5. Espero haber resuelto tu problema

Hola Andrea, el objetivo de mi investigación es analizar a través de una comparación de los índices económicos financieros si ha habido eficiencia en el uso de tecnologías particulares entre el año X (año en el que no se han implementado estas tecnologías) y el año X+1 ( Año de implementación de oficiales de tecnologías), por lo tanto, mis datos se componen sustancialmente de las relaciones entre dos grandes económicas financieras.

¿Qué es la metodologia inferencial?

Las estadísticas inferenciales permiten hacer descripciones de datos y sacar inferencias y conclusiones de los datos respectivos. A través de estadísticas inferenciales, un individuo puede concluir lo que una población puede pensar o cómo se ha visto afectado al tomar datos de muestra.

Las estadísticas inferenciales se utilizan principalmente para obtener estimaciones sobre un grupo grande (o población) y sacar conclusiones sobre los datos basados en métodos de prueba de hipótesis.

La estadística inferencial utiliza datos de muestra porque es más rentable y menos tedioso que la recopilación de datos de toda una población. Permite que uno llegue a suposiciones razonables sobre la población más grande en función de las características de una muestra. Los métodos de muestreo deben ser imparciales y aleatorios para las conclusiones e inferencias estadísticas que se validan.

Las estadísticas inferenciales permiten hacer descripciones de datos y sacar inferencias y conclusiones de los datos respectivos.
La estadística inferencial utiliza datos de muestra porque es más rentable y menos tedioso que la recopilación de datos de toda una población.
Permite que uno llegue a suposiciones razonables sobre la población más grande en función de las características de una muestra.

Una estadística es una métrica utilizada para proporcionar una visión general de una muestra, y una parámetro es una métrica utilizada para proporcionar una visión general de una población. Los dos tipos de estimación principales son la estimación del intervalo y la estimación puntual. La estimación del intervalo (por ejemplo, el intervalo de confianza) proporciona uno con un rango de valores en el que es probable que se encuentre un parámetro. Una estimación puntual es una estimación de un parámetro (por ejemplo, media de muestra).

¿Qué es la metodología inferencial?

Procedimiento por el cual de las características observadas de una muestra intentamos rastrear las de la población de referencia. Un primer aspecto importante de los procedimientos inferenciales se refiere a los métodos de extracción de la muestra (➔ Muestra estadística).

Esta elección depende de las características del interés de la población. Estos pueden ser sintetizados por un solo parámetro (por ejemplo, promedio), por un portador de parámetros (por ejemplo, medios y varianza) o de una función completa (por ejemplo, la función de densidad que describe la distribución de la población). Una vez que se ha definido la naturaleza del parámetro de interés, la elección del procedimiento cambia de acuerdo con el tipo de problema inferencial y el tipo de enfoque que pretende usar.

Se pueden identificar dos tipos de problemas inferenciales: la estimación del objeto de parámetro de interés (escalada, portador o función) y la verificación de hipótesis sobre el parámetro en sí. El primer problema consiste en el uso de datos para producir un único valor plausible (estimación puntual) o un conjunto de valores plausibles (estimación para intervalos) para el parámetro. La función de los datos elegidos para hacer la estimación puntual se llama estimador (➔). La estimación de los intervalos consiste en la elección del intervalo con un ancho mínimo entre todos los que contienen el parámetro real a una probabilidad preestablecida (generalmente entre 90% y 99%). Se dice que el intervalo obtenido es un intervalo de confianza (➔ confianza, intervalo de). Este problema es equivalente a la de la construcción de la región de rechazo de una prueba estadística. La verificación de las hipótesis consiste en decidir, sobre la base de evidencia empírica y con un grado razonable de seguridad (llamado nivel de significancia), ya sea o no rechazar una o más hipótesis en el parámetro. Para la verificación de hipótesis, generalmente se usa una función de datos, llamada prueba de estadísticas, y un área, llamada región de rechazo, que determina todos los valores que implican la negativa de la hipótesis nada.

Para cada familia de problemas analizados previamente, se pueden identificar dos enfoques diferentes: el enfoque clásico o frecuentista, y el bayesiano (➔ ➔ bayesianos, métodos). En el enfoque frecuentista, el proceso de aprendizaje que se deriva de los datos de la muestra se basa en la ingesta teórica de poder repetir el experimento infinito dirigido a las mismas condiciones. En el enfoque bayesiano, el proceso de aprendizaje se deriva de una ‘actualización’ de la información inicial a través de evidencia empírica. Como consecuencia, en el enfoque frecuentista, las propiedades de la muestra (muestras asintóticas o finitas) de un procedimiento estadístico tienen una importancia particular. Estas propiedades reflejan la incertidumbre debido al muestreo: la muestra es solo uno de los posibles resultados que se pueden obtener a través del proceso de extracción de la población. No existe incertidumbre sobre el parámetro que, incluso si es incógnito, no tiene las características de un fenómeno aleatorio. En el enfoque bayesiano, por otro lado, la incertidumbre también está en el parámetro, para el cual se hipotetiza una distribución de probabilidad, llamada a priori, que refleja la información inicial de la persona que lidera la investigación. La actualización de esta información inicial tiene lugar a través del cálculo de la distribución A posteriori, es decir, la distribución de la probabilidad del parámetro condicionado a los datos. Esta distribución se obtiene utilizando la fórmula Bayes, de la cual el enfoque toma su nombre (➔ Bayes, Thomas). El resultado de la I. Bayesiana es la distribución completa de la probabilidad en retrospectiva. A partir de esto, se pueden obtener estimaciones o pruebas estadísticas a través de transformaciones apropiadas. Para ilustrar mejor los diferentes procedimientos, imagine que el parámetro de interés es la edad promedio de una población y eso está organizado para una muestra aleatoria simple de n = 100 unidades.

En cuanto al enfoque frecuentista, un estimador plausible para el promedio μ es la barra aritmética o de muestra media. En condiciones generales, la barra es una estimación no distorsionada, consistente (➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ ➔ El enfoque bayesiano estándar requiere la definición de una distribución de probabilidad a priori para el parámetro desconocido μ y un modelo estadístico para datos, a través del cual se obtendrá la distribución A posteriori. Si toma un modelo gaussiano tanto para los datos como para el parámetro μ, es decir, si μ ∼ N (μ0, σ20) y x∣ μ ∼n (μ, 1), donde los parámetros de la distribución a priori μ0 y σ02 se suponen Conocido, se obtiene una distribución trasera gaussiana para μ, es decir, μ∣x∼N (μ0, σ21), donde μ1 = (σ – 20 μ0+100)/(σ – 20+100) y σ21 = 1/(σ – 20 +100). Una posible estimación bayesiana puntual es, p. el promedio A Posteriori μ1; Sin embargo, lo que importa en el método bayesiano es la distribución a posteriori, no la forma en que decide resumirlo en un solo valor.

¿Qué tipo de métodos utiliza la inferencia estadística?

Entonces, ¿qué es la inferencia estadística? La inferencia estadística es el proceso de sacar conclusiones sobre las propiedades de la población desconocida, utilizando una muestra extraída de la población. . Las propiedades de población desconocidas pueden ser, por ejemplo, media, proporción o varianza. Estos también se llaman parámetros

La inferencia estadística se divide ampliamente en 2 partes: prueba de estimación e hipótesis. La estimación se divide aún más en la estimación puntual y la estimación del intervalo.

En la estimación de puntos, estimamos un parámetro desconocido utilizando un número único que se calcula a partir de los datos de la muestra. Por ejemplo, el salario promedio de los científicos de datos junior basado en una muestra es de 55,000 euros

En la estimación de intervalo, encontramos un rango de valores dentro de los cuales creemos que el verdadero parámetro de población se encuentra con alta probabilidad. Aquí, el salario promedio de los científicos de datos junior es de entre 52,0000 y 58,000, con un nivel de confianza del 95%.

En las pruebas de hipótesis, debemos decidir si una declaración con respecto a un parámetro de población es verdadera o falsa, basada en datos de muestra. Por ejemplo, una afirmación de que el salario promedio de los científicos de datos junior es mayor que 50,0000 euros anualmente se puede probar utilizando datos de muestra.

Veamos ahora la diferencia entre parámetros, estimadores y estimaciones. Un parámetro es una cantidad desconocida como la media de la población. Se estima utilizando una función de valores de muestra, como la media de la muestra. Entonces, una media de muestra es un estimador. El valor de la media de muestra usando valores de muestra se denomina estimación.