Una prueba de hipótesis estadística es un método de inferencia estadística utilizada para decidir si los datos disponibles respaldan suficientemente una hipótesis particular.
Las pruebas de hipótesis nos permiten hacer declaraciones probabilísticas sobre los parámetros de la población.
Fisher fue un estadístico agrícola que enfatizó un diseño experimental riguroso y métodos para extraer el resultado de pocas muestras que suponen distribuciones gaussianas. Neyman (que se asoció con el joven Pearson) enfatizó el rigor matemático y los métodos para obtener más resultados de muchas muestras y una gama más amplia de distribuciones. Las pruebas de hipótesis modernas son un híbrido inconsistente de la formulación, métodos y terminología de Fisher vs Neyman/Pearson desarrolladas a principios del siglo XX.
Fisher popularizó la «prueba de significado». Requirió una hipótesis nula (correspondiente a una distribución de frecuencia de población) y una muestra. Sus cálculos (ahora familiares) determinaron si rechazar la hipótesis nula o no. Las pruebas de significación no utilizaron una hipótesis alternativa, por lo que no había concepto de un error de tipo II.
El valor p se diseñó como un índice informal, pero objetivo, destinado a ayudar a un investigador a determinar (basado en otros conocimientos) si modificar experimentos futuros o fortalecer la fe en la hipótesis nula. [3] Las pruebas de hipótesis (y los errores de tipo I/II) fueron diseñadas por Neyman y Pearson como una alternativa más objetiva al valor p de Fisher, también destinado a determinar el comportamiento del investigador, pero sin requerir ninguna inferencia inductiva por parte del investigador. [4] [5]
¿Qué es y para qué sirve una prueba de hipótesis?
La prueba de hipótesis en estadísticas es una herramienta que se utiliza para hacer inferencias sobre los datos de la población. También se usa para verificar si los resultados de un experimento son válidos.
La prueba Z en las pruebas de hipótesis se utiliza para encontrar el estadístico de prueba Z para datos distribuidos normalmente. La prueba Z se usa cuando se conoce la desviación estándar de la población y el tamaño de la muestra es mayor o igual a 30.
La prueba t en las pruebas de hipótesis se usa cuando los datos siguen a una distribución t de Student. Se usa cuando el tamaño de la muestra es inferior a 30 y se desconoce la desviación estándar de la población.
La fórmula para una prueba de una muestra Z en la prueba de hipótesis es z = ( frac { overline {x}- mu} { frac { sigma} { sqrt {n}}} ) y para dos muestras es z = ( frac {( overline {x_ {1}}- overline {x_ {2}})-( mu_ {1}- mu_ {2})} { sqrt { frac { sigma_ {1}^{2}} {n_ {1}}+ frac { sigma_ {2}^{2}} {n_ {2}}}} ).
El valor de P ayuda a determinar si los resultados de la prueba son estadísticamente significativos o no. En las pruebas de hipótesis, la hipótesis nula puede ser rechazada o no rechazada en función de la comparación entre el valor P y el nivel alfa.
Cuando la región de rechazo está solo en un lado de la curva de distribución, entonces se conoce como prueba de hipótesis de cola. La prueba de cola derecha y la prueba de cola izquierda son dos tipos de pruebas de hipótesis direccionales.
Para obtener el nivel alfa en una división de prueba de hipótesis de dos colas ( alpha ) por 2. Esto se hace, ya que hay dos regiones de rechazo en la curva.
¿Cómo se usa la prueba de hipótesis?
Las estadísticas tienen que ver con los datos, pero los datos por sí solos no son interesantes. Es la interpretación de los datos que nos interesan…
El campo de la ciencia de datos está evolucionando como nunca antes. Muchas compañías ahora buscan profesionales que puedan examinar sus datos de mina de oro y ayudarlos a impulsar decisiones comerciales rápidas de manera eficiente. También le da la ventaja a muchos profesionales que trabajan para cambiar sus carreras al campo de la ciencia de datos.
Tener esta IA, la ciencia de datos en torno a muchos estudiantes universitarios también quiere seguir sus carreras en el campo de la ciencia de datos. Y Thomas H. Davenport y D.J. proclaman correctamente esta exageración sobre la ciencia de los datos. Patil en uno de los artículos de Harvard Business Review que, que,
«Científico de datos: el trabajo más sexy del siglo XXI»
En los modelos de aprendizaje automático de construcción mundial de análisis de hoy en día se ha vuelto relativamente fácil (gracias a herramientas y algoritmos más robustos y flexibles), pero aún así los conceptos fundamentales son muy confusos. Uno de esos conceptos es la prueba de hipótesis.
En esta publicación, estoy intentando aclarar los conceptos básicos de las pruebas de hipótesis con ilustraciones.
¿Qué son las pruebas de hipótesis? ¿Qué queremos lograr? ¿Por qué necesitamos realizar pruebas de hipótesis? Debemos saber las respuestas a todas estas preguntas antes de continuar.
Las estadísticas tienen que ver con los datos. Los datos por sí solos no son interesantes. Es la interpretación de los datos que nos interesan. Usando pruebas de hipótesis, intentamos interpretar o sacar conclusiones sobre la población utilizando datos de muestra. Una prueba de hipótesis evalúa dos declaraciones mutuamente excluyentes sobre una población para determinar qué declaración es mejor respaldada por los datos de la muestra. Cada vez que queremos hacer afirmaciones sobre la distribución de datos o si un conjunto de resultados es diferente de otro conjunto de resultados en el aprendizaje automático aplicado, debemos confiar en las pruebas de hipótesis estadística.
¿Cuándo se cumple la hipótesis estadística?
Un investigador cree que el ingreso familiar promedio en una ciudad con 10,000 hogares es de $ 50,000. Se toma una muestra aleatoria simple de 100 hogares y la media de la muestra del ingreso familiar es de $ 47,900 con una desviación estándar de $ 1,202. Verifique que se cumplan las condiciones para realizar una prueba de hipótesis para una media.
La muestra de 100 hogares era una muestra aleatoria simple, por lo que se verifica esta condición.
Paso 2: Verifique que la población se distribuya normalmente o el tamaño de la muestra es al menos 30.
No sabemos si los ingresos del hogar en la ciudad normalmente se distribuyen, pero el tamaño de nuestra muestra es 100, que es mayor que 30. Esta condición se verifica.
Paso 3: Si se verifican los pasos 1 y 2, concluyen que se cumplen las condiciones para realizar una prueba de hipótesis para una media.
Dado que nuestra muestra fue aleatoria y el tamaño de la muestra es mayor que 30, podemos concluir que se cumplen las condiciones para realizar una prueba de hipótesis para una media.
Un investigador cree que el peso medio de los gatos en una ciudad con 10,000 gatos es de 10 libras. Se toma una muestra aleatoria simple de 10 gatos y la muestra tiene un peso medio de 9.5 libras con una desviación estándar de 0.75 libras. ¿Son las condiciones para realizar una prueba de hipótesis para una media MET?
La muestra de 10 gatos se seleccionó al azar, por lo que se verifica esta condición.
No sabemos si los pesos de todos los gatos en la ciudad normalmente se distribuyen, por lo que necesitaríamos un tamaño de muestra de al menos 30 gatos. Nuestra muestra contiene solo 10 gatos, por lo que no se cumple esta condición.
¿Qué aplicaciones tienen las pruebas de significación?
¿Cómo implementar e interpretar las pruebas de significación estadística comúnmente utilizadas en R? Comprenda el propósito, cuándo usar y cómo interpretar los resultados de la prueba y el valor P.
- Prueba de correlación e introducción al valor P
- Una muestra de T-test
- Prueba de rango firmada de Wilcoxon
- Dos pruebas de prueba t de muestra y prueba de rango de Wilcoxon
- Prueba de Shapiro
- Prueba de Kolmogorov y Smirnov
- Prueba F de Fisher
- Prueba de chi cuadrado
- Pruebas más utilizadas
Es posible que haya encontrado reclamos estadísticos arbitrarios en periódicos y revistas. ¿Alguna vez te has preguntado si son realmente ciertos? Incluso si se le proporciona los datos detrás de las afirmaciones, ¿cómo concluye si tales afirmaciones son reales (o no)?
Nota: Use el argumento de nivel conf. Para ajustar el nivel de confianza.
CLIME DE EJEMPLO: Ventas medias de unidades por día en «Sparesmart»: un minorista local de repuestos es de 24 unidades por día.
La prueba de rango firmada de Wilcoxon se usa para probar si la media de una muestra puede ser razonablemente un valor específico cuando no se supone una distribución de probabilidad.
Puede ser una alternativa a la prueba t, especialmente cuando no se supone que la muestra de datos siga una distribución normal. Es un método no paramétrico utilizado para probar si una estimación es diferente de su verdadero valor.
Si el valor p <0.05 (nivel de significancia), rechazamos la hipótesis nula de que se extraen de la misma distribución. En otras palabras, p <0.05 implica x e y de diferentes distribuciones
¿Cuáles son las aplicaciones de las pruebas de hipótesis?
Todos los días prueba ideas, recetas, nuevas rutas para que pueda llegar a su destino más rápido o con menos tráfico…
La pregunta importante, sin embargo, ¿fue esa idea/receta/ruta significativamente mejor que la anterior?
Es viernes por la noche y quieres ver una película. Hay tres películas que te llamaron la atención, pero no estás realmente seguro de si son buenas o no.
En este día y edad modernos, eres ese tipo de persona que todavía depende de familiares y amigos para recomendaciones. Entonces, les pide que califiquen esas películas y se preparen para lograr los datos.
Aunque parece que tus amigos son algo escépticos sobre la película Emoji, debes examinar cada distribución de calificación para comprender más sobre la tendencia central de los votos de tus amigos.
¡Esto es genial! Pero en realidad no te dice mucho más de lo que ya sabías: la película emoji podría no ser tan atractiva, y hay una clara competencia entre el interestelar y Star Wars…
Para eliminar cualquier pregunta sobre qué película calificaron mejor sus amigos, decide ejecutar algunas pruebas estadísticas y comparar las tres distribuciones de calificación.
Las pruebas de hipótesis, o las pruebas de hipótesis estadística, son una técnica utilizada para comparar dos conjuntos de datos, o una muestra de un conjunto de datos. Es un método estadístico de influencia, por lo que, al final de la prueba, sacarás una conclusión, inferirás algo, sobre las características de lo que estás comparando.
¿Cuándo se dice que una prueba es significación?
La expresión «prueba matemática» es utilizada por laicos para referirse al uso de métodos matemáticos o discutir con objetos matemáticos, como los números, para demostrar algo sobre la vida cotidiana, o cuando los datos utilizados en un argumento son numéricos. A veces también se usa para significar una «prueba estadística» (a continuación), especialmente cuando se usa para argumentar de los datos.
Los filósofos-matemáticos como Spinoza han intentado formular argumentos filosóficos de manera axiomática, mediante el cual los estándares de prueba matemática podrían aplicarse a la argumentación en la filosofía general. Otros matemáticos-filósofos han tratado de usar estándares de prueba matemática y razón, sin empirismo, para llegar a declaraciones fuera de las matemáticas, pero tener la certeza de las proposiciones deducidas en una prueba matemática, como el argumento de Descartes Cogito.
A veces, la abreviatura «Q.E.D.» está escrito para indicar el final de una prueba. Esta abreviatura significa «Quod Erat Demostum», que es latín para «lo que debía ser demostrado». Una alternativa más común es usar un cuadrado o un rectángulo, como □ o ∎, conocido como una «lápida» o «Halmos» después de su homónimo de Halmos. A menudo, «que debía mostrarse» se afirma verbalmente cuando se escribe «Qed», «□» o «∎» durante una presentación oral.
- ^Clapham, C. y Nicholson, J.N. El Concise Oxford Dictionary of Mathematics, cuarta edición. Una declaración cuya verdad debe ser tomada como evidente o asumida. Ciertas áreas de las matemáticas implican elegir un conjunto de axiomas y descubrir qué resultados pueden derivarse de ellas, proporcionando pruebas para los teoremas que se obtienen.
- ^Buss, Samuel R. (1998), «Una introducción a la teoría de la prueba», en Buss, Samuel R. (ed.), Manual de teoría de la prueba, Estudios en Lógica y Fundamentos de Matemáticas, vol. 137, Elsevier, pp. 1–78, ISBN978-0-08-053318-6. Ver en particular p. 3: «El estudio de la teoría de la prueba está tradicionalmente motivado por el problema de formalizar las pruebas matemáticas; la formulación original de la lógica de primer orden por Frege [1879] fue el primer paso exitoso en esta dirección».
- ^»Una nota sobre la historia de los fractales». Archivado del original el 15 de febrero de 2009. Mandelbrot, que trabaja en el Laboratorio de Investigación de IBM, hizo algunas simulaciones por computadora para estos conjuntos sobre el supuesto razonable de que, si quisiera probar algo, podría ser útil saber la respuesta con anticipación .
- ^Lesmoir-Gordon, Nigel (2000). Introducción de geometría fractal. Libros de iconos. ISBN978-1-84046-123-7…. trajo a casa nuevamente a Benoit [Mandelbrot] que había una ‘matemática del ojo’, que la visualización de un problema era un método tan válido como cualquier otro para encontrar una solución. Sorprendentemente, se encontró solo con esta conjetura. La enseñanza de las matemáticas en Francia estuvo dominada por un puñado de matemáticos dogmáticos escondidos detrás del seudónimo ‘Bourbaki’…
Artículos Relacionados:
