Una prueba no paramétrica (a veces llamada prueba libre de distribución) no asume nada sobre la distribución subyacente (por ejemplo, que los datos provienen de una distribución normal). Eso se compara con la prueba paramétrica, que hace suposiciones sobre los parámetros de una población (por ejemplo, la media o la desviación estándar); Cuando la palabra «no paramétrica» se usa en las estadísticas, no significa que no sepa nada sobre la población. Por lo general, significa que sabe que los datos de la población no tienen una distribución normal.
Mire el video para ver las diferencias entre las pruebas paramétricas y no paramétricas, y cuando desee usar pruebas no paramétricas:
Si es posible, debe las pruebas paramétricas de EE. UU., Ya que tienden a ser más precisas. Las pruebas paramétricas tienen un mayor poder estadístico, lo que significa que es probable que encuentren un verdadero efecto significativo. Use pruebas no paramétricas solo si es necesario (es decir, sabe que se violan suposiciones como la normalidad). Las pruebas no paramétricas pueden funcionar bien con datos no normales si tiene un tamaño de muestra suficientemente grande (generalmente 15-20 elementos en cada grupo).
Las pruebas no paramétricas se utilizan cuando sus datos no son normales. Por lo tanto, la clave es averiguar si tiene datos distribuidos normalmente. Por ejemplo, puede ver la distribución de sus datos. Si sus datos son aproximadamente normales, puede usar pruebas estadísticas paramétricas. P. Si no tiene un gráfico, ¿cómo se entera si sus datos se distribuyen normalmente? A. Verifique la asimetría y la curtosis de la distribución utilizando software como Excel (ver: Sesgo en Excel 2013 y curtosis en Excel 2013).
Una distribución normal no tiene sesgo. Básicamente, es una forma centrada y simétrica. La curtosis se refiere a cuánto de los datos están en las colas y el centro. La asimetría y la curtosis para una distribución normal es de aproximadamente 1. curtosis negativa (izquierda) y curtosis positiva (derecha)
Si su distribución no es normal (en otras palabras, la asimetría y la curtosis desvían mucho de 1.0), debe usar una prueba no paramétrica como la prueba de chi-cuadrado. De lo contrario, corre el riesgo de que sus resultados no tengan sentido.
¿Sus datos permiten una prueba paramétrica o tiene que usar una prueba no paramétrica como Chi-square? La regla general es:
- Desea probar la mediana en lugar de la media (es posible que desee hacer esto si tiene una distribución muy sesgada).
¿Qué es un análisis Parametrico y no Parametrico?
Las pruebas estadísticas paramétricas se basan en suposiciones sobre la forma de la distribución y los parámetros (es decir, la media y la desviación estándar), y la mayoría se basan en una suposición de una distribución aproximadamente normal. Las pruebas estadísticas no paramétricas se basan en ningún o pocos supuestos sobre la forma o los parámetros de la distribución de la población a partir de la cual se dibujó la muestra. Si los datos son realmente normales, una prueba no paramétrica generalmente tendrá menos potencia para el mismo tamaño de muestra en comparación con la prueba paramétrica correspondiente.
Las pruebas estadísticas paramétricas son más poderosas que las pruebas no paramétricas.
La mayoría de las pruebas paramétricas requieren que los datos se distribuyan normalmente.
Antes de elegir una prueba, debe visualizar y evaluar sus datos trazando la distribución de su muestra (histograma y curva de distribución) y ver si se asemeja a una curva en forma de campana.
Puede probar la normalidad utilizando la prueba Shapiro-Wilk. Esta es la prueba más poderosa para la normalidad, y un valor p> 0,05 indica normalidad, y puede usar una prueba paramétrica.
Las pruebas no paramétricas son convenientes porque no necesitamos hacer ninguna suposición sobre la forma o los parámetros de la distribución de la población subyacente a partir de la cual se extrajo la muestra. Por ejemplo, si los datos se desvían fuertemente de los supuestos de una prueba paramétrica (es decir, no se distribuyen normalmente), usar una prueba paramétrica podría conducir a conclusiones incorrectas.
Si los datos son realmente normales, una prueba no paramétrica generalmente tendrá menos potencia para el mismo tamaño de muestra en comparación con la prueba paramétrica correspondiente. Esto significa que una prueba no paramétrica puede no rechazar correctamente la hipótesis nula cuando una prueba paramétrica lo hará, y podemos sacar la conclusión incorrecta de nuestro análisis. Esto también significa que si estamos planeando un estudio y tratando de determinar cuántos participantes incluir, una prueba no paramétrica requerirá un tamaño de muestra ligeramente mayor para tener la misma potencia que la prueba paramétrica correspondiente.
¿Qué es un análisis paramétrico?
El análisis paramétrico es un ejercicio común empleado por ingenieros de producción en modelado de pozos y toma de decisiones. La figura anterior muestra un conjunto de gráficos de rendimiento de inyección de gas (tasa de producción de aceite versus tasa de inyección de gas) resultante de un análisis paramétrico de un simulador basado en física. En una ventana de observación de 10 días, se observó que la tasa de producción de aceite de un pozo varía entre 70-90 barriles por día. Los otros parámetros inciertos en el análisis paramétrico incluyen el depósito desconocido o las condiciones de pozo de fondo, y las diferentes mediciones de parámetros de la superficie. Se generan simulaciones para una combinación de casos que varían estos parámetros, y se seleccionan los casos que coinciden con las tasas de producción operativa.
Como se demostró, hay una solución no unique como resultado de la simulación. En una revisión manual típica, se espera que el ingeniero elimine algunas de las posibilidades para seleccionar una configuración que represente el estado operativo actual del pozo. Como ilustra la figura, las curvas de rendimiento de elevación de gas se pueden clasificar ampliamente en líneas planas o curvas. Las líneas planas indican la insensibilidad de la tasa de producción del pozo en respuesta a la tasa de inyección cambiante. En tales casos, el operador puede ahorrar gas al reducir la tasa de inyección sin ningún impacto significativo en la producción. Las líneas curvas presentan la posibilidad de mejorar la tasa de producción de petróleo al encontrar una tasa de inyección óptima y el potencial de perder la producción inyectando a una tasa de inyección incorrecta, ya sea inyectando o exagerando.
Las condiciones subyacentes que representan los casos individuales no siempre son conocidas por el ingeniero, como se explicó anteriormente. Por lo tanto, el principal problema en la optimización del elevador de gas es la selección del modelo en condiciones inciertas y transitorias. En nuestro ejemplo de caso, el operador puede marcar una diferencia de hasta el 20% en mejora o bajo rendimiento de la tasa de producción de petróleo contingente en la selección del modelo apropiado. Por lo tanto, habitualmente, el ingeniero tiene que invertir un tiempo significativo para resolver la no unicidad de la solución y, en última instancia, seleccionar un modelo basado en la deducción, conjetura o suposición.
Para obtener más información sobre cómo usamos el aprendizaje automático para automatizar la optimización de la elevación de gas, solicite nuestro documento blanco sobre el tema. En las semanas futuras, discutiremos la naturaleza transitoria de las propiedades del pozo y la incertidumbre que hace que la optimización sea un desafío continuo para el equipo de ingeniería de producción.
¿Qué es analisis no paramétrico?
Modelos de regresión (➔ regresión, modelos y estimadores de) que tienen como objeto de interés una característica de la distribución condicionada de un empleado variable Y (➔ dependiente, variable) dado un conjunto de regresores x, por ejemplo. el μ condicional promedio (x) = e (y∣x = x) (➔ medios). Estos modelos se utilizan cuando desea limitar la contratación al máximo sobre la distribución condicional de y dada x (➔ Distribución de probabilidad). Para la naturaleza misma del análisis de r. norte. P, que no impone restricciones a la forma funcional de μ (x), se puede decir que es el método de estima el que induce el modelo no. p., Y no viceversa. Entre los estimadores principales n. p., El análisis se limitará al caso de un modelo para el promedio condicional. Por lo tanto, tomamos una muestra aleatoria {(y1, x1),…, (yn, xn)} (➔ muestra estadística) y estar interesado en la estimación de la función μ (x) = e (y∣ x = x) que describe el comportamiento del promedio condicional de y, donde x puede indicar un solo regreso o un conjunto de k regresores. La mayoría de los estimadores más utilizados pueden escribirse como funciones lineales de los valores observados de y, (y1,…, yn), es decir, como
donde los pesos de WI (x) dependen solo de Xi y X. La principal ventaja de la linealidad es la simplicidad, lo que permite calcular las propiedades estadísticas de los propios estimadores (➔ Estimador). Además, la estructura lineal común permite comparar las propiedades de estimadores muy diferentes a través de la comparación de los diferentes sistemas de peso. Los estimadores de este tipo también se llaman batidos lineales de r. (Smoothers de regresión lineal), donde para R. Nos referimos a cualquier función de los datos a través de los cuales puede obtener valores predichos μ ̂ (XI) que son más ‘regulares’ de los valores de Yi observados.
Una spline de regresión aproxima la función a través de una función polinomial (típicamente lineal, cuadrada o cúbica) a veces. El tipo más fácil es la spline lineal: una vez que el conjunto de valores Y se divide en intervalos adyacentes, la tarifa que se aproxima aproximadamente a la función μ (x) se calcula en cada intervalo bajo la restricción de que el resultado es continuo. Uno de los puntos críticos de este procedimiento consiste en la elección del número de intervalos y su posición. ● La estimación del núcleo de regresión es un método basado en el cálculo de los medios condicionados mediante el uso de una estimación del núcleo de la densidad condicional f (y∣x) (➔ densidad del núcleo). Un caso particular es el estimador de Nadaraya-Watson, que se puede escribir en el formulario
Donde K es una función de núcleo y H es la amplitud del ancho de banda (ancho de banda). ● El método vecino más cercano (vecino más cercano). Para cada valor x, los valores de Xi más cercanos a X se obtienen y se estima μ (x) como un promedio de la Y Y. En caso de que se tomen los valores más cercanos a X, existe el estimador μ ̂ ̂ (x) = σjwj (x) yj, donde wj (x) = 1/k se xj se encuentra entre los kosses más cercanos a x y, de lo contrario, wj (x) = 0. En otras palabras, es un promedio móvil de valores Y (➔ disminuido). ● Una versión más sofisticada de aproximación localmente μ (x) con un medio móvil utiliza aproximación lineal localmente, es decir, para cada x, se supone
donde los coeficientes α (x) y β (x) se estiman utilizando las observaciones correspondientes a los valores XI más cercanos a X. Todos los estimadores mencionados anteriormente se pueden obtener minimizando la suma ponderada de los cuadrados σjwj (x, x1,…, xn) (yj – cj) 2 en comparación con c = (c1,… cn), donde c depende Solo en (x1,…, xn) pero no de Y. qué cambios entre los diferentes métodos son los pesos W. Tenga en cuenta que el estimador de los medidores cuadrados, cuadrados mínimos ordinarios (➔ cuadrados mínimos, método de), a pesar de ser un estimador paramétrico, puede verse como un caso particular, correspondiente al caso WI = 1/N y CI = α+βXI . ● El principal problema de los estimadores n. pags. Se conoce por el nombre de ‘Curse de dimensiones’ (maldición de la dimensionalidad): las propiedades asintóticas (➔ ➔ asintótica, distribución) de estos estimadores empeoran a medida que aumenta el número K de los regresores, y el empeoramiento es más que proporcional al aumento en el aumento de K.
¿Cuáles son las pruebas no paramétricas y sus características?
- Las pruebas no funcionales deben ser medibles, por lo que no hay una caracterización subjetiva como buena, mejor, más agradable, etc., están disponibles.
- Al comienzo de la fase de demanda, se conocerán poco probables cifras exactas.
- Asegúrese de que en la ingeniería de software, las características de calidad sean reconocidas adecuadamente.
- Las especificaciones deben ser priorizadas.
Sepa que vamos a ver que los tipos de pruebas no funcionales son los siguientes a continuación
- Las pruebas no funcionales deben ser medibles, por lo que no hay una caracterización subjetiva como buena, mejor, más agradable, etc., están disponibles.
- Al comienzo de la fase de demanda, se conocerán poco probables cifras exactas.
- Asegúrese de que en la ingeniería de software, las características de calidad sean reconocidas adecuadamente.
- Las especificaciones deben ser priorizadas.
Punto importante: durante el desarrollo de ensayos de escalabilidad, el aumento de la carga en incrementos para fases posteriores en el esquema de prueba debe preferirse y sugerirse a un nivel avanzado a un nivel muy fundamental.
¿Cuáles son las características de las pruebas paramétricas?
Los procedimientos estadísticos convencionales también pueden llamar a las pruebas paramétricas. En cada prueba paramétrica, por ejemplo, debe usar estadísticas para estimar el parámetro de la población.
Debido a dicha estimación, debe seguir un proceso que incluye una muestra, así como una distribución de muestreo y una población junto con ciertas suposiciones paramétricas que se requieren, lo que asegura que todos los componentes compatibles entre sí.
Un ejemplo puede usar para explicar esto. Las observaciones son en primer lugar bastante independientes, los datos de la muestra no tienen distribuciones normales y las puntuaciones en los diferentes grupos tienen algunas variaciones homogéneas.
Las pruebas paramétricas se basan en la distribución, las pruebas estadísticas paramétricas solo se aplican a las variables. No hay pruebas paramétricas que existan para la fecha de escala nominal, y finalmente, son bastante poderosas cuando existen.
Una de las mayores y mejores ventajas del uso de pruebas paramétricas es en primer lugar que no necesita muchos datos que puedan convertirse en algún orden o formato de rangos. El proceso de conversión es algo que aparece en formato de rango y para poder usar una prueba paramétrica regularmente, terminará con una pérdida severa en precisión.
Otra gran ventaja de usar pruebas paramétricas es el hecho de que puede calcular todo tan fácilmente. En resumen, podrá encontrar software mucho más rápido para poder calcularlo rápido y rápido.
Además de las pruebas paramétricas, hay otras pruebas no paramétricas, donde los distribuidores son bastante diferentes y no son tan fáciles cuando se trata de probar las preguntas que se centran relacionadas con las medias y formas de tales distribuciones.
¿Qué son las pruebas no paramétricas y cómo podría utilizarlas en su vida profesional?
¿Por qué usar pruebas no paramétricas? ¿Cuándo se utilizan estas pruebas estadísticas? Este artículo tiene como objetivo responder a estas preguntas.
Como estudiante en sus años de pregrado, tal vez esté más familiarizado con las pruebas paramétricas que las pruebas no paramétricas. Cualquiera sea la razón de esta tendencia entre los maestros de estadísticas a centrar su pedagogía en las pruebas paramétricas en la universidad, debe estar familiarizado con las pruebas no paramétricas como una alternativa a las pruebas paramétricas como estudiante graduado. Las situaciones surgen en las que no tiene una mejor opción que aplicar estadísticas no paramétricas.
El uso de pruebas no paramétricas se reduce al tipo de datos que recopila en su estudio. A diferencia de las pruebas paramétricas, las pruebas no paramétricas acomodan datos que tienen un amplio rango de varianza. Puede usar pruebas no paramétricas para datos cuantitativos y cualitativos. Estas pruebas operan bajo pocos supuestos sobre la población, a diferencia de las pruebas paramétricas que favorecen el análisis de datos cuantitativos.
Los métodos no paramétricos se consideran robustos, lo que significa que estas pruebas son eficientes en el análisis de datos caracterizados por valores atípicos. Los valores atípicos son aquellos datos que se desvían del rango de valores «normal» esperado. A menos que los efectos de los valores atípicos se controlen en pruebas paramétricas, conducen a conclusiones erróneas. Las pruebas no paramétricas también son sólidas ya que el análisis no necesita requerir datos que se aproximen a una distribución normal, más en esto en la siguiente sección.
Las pruebas no paramétricas se usan típicamente cuando no se pueden hacer supuestos para la normalidad de una distribución de muestreo. Las distribuciones de muestreo no normales generalmente se producen cuando el muestreo aleatorio no es posible. Se produce sesgo o tendencia a favorecer la selección de muestras en una sección de la población.
Artículos Relacionados:
