¿Qué es el análisis no paramétrico y cuándo se debe utilizar?

Una prueba no paramétrica (a veces llamada prueba libre de distribución) no asume nada sobre la distribución subyacente (por ejemplo, que los datos provienen de una distribución normal). Eso se compara con la prueba paramétrica, que hace suposiciones sobre los parámetros de una población (por ejemplo, la media o la desviación estándar); Cuando la palabra «no paramétrica» ​​se usa en las estadísticas, no significa que no sepa nada sobre la población. Por lo general, significa que sabe que los datos de la población no tienen una distribución normal.

Mire el video para ver las diferencias entre las pruebas paramétricas y no paramétricas, y cuando desee usar pruebas no paramétricas:

Si es posible, debe las pruebas paramétricas de EE. UU., Ya que tienden a ser más precisas. Las pruebas paramétricas tienen un mayor poder estadístico, lo que significa que es probable que encuentren un verdadero efecto significativo. Use pruebas no paramétricas solo si es necesario (es decir, sabe que se violan suposiciones como la normalidad). Las pruebas no paramétricas pueden funcionar bien con datos no normales si tiene un tamaño de muestra suficientemente grande (generalmente 15-20 elementos en cada grupo).

Las pruebas no paramétricas se utilizan cuando sus datos no son normales. Por lo tanto, la clave es averiguar si tiene datos distribuidos normalmente. Por ejemplo, puede ver la distribución de sus datos. Si sus datos son aproximadamente normales, puede usar pruebas estadísticas paramétricas. P. Si no tiene un gráfico, ¿cómo se entera si sus datos se distribuyen normalmente? A. Verifique la asimetría y la curtosis de la distribución utilizando software como Excel (ver: Sesgo en Excel 2013 y curtosis en Excel 2013).
Una distribución normal no tiene sesgo. Básicamente, es una forma centrada y simétrica. La curtosis se refiere a cuánto de los datos están en las colas y el centro. La asimetría y la curtosis para una distribución normal es de aproximadamente 1. curtosis negativa (izquierda) y curtosis positiva (derecha)
Si su distribución no es normal (en otras palabras, la asimetría y la curtosis desvían mucho de 1.0), debe usar una prueba no paramétrica como la prueba de chi-cuadrado. De lo contrario, corre el riesgo de que sus resultados no tengan sentido.

¿Sus datos permiten una prueba paramétrica o tiene que usar una prueba no paramétrica como Chi-square? La regla general es:

  • Desea probar la mediana en lugar de la media (es posible que desee hacer esto si tiene una distribución muy sesgada).

¿Qué es un análisis Parametrico y no Parametrico?

Las pruebas estadísticas paramétricas se basan en suposiciones sobre la forma de la distribución y los parámetros (es decir, la media y la desviación estándar), y la mayoría se basan en una suposición de una distribución aproximadamente normal. Las pruebas estadísticas no paramétricas se basan en ningún o pocos supuestos sobre la forma o los parámetros de la distribución de la población a partir de la cual se dibujó la muestra. Si los datos son realmente normales, una prueba no paramétrica generalmente tendrá menos potencia para el mismo tamaño de muestra en comparación con la prueba paramétrica correspondiente.

Las pruebas estadísticas paramétricas son más poderosas que las pruebas no paramétricas.

La mayoría de las pruebas paramétricas requieren que los datos se distribuyan normalmente.

Antes de elegir una prueba, debe visualizar y evaluar sus datos trazando la distribución de su muestra (histograma y curva de distribución) y ver si se asemeja a una curva en forma de campana.

Puede probar la normalidad utilizando la prueba Shapiro-Wilk. Esta es la prueba más poderosa para la normalidad, y un valor p> 0,05 indica normalidad, y puede usar una prueba paramétrica.

Las pruebas no paramétricas son convenientes porque no necesitamos hacer ninguna suposición sobre la forma o los parámetros de la distribución de la población subyacente a partir de la cual se extrajo la muestra. Por ejemplo, si los datos se desvían fuertemente de los supuestos de una prueba paramétrica (es decir, no se distribuyen normalmente), usar una prueba paramétrica podría conducir a conclusiones incorrectas.

Si los datos son realmente normales, una prueba no paramétrica generalmente tendrá menos potencia para el mismo tamaño de muestra en comparación con la prueba paramétrica correspondiente. Esto significa que una prueba no paramétrica puede no rechazar correctamente la hipótesis nula cuando una prueba paramétrica lo hará, y podemos sacar la conclusión incorrecta de nuestro análisis. Esto también significa que si estamos planeando un estudio y tratando de determinar cuántos participantes incluir, una prueba no paramétrica requerirá un tamaño de muestra ligeramente mayor para tener la misma potencia que la prueba paramétrica correspondiente.

¿Qué es un análisis paramétrico?

El análisis paramétrico es un ejercicio común empleado por ingenieros de producción en modelado de pozos y toma de decisiones. La figura anterior muestra un conjunto de gráficos de rendimiento de inyección de gas (tasa de producción de aceite versus tasa de inyección de gas) resultante de un análisis paramétrico de un simulador basado en física. En una ventana de observación de 10 días, se observó que la tasa de producción de aceite de un pozo varía entre 70-90 barriles por día. Los otros parámetros inciertos en el análisis paramétrico incluyen el depósito desconocido o las condiciones de pozo de fondo, y las diferentes mediciones de parámetros de la superficie. Se generan simulaciones para una combinación de casos que varían estos parámetros, y se seleccionan los casos que coinciden con las tasas de producción operativa.

Como se demostró, hay una solución no unique como resultado de la simulación. En una revisión manual típica, se espera que el ingeniero elimine algunas de las posibilidades para seleccionar una configuración que represente el estado operativo actual del pozo. Como ilustra la figura, las curvas de rendimiento de elevación de gas se pueden clasificar ampliamente en líneas planas o curvas. Las líneas planas indican la insensibilidad de la tasa de producción del pozo en respuesta a la tasa de inyección cambiante. En tales casos, el operador puede ahorrar gas al reducir la tasa de inyección sin ningún impacto significativo en la producción. Las líneas curvas presentan la posibilidad de mejorar la tasa de producción de petróleo al encontrar una tasa de inyección óptima y el potencial de perder la producción inyectando a una tasa de inyección incorrecta, ya sea inyectando o exagerando.

Las condiciones subyacentes que representan los casos individuales no siempre son conocidas por el ingeniero, como se explicó anteriormente. Por lo tanto, el principal problema en la optimización del elevador de gas es la selección del modelo en condiciones inciertas y transitorias. En nuestro ejemplo de caso, el operador puede marcar una diferencia de hasta el 20% en mejora o bajo rendimiento de la tasa de producción de petróleo contingente en la selección del modelo apropiado. Por lo tanto, habitualmente, el ingeniero tiene que invertir un tiempo significativo para resolver la no unicidad de la solución y, en última instancia, seleccionar un modelo basado en la deducción, conjetura o suposición.

Para obtener más información sobre cómo usamos el aprendizaje automático para automatizar la optimización de la elevación de gas, solicite nuestro documento blanco sobre el tema. En las semanas futuras, discutiremos la naturaleza transitoria de las propiedades del pozo y la incertidumbre que hace que la optimización sea un desafío continuo para el equipo de ingeniería de producción.

¿Qué es analisis no paramétrico?

Modelos de regresión (➔ regresión, modelos y estimadores de) que tienen como objeto de interés una característica de la distribución condicionada de un empleado variable Y (➔ dependiente, variable) dado un conjunto de regresores x, por ejemplo. el μ condicional promedio (x) = e (y∣x = x) (➔ medios). Estos modelos se utilizan cuando desea limitar la contratación al máximo sobre la distribución condicional de y dada x (➔ Distribución de probabilidad). Para la naturaleza misma del análisis de r. norte. P, que no impone restricciones a la forma funcional de μ (x), se puede decir que es el método de estima el que induce el modelo no. p., Y no viceversa. Entre los estimadores principales n. p., El análisis se limitará al caso de un modelo para el promedio condicional. Por lo tanto, tomamos una muestra aleatoria {(y1, x1),…, (yn, xn)} (➔ muestra estadística) y estar interesado en la estimación de la función μ (x) = e (y∣ x = x) que describe el comportamiento del promedio condicional de y, donde x puede indicar un solo regreso o un conjunto de k regresores. La mayoría de los estimadores más utilizados pueden escribirse como funciones lineales de los valores observados de y, (y1,…, yn), es decir, como

donde los pesos de WI (x) dependen solo de Xi y X. La principal ventaja de la linealidad es la simplicidad, lo que permite calcular las propiedades estadísticas de los propios estimadores (➔ Estimador). Además, la estructura lineal común permite comparar las propiedades de estimadores muy diferentes a través de la comparación de los diferentes sistemas de peso. Los estimadores de este tipo también se llaman batidos lineales de r. (Smoothers de regresión lineal), donde para R. Nos referimos a cualquier función de los datos a través de los cuales puede obtener valores predichos μ ̂ (XI) que son más ‘regulares’ de los valores de Yi observados.

Una spline de regresión aproxima la función a través de una función polinomial (típicamente lineal, cuadrada o cúbica) a veces. El tipo más fácil es la spline lineal: una vez que el conjunto de valores Y se divide en intervalos adyacentes, la tarifa que se aproxima aproximadamente a la función μ (x) se calcula en cada intervalo bajo la restricción de que el resultado es continuo. Uno de los puntos críticos de este procedimiento consiste en la elección del número de intervalos y su posición. ● La estimación del núcleo de regresión es un método basado en el cálculo de los medios condicionados mediante el uso de una estimación del núcleo de la densidad condicional f (y∣x) (➔ densidad del núcleo). Un caso particular es el estimador de Nadaraya-Watson, que se puede escribir en el formulario

Donde K es una función de núcleo y H es la amplitud del ancho de banda (ancho de banda). ● El método vecino más cercano (vecino más cercano). Para cada valor x, los valores de Xi más cercanos a X se obtienen y se estima μ (x) como un promedio de la Y Y. En caso de que se tomen los valores más cercanos a X, existe el estimador μ ̂ ̂ (x) = σjwj (x) yj, donde wj (x) = 1/k se xj se encuentra entre los kosses más cercanos a x y, de lo contrario, wj (x) = 0. En otras palabras, es un promedio móvil de valores Y (➔ disminuido). ● Una versión más sofisticada de aproximación localmente μ (x) con un medio móvil utiliza aproximación lineal localmente, es decir, para cada x, se supone

donde los coeficientes α (x) y β (x) se estiman utilizando las observaciones correspondientes a los valores XI más cercanos a X. Todos los estimadores mencionados anteriormente se pueden obtener minimizando la suma ponderada de los cuadrados σjwj (x, x1,…, xn) (yj – cj) 2 en comparación con c = (c1,… cn), donde c depende Solo en (x1,…, xn) pero no de Y. qué cambios entre los diferentes métodos son los pesos W. Tenga en cuenta que el estimador de los medidores cuadrados, cuadrados mínimos ordinarios (➔ cuadrados mínimos, método de), a pesar de ser un estimador paramétrico, puede verse como un caso particular, correspondiente al caso WI = 1/N y CI = α+βXI . ● El principal problema de los estimadores n. pags. Se conoce por el nombre de ‘Curse de dimensiones’ (maldición de la dimensionalidad): las propiedades asintóticas (➔ ➔ asintótica, distribución) de estos estimadores empeoran a medida que aumenta el número K de los regresores, y el empeoramiento es más que proporcional al aumento en el aumento de K.

¿Cuáles son las pruebas no paramétricas y sus características?

  • Las pruebas no funcionales deben ser medibles, por lo que no hay una caracterización subjetiva como buena, mejor, más agradable, etc., están disponibles.
  • Al comienzo de la fase de demanda, se conocerán poco probables cifras exactas.
  • Asegúrese de que en la ingeniería de software, las características de calidad sean reconocidas adecuadamente.
  • Las especificaciones deben ser priorizadas.

Sepa que vamos a ver que los tipos de pruebas no funcionales son los siguientes a continuación

  • Las pruebas no funcionales deben ser medibles, por lo que no hay una caracterización subjetiva como buena, mejor, más agradable, etc., están disponibles.
  • Al comienzo de la fase de demanda, se conocerán poco probables cifras exactas.
  • Asegúrese de que en la ingeniería de software, las características de calidad sean reconocidas adecuadamente.
  • Las especificaciones deben ser priorizadas.
  • Las pruebas de disponibilidad son, al contrario de las demandas operativas disponibles, un enfoque para probar las pruebas del sistema integrado.
  • La implementación del software 24 * 7 está disponible para cumplir con sus funcionalidades esperadas cuando sea necesario sin falla.
  • El software ya no constituye programas fáciles. Son complicados en la construcción y complicados en la implementación. Esta complejidad de su naturaleza hace que las pruebas extensas sean significativas para garantizar que opera de acuerdo con los requisitos del cliente.
  • Esta prueba es esencial para que un producto de software evalúe su compatibilidad con su configuración operativa anticipada, incluidas varias plataformas, sistemas operativos, software y hardware, para implementar correctamente su funcionalidad planificada.
  • La prueba de compatibilidad es un método de prueba no funcional que generalmente se realiza para validar y verificar la compatibilidad del producto o sitio web con otros artefactos diferentes, como otros navegadores web, plataformas de hardware, clientes, sistemas operativos, etc. Un componente importante de las pruebas de software Prueba del ciclo de vida (STLC).
  • Las pruebas de compatibilidad realizadas en las primeras fases de garantía de calidad permiten al equipo garantizar que los criterios de compatibilidad requeridos por el cliente se cumplan e integren con el producto final.
  • La prueba de configuración es la variación única de las pruebas de software en una computadora con varias configuraciones de hardware o software, a saber, sistema operativo, navegador, controladores compatibles, etc., para las pruebas de rendimiento de un producto de software. Este tipo de prueba de configuración se realiza en laboratorios.
  • Todas las computadoras con varias configuraciones de hardware están disponibles en los laboratorios. Cada máquina en el laboratorio tiene una versión comprobable del software que se publicará, y se lleva a cabo una demanda de prueba. Dado que establecer un laboratorio de prueba con máquinas costosas de servicio pesado puede ser difícil, numerosas empresas subcontratan a las organizaciones especializadas en llevar a cabo tales pruebas el trabajo de realizar pruebas de configuración de hardware.
  • El equipo se enfoca en probar software a través de diferentes tecnologías de prueba de software después de que se haya completado el proceso de desarrollo de software.
  • La prueba de carga es un método que se realiza durante la prueba del ciclo de vida del software (STLC) para garantizar la estabilidad y confiabilidad del producto del software.
  • La prueba de carga es la forma más simple de pruebas de rendimiento y se lleva a cabo bajo una condición de carga predicha particular para comprender el comportamiento del software o la aplicación. Estas cargas se basan en los requisitos reales de los clientes finales que se espera que usen el software.
  • El principio de prueba de carga es elevar continuamente la carga del software hasta que alcance su umbral y luego evalúa su eficiencia y comportamiento en relación con estos aumentos de carga.
  • Las pruebas de localización están destinadas a verificar la calidad de los atributos locales dirigidos a una región/cultura/población particular para que una versión localizada funcione correctamente y se espera que satisfaga las necesidades y expectativas de una región en particular.
  • Las pruebas de localización se centran en monitorear el ajuste y la modificación de los entornos de producción para cumplir con los requisitos de los usuarios específicos de aquellos que usan los productos en esa nación en particular.
  • Una metodología de prueba clave que incorpora métodos de prueba distintos para probar la capacidad de respuesta a la configuración y requisitos del mundo real para la estabilidad, escalabilidad, confiabilidad y otras mediciones de calidad en un producto de software.
  • En el campo de las pruebas de software, una evaluación bajo el banner de las pruebas de rendimiento es uno de los elementos principales que garantiza la operación efectiva de un producto después de su lanzamiento. Las pruebas de rendimiento son un subconjunto de ingeniería de eficiencia, comúnmente conocida como «pruebas de perf.». Es una especie de prueba que garantiza que las aplicaciones de software se realicen de manera adecuada y perfecta bajo la carga de trabajo anticipada.
  • Determina la velocidad, la eficiencia, la confiabilidad, la escalabilidad y otras características y componentes significativos del sistema. Además, se comparan dos o más aplicaciones y se evalúan la velocidad de su sistema, la tasa de transferencia de información, el ancho de banda y más.
  • Es una especie de prueba no funcional que se lleva a cabo para evaluar la capacidad del software o el sistema que se modificará sin problemas para satisfacer los requisitos de evolución del cliente.
  • Las pruebas de mantenimiento se utilizan para evaluar la capacidad de la aplicación de software para actualizarse o modificarse fácilmente para satisfacer las crecientes necesidades y requisitos del usuario.
  • La estructura, la complejidad y otras características del código fuente se discuten junto con la parte de documentación del proceso de desarrollo de software.
  • Esencialmente incluye las siguientes operaciones. Las pruebas dinámicas incluyen métodos de prueba que se centran en la identidad de los defectos para evitar un software o falla del sistema inesperado.
  • Las pruebas de seguridad se utilizarán para verificar y validar las características de seguridad del software, incluida la identificación y detección de fallas de seguridad u otras vulnerabilidades asociadas para que la información y los datos almacenados o compartidos con el esquema estén protegidos, auténticos y confidenciales.
  • Estas aplicaciones se han vuelto obligatorias porque otras pueden ser víctimas de diferentes vulnerabilidades. La titulización no es obligatoria. Las pruebas reales son necesarias durante la etapa de desarrollo de software. La razón de los mismos centros en la ejecución de un programa o aplicación para capturar errores de software. La razón de esto es que un programa o aplicación se ejecuta para capturar errores de software. Es esencial, ya que tales ataques son muy críticos y permiten a un hacker capturar datos de la base de datos del servidor.
  • Las pruebas de volumen someten el producto de software o cargado de enormes cantidades de datos para medir y evaluar la respuesta, el comportamiento y la efectividad de la aplicación. ‘Pruebas de volumen‘ se relaciona con la prueba de aplicaciones de software, que están sujetas a volúmenes de información elevados.
  • La palabra se descubrió por primera vez en las pruebas de software Arts of Software de 1979 por ‘Glenford Meyers, que describe las pruebas de volumen como‘ sometiendo el programa a una gran cantidad de información.
  • Las pruebas de volumen son parte de un grupo de ensayos no funcionales (volumen, carga, estrés) para analizar la eficiencia del sistema al aumentar el volumen de información. Este volumen generalmente puede ser del tamaño de la base de datos o el tamaño de una interfaz de archivo probada por volumen.
  • Las pruebas de escalabilidad son una forma de pruebas de rendimiento que garantiza la flexibilidad del producto o aplicación de software para aumentar la proporción a los crecientes requisitos para los usuarios finales.
  • El objetivo principal de realizar pruebas de escalabilidad es evaluar la capacidad de adaptabilidad del software para crecer junto con estas demandas y adaptarse a ellas para operar de manera eficiente sin ningún problema. La escalabilidad es una de las características no funcionales de la aplicación de software.
  • Las pruebas de escalabilidad, por lo tanto, pueden considerarse una forma de método de prueba no funcional para garantizar la calidad escalable del sistema.
  • Punto importante: durante el desarrollo de ensayos de escalabilidad, el aumento de la carga en incrementos para fases posteriores en el esquema de prueba debe preferirse y sugerirse a un nivel avanzado a un nivel muy fundamental.

    ¿Cuáles son las características de las pruebas paramétricas?

    Los procedimientos estadísticos convencionales también pueden llamar a las pruebas paramétricas. En cada prueba paramétrica, por ejemplo, debe usar estadísticas para estimar el parámetro de la población.

    Debido a dicha estimación, debe seguir un proceso que incluye una muestra, así como una distribución de muestreo y una población junto con ciertas suposiciones paramétricas que se requieren, lo que asegura que todos los componentes compatibles entre sí.

    Un ejemplo puede usar para explicar esto. Las observaciones son en primer lugar bastante independientes, los datos de la muestra no tienen distribuciones normales y las puntuaciones en los diferentes grupos tienen algunas variaciones homogéneas.

    Las pruebas paramétricas se basan en la distribución, las pruebas estadísticas paramétricas solo se aplican a las variables. No hay pruebas paramétricas que existan para la fecha de escala nominal, y finalmente, son bastante poderosas cuando existen.

    Una de las mayores y mejores ventajas del uso de pruebas paramétricas es en primer lugar que no necesita muchos datos que puedan convertirse en algún orden o formato de rangos. El proceso de conversión es algo que aparece en formato de rango y para poder usar una prueba paramétrica regularmente, terminará con una pérdida severa en precisión.

    Otra gran ventaja de usar pruebas paramétricas es el hecho de que puede calcular todo tan fácilmente. En resumen, podrá encontrar software mucho más rápido para poder calcularlo rápido y rápido.

    Además de las pruebas paramétricas, hay otras pruebas no paramétricas, donde los distribuidores son bastante diferentes y no son tan fáciles cuando se trata de probar las preguntas que se centran relacionadas con las medias y formas de tales distribuciones.

    ¿Qué son las pruebas no paramétricas y cómo podría utilizarlas en su vida profesional?

    ¿Por qué usar pruebas no paramétricas? ¿Cuándo se utilizan estas pruebas estadísticas? Este artículo tiene como objetivo responder a estas preguntas.

    Como estudiante en sus años de pregrado, tal vez esté más familiarizado con las pruebas paramétricas que las pruebas no paramétricas. Cualquiera sea la razón de esta tendencia entre los maestros de estadísticas a centrar su pedagogía en las pruebas paramétricas en la universidad, debe estar familiarizado con las pruebas no paramétricas como una alternativa a las pruebas paramétricas como estudiante graduado. Las situaciones surgen en las que no tiene una mejor opción que aplicar estadísticas no paramétricas.

    El uso de pruebas no paramétricas se reduce al tipo de datos que recopila en su estudio. A diferencia de las pruebas paramétricas, las pruebas no paramétricas acomodan datos que tienen un amplio rango de varianza. Puede usar pruebas no paramétricas para datos cuantitativos y cualitativos. Estas pruebas operan bajo pocos supuestos sobre la población, a diferencia de las pruebas paramétricas que favorecen el análisis de datos cuantitativos.

    Los métodos no paramétricos se consideran robustos, lo que significa que estas pruebas son eficientes en el análisis de datos caracterizados por valores atípicos. Los valores atípicos son aquellos datos que se desvían del rango de valores «normal» esperado. A menos que los efectos de los valores atípicos se controlen en pruebas paramétricas, conducen a conclusiones erróneas. Las pruebas no paramétricas también son sólidas ya que el análisis no necesita requerir datos que se aproximen a una distribución normal, más en esto en la siguiente sección.

    Las pruebas no paramétricas se usan típicamente cuando no se pueden hacer supuestos para la normalidad de una distribución de muestreo. Las distribuciones de muestreo no normales generalmente se producen cuando el muestreo aleatorio no es posible. Se produce sesgo o tendencia a favorecer la selección de muestras en una sección de la población.

    Artículos Relacionados:

    Más posts relacionados:

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *