La normalidad de los datos es una de las principales métricas que se utilizan en estadística.

La distribución normal estándar es la distribución de probabilidad continua más importante tiene una curva de densidad en forma de campana descrita por su media y los valores de SD y extremos en el conjunto de datos no tienen un impacto significativo en el valor medio. Si un datos continuos se sigue a la distribución normal, entonces 68.2%, 95.4%y 99.7%de observaciones se encuentran entre la media ± 1 DE, la media ± 2 DE y la media ± 3 SD, respectivamente. [2,4]

Varios métodos estadísticos utilizados para el análisis de datos hacen suposiciones sobre la normalidad, incluida la correlación, la regresión, las pruebas t y el análisis de varianza. El teorema del límite central establece que cuando el tamaño de la muestra tiene 100 o más observaciones, la violación de la normalidad no es un problema importante. [5,8] Aunque para conclusiones significativas, la suposición de la normalidad debe seguirse independientemente del tamaño de la muestra. Si los datos continuos siguen la distribución normal, entonces presentamos estos datos en el valor medio. Además, este valor medio se usa para comparar entre/entre los grupos para calcular el nivel de significación (valor p). Si nuestros datos no se distribuyen normalmente, la media resultante no es un valor representativo de nuestros datos. Una selección incorrecta del valor representativo de un conjunto de datos y un nivel de significancia calculado adicional utilizando este valor representativo podría dar una interpretación incorrecta. [9] Es por eso que, primero probamos la normalidad de los datos, luego decidimos si la media es aplicable como valor representativo de los datos o no. Si corresponde, los medios se comparan mediante la prueba paramétrica de lo contrario, los medianos se utilizan para comparar los grupos, utilizando métodos no paramétricos.

Una evaluación de la normalidad de los datos es un requisito previo para muchas pruebas estadísticas porque los datos normales son una suposición subyacente en las pruebas paramétricas. Existen dos métodos principales para evaluar la normalidad: gráficos y numéricos (incluidas las pruebas estadísticas). [3,4] Las pruebas estadísticas tienen la ventaja de hacer un juicio objetivo de la normalidad pero tienen la desventaja de que a veces no sean lo suficientemente sensibles a los tamaños de muestra bajos o demasiado sensible a los grandes tamaños de muestra. La interpretación gráfica tiene la ventaja de permitir que el buen juicio evalúe la normalidad en situaciones en que las pruebas numéricas pueden ser superiores o subsensibles. Aunque la evaluación de normalidad utilizando métodos gráficos necesita una gran parte de la experiencia para evitar las interpretaciones incorrectas. Si no tenemos una buena experiencia, es lo mejor confiar en los métodos numéricos. [10] Existen varios métodos disponibles para probar la normalidad de los datos continuos, de ellos, los métodos más populares son la prueba de Shapiro -Wilk, la prueba de Kolmogorov -Smirnov, la asimetría, la curtosis, el histograma, la parcela de caja, la parcela P – P, la trama Q – Q y medio con SD. Las dos pruebas de normalidad bien conocidas, a saber, la prueba Kolmogorov-Smirnov y la prueba Shapiro-Wilk son métodos más utilizados para probar la normalidad de los datos. Las pruebas de normalidad se pueden realizar en el software estadístico «SPSS» (analizar → estadísticas descriptivas → explorar → gráficos → gráficos de normalidad con pruebas).

¿Cómo se determina la normalidad de los datos?

Para reconocer si una distribución es normal, puede basarse en:

  • Gráficos, como el histograma, el diagrama de caja o el diseñador gráfico del cuantili
  • Índices descriptivos, como asimetría y curiosidad
  • Pruebas normales, como Shapiro-Wilk o Kolmogorov-Smnnev

Una variable tiene una distribución gaussiana si su histograma resulta ser simétrico. Las barras que lo inventan deben disminuir uniformemente pasando del centro a los lados del gráfico. Además, no debe haber grandes espacios vacíos entre las barras o los valores atípicos evidentes.

Para investigar aún mejor la presencia de valores atípicos, puede dibujar un diagrama de caja. De hecho, este gráfico le informa con puntos o asteriscos (dependiendo del software) los posibles valores atípicos.

El diseñador gráfico, también llamado gráfico Q-Q, es un gráfico de dispersión que le permite comparar las cuantales de la variable observada con las de una distribución normal. Si la variable tiene una distribución normal, los puntos estarán cerca de la línea que indica la diagonal.

Una curva normal tiene índices de asimetría nulos y curioso. Entonces, si la variable que está analizando tiene valores muy altos, en valor absoluto, de estos índices significa que seguramente la distribución de esa variable no será normal.

Entre las pruebas más utilizadas para verificar si una distribución es aproximada a una normal, hay:

  • Gráficos, como el histograma, el diagrama de caja o el diseñador gráfico del cuantili
  • Índices descriptivos, como asimetría y curiosidad
  • Pruebas normales, como Shapiro-Wilk o Kolmogorov-Smnnev
  • Shapiro-Wilk, que es preferible para muestras pequeñas
  • ¿Cómo determinar la normalidad de los datos?

    En estadísticas, las pruebas de normalidad se utilizan para determinar si un conjunto de datos se modela para la distribución normal. Muchas funciones estadísticas requieren que una distribución sea normal o casi normal. Existen métodos gráficos y estadísticos para evaluar la normalidad:

    • Los métodos gráficos incluyen el histograma y el gráfico de normalidad
    • Estadísticamente, se pueden usar dos medidas numéricas de forma (asimetría y exceso de curtosis) para evaluar la normalidad. Si la asimetría no está cerca de cero, entonces su conjunto de datos no se distribuye normalmente.

    En estadísticas, la asimetría es una medida de la asimetría de la distribución de probabilidad de una variable aleatoria sobre su media. En otras palabras, la asimetría te dice la cantidad y dirección de sesgo (salida de la simetría horizontal). El valor de asimetría puede ser positivo o negativo, o incluso indefinido. Si la asimetría es 0, los datos son perfectamente simétricos, aunque es bastante poco probable para los datos del mundo real. Como regla general:

    • Los métodos gráficos incluyen el histograma y el gráfico de normalidad
    • Estadísticamente, se pueden usar dos medidas numéricas de forma (asimetría y exceso de curtosis) para evaluar la normalidad. Si la asimetría no está cerca de cero, entonces su conjunto de datos no se distribuye normalmente.
  • Si la asimetría es inferior a -1 o mayor que 1, la distribución es muy sesgada.
  • Si la asimetría está entre -1 y -0.5 o entre 0.5 y 1, la distribución está moderadamente sesgada.
  • Si la asimetría está entre -0.5 y 0.5, la distribución es aproximadamente simétrica.
  • La curtosis le dice la altura y la nitidez del pico central, en relación con la de una curva de campana estándar.

    ¿Cómo saber si los datos se ajustan a una distribución normal?

    La distribución de datos significa la forma en que se extienden los datos. Este artículo habla sobre algunos conceptos esenciales de la distribución normal:

    • Cómo medir la normalidad
    • Formas de transformar un conjunto de datos para que se ajuste a la distribución de clase normal
    • Cómo usar la distribución normal para mostrar fenómenos distribuidos naturalmente y proporcionar información estadística

    Supongamos que pertenece al campo de las estadísticas. En ese caso, usted sabe cuán vital es la distribución de datos porque siempre tomamos una muestra de una población donde no tiene idea de la distribución completa. Como resultado, la distribución de nuestra muestra podría limitar las técnicas estadísticas disponibles para nosotros.

    Al observar la distribución normal, es una distribución de probabilidad continua percibida con frecuencia.

    Cuando una base de datos cumple con la distribución normal, puede emplear otras técnicas para explorar más los datos.

    • Cómo medir la normalidad
    • Formas de transformar un conjunto de datos para que se ajuste a la distribución de clase normal
    • Cómo usar la distribución normal para mostrar fenómenos distribuidos naturalmente y proporcionar información estadística
  • Conocimiento sobre el porcentaje de datos en cada desviación estándar
  • Regresión de mínimos cuadrados lineales
  • Inferencia basada en la media de la muestra
  • En algunos casos, puede ser beneficioso cambiar un conjunto de datos sesgado para observar la distribución normal. Será más relevante cuando sus datos generalmente se distribuyan por alguna distorsión.

    El gráfico anterior tiene asimetría negativa. Eso significa que la cola de la distribución es más larga en el lado izquierdo. Lo contradictorio es que la mayoría de los puntos de datos están agrupados en el lado derecho. Asegúrese de que no se confunda con la asimetría correcta o positiva que podría representar por la imagen de este espejo de este gráfico.

    ¿Cómo se interpreta la prueba de normalidad?

    Las pruebas de normalidad informan un valor p. Para comprender cualquier valor de P, debe conocer la hipótesis nula. En este caso, la hipótesis nula es que todos los valores fueron muestreados de una población que sigue una distribución gaussiana.

    Si esa hipótesis nula fuera cierta, ¿cuál es la posibilidad de que una muestra aleatoria de datos se desvíe del ideal gaussiano tanto como estos datos?

    Prism también utiliza el corte de 0.05 tradicional para responder la pregunta si los datos aprobaron la prueba de normalidad. Si el valor p es mayor que 0.05, la respuesta es sí. Si el valor p es menor o igual a 0.05, la respuesta es No.

    Todo lo que puede decir es que los datos no son inconsistentes con una distribución gaussiana. Una prueba de normalidad no puede probar que los datos se tomaron muestras de una distribución gaussiana. Todo lo que puede hacer la prueba de normalidad es demostrar que la desviación del ideal gaussiano no es más de lo que esperaría ver con el azar solo. Con grandes conjuntos de datos, esto es tranquilizador. Con conjuntos de datos más pequeños, las pruebas de normalidad no tienen mucha potencia para detectar desviaciones modestas del ideal gaussiano.

    La hipótesis nula es que los datos se muestrean de una distribución gaussiana. Si el valor de P es lo suficientemente pequeño, rechaza esa hipótesis nula y, por lo tanto, acepta la hipótesis alternativa de que los datos no se muestrean de una población gaussiana. La distribución podría estar cerca del gaussiano (con grandes conjuntos de datos) o muy lejos. La prueba de normalidad no le dice nada sobre las distribuciones alternativas.

    ¿Cómo se interpreta la prueba de normalidad de Kolmogorov?

    • La prueba de dos muestras de Kolmogorov-Smirnov es una prueba no paramétrica que compara las distribuciones acumulativas de dos conjuntos de datos (1,2).

    • La prueba no es paramétrica. No supone que los datos se muestrean a partir de distribuciones gaussianas (o cualquier otra distribución definida).

    • Los resultados no cambiarán si transforma todos los valores en logaritmos o recíprocos o cualquier transformación. La prueba de KS informa la diferencia máxima entre las dos distribuciones acumulativas, y calcula un valor de P de eso y los tamaños de muestra. Una transformación se extenderá (incluso se reorganizará si elige una transformación extraña) el eje x de la distribución de frecuencia, pero no puede cambiar la distancia máxima entre dos distribuciones de frecuencia.

    • La conversión de todos los valores a sus filas tampoco cambiaría la diferencia máxima entre las distribuciones de frecuencia acumulativa (páginas 35-36 de Lehmann, referencia 2). Por lo tanto, aunque la prueba analiza los datos reales, es equivalente a un análisis de rangos. Por lo tanto, la prueba es bastante robusta para los valores atípicos (como la prueba de Mann-Whitney).

    • La hipótesis nula es que ambos grupos fueron muestreados de poblaciones con distribuciones idénticas. Prueba cualquier violación de esa hipótesis nula: diferentes medianas, diferentes variaciones o diferentes distribuciones.

    • Debido a que prueba más desviaciones de la hipótesis nula que la prueba de Mann-Whitney, tiene menos poder para detectar un cambio en la mediana pero más poder para detectar cambios en la forma de las distribuciones (Lehmann, página 39).

    ¿Cómo interpretar la prueba de normalidad de Shapiro Wilk?

    Una prueba de Shapiro-Wilk con una P> 0.05 no significa que la variable normalmente se distribuya, solo significa que no puede rechazar la hipótesis nula que establece que la variable normalmente se distribuye.

    Es por eso que en el ejemplo anterior, donde informamos una prueba de Shapiro-Wilk con una P> 0.05, usamos las palabras: «La prueba de Shapiro-Wilk no mostró evidencia de no normalidad».

    Así que tenga en cuenta las interpretaciones incorrectas como las siguientes:

    • «La prueba Shapiro-Wilk indica que la variable tiene una distribución normal».
    • «La suposición de normalidad se verificó utilizando la prueba de Shapiro-Wilk».
    • «La normalidad de los datos fue confirmada por una prueba de Shapiro-Wilk».
    • «La distribución de la variable se determinó utilizando la prueba Shapiro-Wilk».

    Un tamaño de muestra lo suficientemente grande hará que la prueba de Shapiro-Wilk detecte la desviación más pequeña de la normalidad, en este caso el valor p será <0.05 incluso si la variable está, de hecho, normalmente distribuida. Por el contrario, un tamaño de muestra muy pequeño reducirá el poder estadístico de la prueba de Shapiro-Wilk para rechazar la hipótesis nula, en este caso el valor p será ≥ 0.05 incluso si los datos claramente no provienen de una distribución normal.

    Por estas razones, muchos analistas de datos prefieren evaluar la normalidad visualmente y/o usar el sentido común, ya que a veces la forma de una distribución se puede decidir teóricamente, especialmente si la variable tiene algunos límites naturales. Por ejemplo, la «edad» y el «recuento bacteriano» no pueden tener valores inferiores a cero, sin embargo, pueden tener un límite superior muy alto aunque improbable (es decir, una cola derecha). Por lo tanto, estas variables deben gobernarse como siguiendo distribuciones no normales.

    ¿Qué es normalidad y para qué se usa?

    La normalidad es una medida de concentración que es igual al peso equivalente de Gram del soluto por litro de solución. El peso equivalente de Gram es una medida de la capacidad reactiva de una molécula*. La unidad de normalidad es la ecuación/l. «N» es el símbolo utilizado para denotar la normalidad.

    Por ejemplo, 1M de cloruro de hidrógeno da 1M de iones de hidrógeno y 1M de iones de cloruro en la solución. 1M de iones de hidrógeno es igual a un equivalente de iones de hidrógeno. Por lo tanto, 1M HCl es lo mismo que 1N HCl, pero cuando tomamos ácido sulfúrico, 1M de ácidos sulfúricos da 2M de iones de hidrógeno en la solución. Por lo tanto, la normalidad de los iones de hidrógeno será 2N para una solución de ácido sulfúrico.

    Para una mayor comprensión de la normalidad, tomaremos una solución de cloruro de calcio. Para los iones de cloruro, la normalidad es 2n porque 1M de cloruro de calcio produce 2 m de iones de cloruro. Para el calcio, la valencia es +2. Por lo tanto, es como si el calcio pueda tener lugar de dos iones de hidrógeno. Por lo tanto, su normalidad también es 2.

    Puede convertir de la molaridad (M) a la normalidad (N) utilizando la siguiente ecuación:

    Para ilustrar más, la molaridad y la normalidad de algunos ácidos y bases se dan a continuación:

    *El peso equivalente de Gram está determinado por la cantidad de un ion que reacciona, lo que podría cambiar según la reacción. La normalidad no es tan sencilla, ya que tendrá diferentes significados dependiendo de lo que esté tratando:

    • En la química-base ácida, la normalidad se usa para expresar la concentración de protones (H+) o iones de hidróxido (OH−) en una solución.

    ¿Qué es la normalidad y cómo se expresa?

    La normalidad expresa la concentración en términos de los equivalentes de una especie química que reaccionan estequiométricamente con otra especie química. Tenga en cuenta que esta definición hace un equivalente y, por lo tanto, normalidad, una función de la reacción química. Aunque una solución de H2SO4 tiene una sola molaridad, su normalidad depende de su reacción.

    Definimos el número de equivalentes, N, utilizando una unidad de reacción, que es la parte de una especie química que participa en la reacción química. En una reacción de precipitación, por ejemplo, la unidad de reacción es la carga del catión o el anión que participa en la reacción; Así, para la reacción

    [ ce {pb^{2 +}} (aq) + 2 ce {i-} (aq) ce {<=>} ce {pbi2} (s) nonumber ]

    n = 2 para pb2+ y n = 1 para i–. En una reacción ácida -base, la unidad de reacción es el número de iones H+ que dona un ácido o que una base acepta. Para la reacción entre el ácido sulfúrico y el amoníaco

    N = 2 para H2SO4 porque el ácido sulfúrico dona dos protones, y n = 1 para NH3 porque cada amoníaco acepta un protón. Para una reacción de complejación, la unidad de reacción es el número de pares de electrones que el metal acepta o que el ligando dona. En la reacción entre Ag+ y NH3

    N = 2 para Ag+ porque el ion plateado acepta dos pares de electrones, y n = 1 para NH3 porque cada amoníaco tiene un par de electrones para donar. Finalmente, en una reacción de oxidación -reducción, la unidad de reacción es el número de electrones liberados por el agente reductor o aceptado por el agente oxidante; Así, para la reacción

    ¿Que entiende usted por normalidad?

    La normalidad de una solución es el gramo de peso equivalente de un soluto litro de solución. También se puede llamar concentración equivalente. Está indicado por el símbolo N, EQ/L o MEQ/L (= 0.001 N) para las unidades de concentración. Por ejemplo, la concentración de una solución de ácido clorhídrico se puede expresar en HCl 0.1 N. Un gramo equivalente o un peso equivalente es una medida de la capacidad reactiva de una especie química dada (ion, molécula, etc.). El valor equivalente se determina a partir del peso molecular y la valencia de las especies químicas. La normalidad es la única unidad de concentración que depende de la reacción.

    • La normalidad es una unidad de concentración de una solución química expresada en gramo de peso equivalente del soluto por litro de solución. Se debe usar un factor de equivalencia definido para expresar la concentración.
    • Las unidades de normalidad actuales incluyen N, Eq/L o MEQ/L.
    • La normalidad es la única unidad de concentración química que depende de la reacción química estudiada.
    • La normalidad no es la unidad de concentración más común y su uso no es apropiado para todas las soluciones químicas. Las situaciones típicas en las que puede usar la normalidad incluyen química-base ácida, reacciones redox o reacciones de precipitación. Para la mayoría de las otras situaciones, la molaridad o la molalidad son mejores opciones para las unidades.

    La forma más fácil de encontrar la normalidad es la molaridad. Todo lo que necesita saber es cuántos lunares de iones se disocian. Por ejemplo, un ácido sulfúrico 1 M (H 2 SO 4) es 2 N para las reacciones ácido-base porque cada mol de ácido sulfúrico proporciona 2 moles de iones H +.

    Una normal es un gramo equivalente a un soluto por litro de solución. El ácido hipplandio es un ácido fuerte que se disocia completamente en agua, una solución de HCl 1 N también sería 1 N para H + o Cl-iones para reacciones ácidas.

    Encuentre la normalidad de 0,321 g de carbonato de sodio en una solución de 250 ml.

    Artículos Relacionados:

    Más posts relacionados:

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *