Relación entre dos variables de la vida real: la edad y el nivel de educación

La correlación es la asociación estadística entre las dos variables. En otras palabras, mide el grado o grado en que dos entidades diferentes están relacionadas entre sí. Al realizar varias investigaciones, es difícil hacer ciertos experimentos en entornos de laboratorio, en este caso, se realizan estudios de correlación. El investigador no necesita realizar ningún experimento, y él/ella solo debe recopilar los datos observando las relaciones entre la variable dada y luego hacer la interferencia precisa de los datos recopilados. Los estudios correlacionales se utilizan ampliamente en las investigaciones de psicología, ya que varios factores psicológicos como la percepción, la actitud, la motivación, etc. son difíciles de controlar, de ahí la relación entre estos factores o variables se puede atraer con la ayuda de los estudios de correlación. Los datos obtenidos a través de los estudios de correlación se representan en el «dispersión», que también se conoce como diagrama de dispersión, gráfico de dispersión o gráfico de dispersión. Es un tipo de gráfico que representa claramente la asociación entre las dos variables, donde una variable se representa en el eje horizontal y el otro en el eje vertical. Los puntos en este gráfico representan las diferentes mediciones y una línea de tendencia se pueden extraer de estas mediciones si la línea de tendencia no está clara, significa una correlación débil (r está cerca de cero), y si la línea de tendencia es claramente visible, significa fuerte Correlación (R está cerca de 1). Hay tres posibles resultados del estudio de correlación, es decir, la correlación positiva, la correlación negativa y la correlación cero. Discutamos en detalle con ejemplos de correlación de la vida real.

Una correlación cero indica que no existe ninguna relación entre las dos variables. Por ejemplo, no existe la relación entre los paquetes de chips que comió y sus marcas en el último examen. La correlación cero está representada por el «r = 0». Donde «r» es el coeficiente de correlación. El coeficiente de correlación mide la dirección y la resistencia entre las dos variables. Si el valor de R está cerca del +1 y -1, indica que existe una relación lineal fuerte en las variables dadas, y si el valor está cerca de 0, indica una relación débil. La siguiente imagen representa el dispersión de la correlación cero.

Hay cero correlación entre el peso del estudiante y su puntaje en los exámenes, es decir, no se puede analizar los puntajes que una persona obtendrá en cualquier examen conociendo el peso de esa persona.

Hay cero correlación entre la altura de una persona y el salario que él/ella gana, es decir, si conoce la altura de una persona, no puede estimar los ingresos de esa persona.

Hay cero correlación entre la cantidad de té que una persona bebe y su nivel de inteligencia, es decir, no se puede asumir el nivel de inteligencia de una persona conociendo la cantidad de té que bebe.

Hay cero correlación entre el tamaño del zapato de una persona y la cantidad de películas que ha visto, es decir, no se puede analizar la cantidad de películas que una persona ve por año conociendo su tamaño de zapato.

¿Qué tipo de relaciones entre variables conoces?

En esta lección, examinaremos la relación entre las variables de medición; Cómo imaginarlos en diagramas de dispersión y comprender lo que nos dicen esas fotos. El objetivo general es examinar si existe o no una relación (asociación) entre las variables trazadas. En la Lección 6, discutiremos la relación entre diferentes variables categóricas.

Encuentre el valor predicho de y para la elección dada de x en una parcela de ecuación de regresión.
Critique la evidencia de la fuerza de una asociación en estudios de observación.

5.1 – Gráficos para dos variables de medición diferentes

En una lección anterior, aprendimos sobre posibles gráficos para mostrar datos de medición. Estos gráficos incluyeron: diagramas de puntos, pozos, histogramas y cajas verificadas la distribución de una o más muestras de una sola variable de medición y diagramas de dispersión para estudiar dos a la vez (ver Sección 4.3).

Se hicieron las siguientes dos preguntas en una encuesta de 220 estudiantes de Stat 100:

Encuentre el valor predicho de y para la elección dada de x en una parcela de ecuación de regresión.
Critique la evidencia de la fuerza de una asociación en estudios de observación.

¿Cuál es tu altura (pulgadas)?

¿Cuál es tu peso (LBS)?

Observe que tenemos dos variables de medición diferentes. Sería inapropiado colocar estas dos variables en los diagramas de caja de lado a lado porque no tienen las mismas unidades de medición. Comparar la altura con el peso es como comparar manzanas con naranjas. Sin embargo, queremos poner ambas variables en un gráfico para que podamos determinar si hay una asociación (relación) entre ellas. El diagrama de dispersión de estos datos se encuentra en la Figura 5.2.

¿Qué tipo de relaciones existen entre variables?

Las variables pueden estar relacionadas de varias maneras. Algunos de estos pueden describirse matemáticamente. A menudo, una gráfica de dispersión de dos variables puede ayudar a ilustrar el tipo de relación entre ellas. También hay herramientas estadísticas para probar diversas relaciones.

Algunos pares de variables están relacionados positivamente. Esto significa que a medida que aumenta una variable, la otra tiende a subir también. Por ejemplo, la altura y el peso están positivamente relacionados porque las personas más altas tienden a ser más pesadas. Otros pares están relacionados negativamente, lo que significa que a medida que uno cae, el otro tiende a subir. Por ejemplo, el kilometraje de la gasolina y el peso de un automóvil están relacionados negativamente, porque los automóviles más pesados tienden a obtener un kilometraje más bajo.

Dos variables pueden estar relacionadas linealmente. Esto significa que una línea recta puede representar su relación. Por ejemplo, la cantidad de pintura necesaria para pintar una pared está linealmente relacionada con el área de la pared. Otras relaciones no pueden ser representadas por una línea recta. Estos se llaman no lineal. Por ejemplo, la relación entre la altura y el peso en los humanos no es lineal, porque la altura de duplicación generalmente más del peso de dobles. Por ejemplo, un niño puede tener tres pies de altura y pesar 50 libras, pero probablemente ningún adulto de seis pies de altura pesa solo 100 libras.

Las relaciones pueden ser monotónicas o no monotónicas. Una relación monotónica es aquella en la que la relación es positiva o negativa en todos los niveles de las variables. Una relación no monotónica es una en la que no es así. Todos los ejemplos anteriores fueron monotónicos. Un ejemplo de una relación no monotónica es que entre el estrés y el rendimiento. Las personas con una cantidad moderada de estrés funcionan mejor que aquellas con muy poco estrés o aquellas que tienen un gran estrés.

Una relación entre dos variables puede ser fuerte o débil. Si la relación es fuerte, significa que una fórmula matemática relativamente simple para la relación se ajusta muy bien a los datos. Si la relación es débil, entonces esto no es así. Por ejemplo, la relación entre la cantidad de pintura y el tamaño de la pared es muy fuerte. La relación entre altura y peso es más débil.

¿Cómo se llama a la relación entre dos variables?

Los puntos indicados a continuación explican en detalle la diferencia entre correlación y regresión:

Una medida estadística que determina la correlación o asociación de dos cantidades se conoce como correlación. La regresión describe cómo una variable independiente está relacionada numéricamente con la variable dependiente.
La correlación se utiliza para representar la relación lineal entre dos variables. Por el contrario, la regresión se utiliza para adaptar la mejor línea y estimar una variable sobre la base de otra variable.
En correlación, no hay diferencia entre variables dependientes e independientes, es decir, la correlación entre X e Y es similar a Y y X. Por el contrario, la regresión de y en x es diferente de x en y.
La correlación indica la fuerza de la asociación entre las variables. Por el contrario, la regresión refleja el impacto de la variación de las unidades en la variable independiente en la variable dependiente.
La correlación tiene como objetivo encontrar un valor numérico que exprese la relación entre las variables. A diferencia de la regresión cuyo objetivo es predecir los valores de la variable aleatoria sobre la base de los valores de la variable fija.

Con la discusión anterior, está claro que hay una gran diferencia entre estos dos conceptos matemáticos, aunque estos dos se estudian juntos. La correlación se usa cuando el investigador quiere saber si las variables en el estudio están relacionadas o no, en caso afirmativo, cuál es la fuerza de su asociación. El coeficiente de correlación de Pearson se considera la mejor medida de correlación. En el análisis de regresión, se establece una relación funcional entre dos variables para hacer proyecciones futuras en eventos.

¿Cuándo dos variables están relacionadas entre sí y el valor de una de ellas depende del valor que tenga la otra a dicha variable se le llama?

Este capítulo se trata de explorar las asociaciones entre pares de variables en una muestra. Estos se llaman asociaciones bivariadas. Una asociación es cualquier relación entre dos variables que las hace dependientes, es decir, saber que el valor de una variable nos brinda información sobre los posibles valores de la segunda variable. El objetivo principal de este capítulo es mostrar cómo usar estadísticas descriptivas y visualizaciones para explorar asociaciones entre diferentes tipos de variables.

Los estadísticos han ideado varias formas diferentes de cuantificar una asociación entre dos variables numéricas en una muestra. Las medidas comunes buscan calcular algún tipo de coeficiente de correlación. Los términos «asociación» y «correlación» están estrechamente relacionados; Tanto es así que a menudo se usan indistintamente. La correlación estrictamente hablando tiene una definición más estrecha: una correlación se define por una métrica (el «coeficiente de correlación») que cuantifica el grado en que una asociación tiende a un cierto patrón.

La medida de correlación más utilizada es el coeficiente de correlación de Pearson (también llamado coeficiente de correlación de productos de productos de Pearson). El coeficiente de correlación de Pearson es algo llamado covarianza de las dos variables, divididas por el producto de sus desviaciones estándar. La fórmula matemática para el coeficiente de correlación de Pearson aplicado a una muestra es: [
r_ {xy} = frac {1} {n-1} sum limits_ {i = 1}^{n} { frac {x_i- bar {x}} {s_x} frac {y_i- bar {y}} {s_y}}
] Estamos usando (x ) y (y ) aquí para referirnos a cada una de las variables en la muestra. El (r_ {xy} ) denota el coeficiente de correlación, (s_x ) y (s_y ) denota la desviación estándar de cada muestra, ( bar {x} ) y ( bar {y} ) son las medias de muestra, y (n ) es el tamaño de la muestra.

Recuerde, un coeficiente de correlación cuantifica el grado en que una asociación tiende a un determinado patrón. En el caso del coeficiente de correlación de Pearson, el coeficiente está diseñado para resumir la fuerza de una asociación lineal (es decir, «en línea recta»). Volveremos a esta idea en un momento.

El coeficiente de correlación de Pearson toma un valor de 0 si dos variables no están correlacionadas, y un valor de +1 o -1 si están perfectamente relacionados. «Perfectamente relacionado» significa que podemos predecir el valor exacto de una variable dada el conocimiento del otro. Un valor positivo indica que los valores altos en una variable están asociados con valores altos del segundo. Un valor negativo indica que los valores altos de una variable están asociados con valores bajos del segundo. Las palabras «altas» y «bajas» son relativas a la media aritmética.

¿Cómo se le llama a la relación de dependencia entre dos variables?

Para un ejercicio, se me pide que resuelva la «dependencia» de dos variables (conjuntos de datos) utilizando gráficos X-Y. Así que traigo al eje x la variable que inferir que es el predictor y al eje y el que inferio como la respuesta.

¿Cómo se supone que debo inferir si y qué tipo de dependencia hay solo mirar la siguiente trama?

Para mí, parece que hay cierta correlación, que aumentar el MOM_IQ también aumenta Kid_Score, pero que esta correlación no es «limpia», sino que también hay mucha variación. Es decir. En algunos casos, Kid_Score es alto (o más alto de lo que debería) incluso si el MOM_IQ no lo sería.

Entonces, en este caso, ¿dónde golpeo una línea entre «hay una fuerte correlación» y «hay una correlación débil»?

Si está interesado en los diferentes tipos de dependencia, puede usar la correlación de Pearson que evalúa la relación lineal entre dos variables o la correlación de Spearman que evalúa la relación monotónica entre dos variables.

En el caso de que presentó, parece que quiere decir algo sobre la naturaleza de la relación. Para hacerlo, utilizamos la regresión. Si los supuestos de la regresión se mantienen, puede probar la correlación de Pearson y ver si rechaza el nulo que la correlación de Pearson es igual a cero. También puede estimar los coeficientes y probarlos.

En la trama que presentó, parece que hay dependencia, pero no es lineal. Podrías intentar adaptarse a una regresión polinómica.

¿Cuando una variable depende de otra?

La interacción entre las variables independientes en una regresión múltiple ocurre cuando el efecto parcial sobre la variable dependiente de una variable independiente depende de otra variable independiente de regresión.

En otras palabras, queremos cuantificar la relación de dependencia entre las variables independientes cuando una de ellas influye parcialmente en la variable dependiente del modelo.

Queremos estudiar el precio de Skipass (Skipassio) dependiendo de la calidad de la nieve (Neveio) y el nivel de los esquiadores (nivel). Trataremos estas variables cualitativas, como variables ficticias o binarias. Eso significa:

Neveio = calidad de nieve muy escasa => nieve = 0.

nivel = nivel de esquiadores alto => nivel = 1.

Nivel = Nivel de esquiadores Bajo => Nivel = 0.

H.H1 = es el efecto parcial de una excelente calidad de la nieve (nieve = 1) en el registro (pase de esquí), manteniendo constante el nivel de esquiadores (nivel).

El modelo 1 tiene una limitación importante: mantener constante una de las variables ficticias del modelo implica que:

nivel = constante => No distinguimos entre alto nivel (nivel = 1) o bajo (nivelio = 0).

Neveio = constant => No distinguimos entre muy buena calidad (nieve = 1) o muy mala (nieve = 0).

Más allá de esta limitación, podemos cambiar la regresión para que haya una interacción (dependencia) entre variables independientes que puedan diferenciar ambos valores que asume la variable independiente constante.

¿Cuáles son las características necesarias para que una relación entre dos variables sea función?

Los estudiantes ya deben saber que dos puntos determinan una línea. Por lo tanto, graficar una ecuación lineal, de hecho, solo requiere encontrar dos pares de valores y dibujar una línea a través de los puntos que describen. Todos los demás puntos en la línea proporcionarán valores para x e y que satisfagan la ecuación.

Los gráficos de ecuaciones lineales son siempre líneas. Sin embargo, es importante recordar que no todos los puntos de la línea que la ecuación describe será necesariamente una solución al problema que describe la ecuación. Por ejemplo, el problema puede no tener sentido para los números negativos (por ejemplo, si la variable independiente es el tiempo) o números muy grandes (por ejemplo, números superiores a 100 si la variable dependiente es la calificación en clase).

En esta ecuación, para cualquier tasa estable dada, la relación entre la distancia y el tiempo será lineal. Sin embargo, la distancia generalmente se expresa como un número positivo, por lo que la mayoría de los gráficos de esta relación solo mostrarán puntos en el primer cuadrante. Observe que la dirección de la línea en el gráfico a continuación es de abajo hacia la izquierda a la parte superior derecha. Las líneas que tienden en esta dirección tienen pendiente positiva. Una pendiente positiva indica que los valores en ambos ejes aumentan de izquierda a derecha.

En esta ecuación, dado que nunca tendrá una cantidad negativa de agua en el cubo, el gráfico mostrará puntos solo en el primer cuadrante. Observe que la dirección de la línea en este gráfico es superior a la izquierda a la parte inferior derecha. Las líneas que tienden en esta dirección tienen pendiente negativa. Una pendiente negativa indica que los valores en el eje y están disminuyendo a medida que los valores en el eje x están aumentando.

Nuevamente en este gráfico, estamos relacionando valores que solo tienen sentido si son positivos, por lo que mostramos puntos solo en el primer cuadrante. Además, en este caso, dado que ningún polígono tiene menos de 3 lados o ángulos y el número de lados o ángulos de un polígono debe ser un número entero, mostramos el gráfico que comienza en (3,3) e indicamos con una línea discontinua que Los puntos entre los trazados no son relevantes para el problema.

¿Cuáles son las características necesarias para que sea función lineal?

Representar una función lineal con una ecuación, palabras, tabla y un gráfico
Determinar si una función lineal está aumentando, disminuyendo o constante

Al igual que con el crecimiento de una planta de bambú, hay muchas situaciones que implican cambios constantes con el tiempo. Por ejemplo, considere el primer tren comercial Maglev en el mundo, el tren de Maglev de Shanghai. Lleva pasajeros cómodamente para un viaje de 30 kilómetros desde el aeropuerto a la estación de metro en solo 8 minutos. [1]

Una vista del tren Maglev de Shanghai. (Crédito: Rolf Wilhelm Pfennig)

Supongamos que un tren Maglev iba a viajar una larga distancia, y el tren mantiene una velocidad constante de 83 metros por segundo durante un período de tiempo una vez que está a 250 metros de la estación. ¿Cómo podemos analizar la distancia del tren desde la estación en función del tiempo? En esta sección, investigaremos un tipo de función que es útil para este propósito y la usaremos para investigar situaciones del mundo real, como la distancia del tren desde la estación en un momento dado.

La función que describe el movimiento del tren es una función lineal, que se define como una función con una tasa de cambio constante, es decir, un polinomio de grado 1. Hay varias formas de representar una función lineal que incluye forma de palabra, notación de función, tabular forma y forma gráfica. Describiremos el movimiento del tren como una función utilizando cada método.

¿Qué debe tener para que sea una función?

Por ejemplo, el siguiente código define una función simple llamada Square:

functionsquare (número) {número de retorno * número;}

El cuadrado de funciones toma un parámetro, llamado número. La función consiste en una declaración que dice que devuelve el parámetro de la función (es decir, número) multiplicada por sí misma. El retorno de la declaración especifica el valor devuelto por la función:

número de devolución * número;

Los parámetros se pasan esencialmente a las funciones por valor, por lo que si el código dentro del cuerpo de una función asigna un valor completamente nuevo a un parámetro que se pasó a la función, el cambio no se refleja a nivel mundial o en el código que llamó esa función.

Cuando pasa un objeto como parámetro, si la función cambia las propiedades del objeto, ese cambio es visible fuera de la función, como se muestra en el siguiente ejemplo:

Las expresiones de la función son convenientes al pasar una función como argumento a otra función. El siguiente ejemplo muestra una función de mapa que debería recibir una función como primer argumento y una matriz como segundo argumento:

Los argumentos de una función no se limitan a cadenas y números. Puede pasar objetos completos a una función. La función showprops () (definida en trabajar con objetos) es un ejemplo de una función que toma un objeto como argumento.

Una función puede llamarse a sí misma. Por ejemplo, aquí hay una función que calcula los factoriales de forma recursiva:

Hay otras formas de llamar a las funciones. A menudo hay casos en los que una función debe llamarse dinámicamente, o el número de argumentos a una función varía, o en los que el contexto de la llamada de función debe establecerse en un objeto específico determinado en tiempo de ejecución.