Análisis factorial: ejemplos y aplicaciones

El análisis factorial es una forma de tomar una masa de datos y reducirlo a un conjunto de datos más pequeño que sea más manejable y más comprensible. Es una forma de encontrar patrones ocultos, mostrar cómo esos patrones se superponen y muestran qué características se ven en múltiples patrones. También se usa para crear un conjunto de variables para elementos similares en el conjunto (estos conjuntos de variables se llaman dimensiones). Puede ser una herramienta muy útil para conjuntos complejos de datos que involucran estudios psicológicos, estado socioeconómico y otros conceptos involucrados.

Un «factor» es un conjunto de variables observadas que tienen patrones de respuesta similares; Están asociados con una variable oculta (llamada variable de confusión) que no se mide directamente. Los factores se enumeran de acuerdo con las cargas de factores, o cuánta variación en los datos pueden explicar.

  • El análisis de factores exploratorios es si no tiene ninguna idea sobre qué estructura son sus datos o cuántas dimensiones hay en un conjunto de variables.
  • El análisis factorial confirmatorio se utiliza para la verificación siempre que tenga una idea específica sobre qué estructura son sus datos o cuántas dimensiones hay en un conjunto de variables.

No todos los factores son iguales; Algunos factores tienen más peso que otros. En un ejemplo simple, imagine que su banco realiza una encuesta telefónica para la satisfacción del cliente y los resultados muestran las siguientes cargas de factores:

Los factores que afectan más la pregunta (y, por lo tanto, tienen las cargas de factores más altas) están en negrita. Las cargas de factores son similares a los coeficientes de correlación en el sentido de que pueden variar de -1 a 1. Cuanto más cercanos los factores son -1 o 1, cuanto más afectan la variable. Una carga de factor de cero indicaría ningún efecto.

¿Cómo se hace un análisis factorial?

Nota Para los visitantes del sitio web de Rummel: muchos de los análisis estadísticos en este sitio web usan el análisis factorial para dimensionalizar los datos o para descubrir causas o factores subyacentes. Varios de estos se consolidan en la parte del sitio «Dimensiones de Democidio, Poder, Violencia y Naciones». Por lo tanto, este artículo (un resumen del análisis de factores aplicados de Rummel, 1970) puede ser útil para aquellos que deseen comprender mejor este método en asociación con los resultados de democidio y conflicto presentados aquí, o aplicarlo ellos mismos.

Se han propuesto miles de variables para explicar o describir la compleja variedad e interconexiones de las relaciones sociales e internacionales. Quizás se ha sugerido un número igual de hipótesis y teorías que vinculan estas variables.1

Las pocas variables y proposiciones básicas centrales para la comprensión aún no se han determinado. Las dependencias y correlaciones sistemáticas entre estas variables se han trazado solo aproximadamente, si es que lo hacen, y muchas, si no la mayoría, solo se pueden medir en escalas de orden de presencia o rango. Y tomar los datos sobre cualquier variable al valor nominal es hacer cuestiones de validez, confiabilidad y comparabilidad.

Enfrentado con un comportamiento enredado, interdependencias desconocidas, masas de variables cualitativas y cuantitativas, y malos datos, muchos científicos sociales están recurriendo hacia el análisis factorial para descubrir los principales patrones sociales e internacionales.2 El análisis factorial puede manejar simultáneamente más de cien variables, compensando el error aleatorio para el error aleatorio. e invalidez y desenfrenado interrelaciones complejas en sus regularidades principales y distintas.

Sin embargo, el análisis factorial no está exento de costo. Es matemáticamente complicado y implica consideraciones diversas y numerosas en la aplicación. Su vocabulario técnico incluye términos extraños como valores propios, rotación, estructura simple, ortogonal, cargas y comunalidad. Sus resultados generalmente absorben una docena de páginas en un informe determinado, dejando poco espacio para una introducción metodológica o una explicación de los términos. Agregue a esto el hecho de que los estudiantes no suelen aprender análisis factoriales en su capacitación formal, y la suma es el principal costo del análisis factorial: la mayoría de los laicos, los científicos sociales y los responsables políticos encuentran la naturaleza y la importancia de los resultados incomprensibles.

¿Qué es el análisis factorial y para qué sirve?

En estadísticas y psicometría, el análisis factorial es una técnica que permite resaltar la existencia de una estructura de rasgos latentes (en psicometría) o factores o dimensiones (en estadísticas), no medible directamente, dentro de un conjunto de variables directamente observables (a veces también definidos también definidos como indicador o variables instrumentales) que se relacionan con estos rasgos latentes. En el interior, las dimensiones se caracterizan por su propia consistencia teórica, es decir, los factores no se limitan a representar la existencia de una asociación estadística entre las variables, pero también deben ser interpretables desde un punto de vista científico-racional.

El análisis factorial se puede realizar tanto para fines exploratorios (EFA, análisis de factores de explicación) como para la confirmación (CFA, análisis de factores de confinería): en el primer caso, los factores se extrapolan a partir de los datos, mientras que en el segundo es el investigador a Ponga las restricciones en su modelo y para verificar si este modelo es consistente con los datos observados, es decir, en términos estadísticos, si muestra un ajuste adecuado para los datos [1]. Las técnicas utilizadas para EFA y CFA son muy diferentes, en primer lugar, desde el punto de vista de los propósitos ilustrados anteriormente y, en segundo lugar, para el tipo de modelado matemático adoptado. En general, sin embargo, se puede decir que estas técnicas recurren a la búsqueda de los «puntos comunes» de las mediciones recolectadas, aunque desde diferentes perspectivas.

En el caso de la EFA, a partir de la matriz de correlación o varianza y covarianza, los factores se llevan a cabo a través de diversas técnicas. Entre los más utilizados se encuentran el método de los factores principales, la factorización para los componentes principales, la estimación de la verosimilitud máxima; La elección del método más apropiado depende de varios criterios estadísticos, metodológicos e interpretativos. Cualquier método extraerá varios factores igual al número n { muestra de las variables medidas, pero solo será necesaria una parte de ellos. La elección del número de factores a considerar en la solución factorial se puede llevar a cabo de acuerdo con diferentes criterios, entre los cuales debe recordarse en particular:

  • El criterio de Kaiser, según el cual se consideran todos los factores cuyo valor propio es más alto o igual a 1 [3];
  • El criterio de Cattell, o el análisis de la gráfica de scree, que establece el número de factores por gráficos (la gráfica de scree representa los auto -entradas en orden y las dimensiones, gradualmente desde el primero, en la abscisa) buscar el punto de flexión de el gráfico [3];
  • El análisis paralelo, que consiste sustancialmente en el análisis de una «parcela de doble scree» donde se representan las auto -cobras de los factores determinados por EFA y el mismo número de factores aleatorios. El número de dimensiones a considerar se establece buscando cuál es el tamaño donde las auto -entradas «reales» se vuelven más pequeñas que las «aleatorias» [4].

Es útil recordar, aclarar lo que se ha dicho, que los GNAR se relacionan con la proporción de variabilidad «explicada» por el factor y que toman los valores descendentes a medida que el primer factor se mueve hacia el final.

¿Qué es el análisis factorial en psicologia?

Típicamente, el objetivo del análisis factorial exploratorio (EFA) es permitir que los datos determinen las interrelaciones entre un conjunto de variables. Aunque un investigador que usa EFA puede tener una teoría que relacione las variables entre sí, hay relativamente pocas restricciones en el modelo de factor básico en un EFA. Este tipo de análisis ha sido útil en el desarrollo de la teoría y el debate durante más de un siglo.

El análisis de factores exploratorios es particularmente apropiado en las primeras etapas del desarrollo de la teoría y en las primeras etapas del desarrollo de escala o prueba. Primero, EFA es útil en la reducción de datos cuando las interrelaciones entre las variables no se especifican de antemano. Un investigador que usa EFA utiliza el razonamiento inductivo tomando una serie de observaciones y el desarrollo de la teoría de esas observaciones. En el ejemplo de las características de alto rendimiento de los empleados, seis variables de personalidad se redujeron en última instancia a dos factores. Para análisis posteriores, entonces, solo se deben discutir dos variables en lugar de las seis variables originales. La reducción de datos es particularmente útil para aliviar las preocupaciones de múltiples colinealidad (correlaciones que son demasiado altas) entre un conjunto de predictores. Un segundo beneficio de EFA es la capacidad de detectar un factor general. Cuando se analizan varias pruebas de capacidad cognitiva específicas, un factor general tiende a surgir, junto con varios factores específicos. En la evaluación de la inteligencia, por ejemplo, todas las pruebas de habilidad se correlacionan hasta cierto punto con el factor general de inteligencia, o G.

Finalmente, la EFA es particularmente útil en el desarrollo de escala o prueba porque permite al investigador determinar la dimensionalidad de la prueba y detectar las cargas transversales (correlaciones de variables con más de un factor). Las cargas cruzadas generalmente no son deseables. En el desarrollo de la escala, es ventajoso tener elementos relacionados con solo un factor. Para el ejemplo anterior, las tres variables que representan la conciencia no se cargan en intelecto y viceversa.

El objetivo del análisis factorial confirmatorio (CFA) es probar hipótesis derivadas teóricamente dado un conjunto de datos. El modelo de factor básico de la ecuación 1 sigue siendo relevante, pero se imponen ciertas restricciones dado el modelo teórico particular que se está probando. Por ejemplo, del ejemplo anterior, uno podría usar CFA para imponer restricciones al patrón de factor para que no se permitan cargaciones transversales. Desarrollado durante la década de 1960, CFA es un desarrollo estadístico más nuevo que EFA (desarrollado en 1904).

¿Qué es el análisis factorial en psicología?

El análisis factorial confirmatorio o el CFA se usa para confirmar una estructura factorial apropiada para un instrumento. Mientras que EFA proporciona herramientas para explorar la estructura de factores, no nos permite modificar características específicas de nuestro modelo más allá del número de factores. Además, EFA no admite formalmente la prueba del ajuste del modelo o la significación estadística en nuestros resultados. CFA extiende EFA al proporcionar un marco para proponer un modelo de medición específico, ajustar el modelo y luego probar estadísticamente para la idoneidad o precisión del modelo dado nuestro instrumento y datos.

Tenga en cuenta que el CFA cae dentro de una clase mucho más amplia y general de métodos de modelado de ecuaciones estructurales (SEM). Otras aplicaciones de SEM incluyen el análisis de ruta, el modelado de regresión multinivel y el modelado de crecimiento latente. Los modelos CFA y SEM se pueden ajustar y analizar en R, pero, dada su complejidad, el software comercial a menudo es preferible, dependiendo del modelo y el tipo de datos utilizados. Para fines de demostración, examinaremos CFA en R utilizando el paquete Lavaan.

Consideremos nuevamente el BDI-II, discutido anteriormente en términos de EFA. Explorar la estructura de factores del instrumento nos da información sobre el número de factores necesarios para capturar adecuadamente ciertos porcentajes de la variabilidad en los puntajes. Una vez más, los resultados indican que dos factores, etiquetados en estudios previos como cognitivos y somáticos, representan aproximadamente una cuarta parte de la varianza de puntaje total. En la trama anterior, estos dos factores claramente se destacan por encima del scree. Pero la pregunta sigue siendo, ¿es correcto un modelo de dos factores? Y, si es así, ¿cuál es la mejor configuración de las cargas de elementos en esos dos factores?

Al final, no hay forma de determinar con certeza que un modelo es correcto para un conjunto e instrumento de datos determinado. En cambio, en CFA, un modelo puede considerarse adecuado o apropiado en función de dos criterios generales. El primero tiene que ver con el poder explicativo del modelo. Podríamos considerar un modelo adecuado cuando excede algún umbral para el porcentaje de variabilidad explicado y, por lo tanto, minimiza de alguna manera la varianza de error o la variabilidad inexplicable. El segundo criterio implica la idoneidad relativa de un modelo dado en comparación con otros modelos competidores. Las comparaciones generalmente se realizan utilizando estimaciones estadísticas del ajuste del modelo, como se discute a continuación.

Artículos Relacionados:

Related Posts

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *