En general, hay dos métodos para evaluar los resultados informados por el paciente: cuestionarios completados por el paciente y entrevistas administradas por el investigador. Debido a que las entrevistas son intensivas en el tiempo y el trabajo, los cuestionarios (también referidos a Assurveys o Instruments) generalmente se prefieren. Los instrumentos suelen ser económicos, prácticos y fáciles de administrar. Dicho esto, estos instrumentos requieren un proceso riguroso de desarrollo e implementación para garantizar que capturen con precisión lo que los investigadores pretenden capturar.
El desarrollo del instrumento es un proceso de varios pasos que comienza determinando qué resultados informados por el paciente desean medir los desarrolladores, luego generando y ensamblando preguntas en un solo instrumento y finalmente realizando un análisis psicométrico (Vickery et al., 2001). La pregunta, o el elemento, el desarrollo idealmente implica aportes desde múltiples perspectivas, como médicos, pacientes, epidemiólogos y psicólogos, y generalmente incluye una revisión de la literatura de las herramientas existentes para identificar si ya existen encuestas validadas en el espacio. Las pruebas piloto iniciales de las encuestas propuestas también se realizan para identificar la legibilidad y la redundancia de la nueva herramienta (Sung et al., 2016).
Las respuestas de los elementos se registran en una escala Likert, en la que varias opciones de respuesta se presentan de manera categórica o una escala analógica visual, donde los pacientes marcan su respuesta a lo largo de un continuo entre dos extremos de un espectro (Voutilainen et al., 2016) . La mayoría de las herramientas de resultados informados por el paciente utilizan escalas Likert debido a la captura de datos más fácil y la simplicidad de responder. Hay varios factores a considerar en el desarrollo de instrumentos. Cada elemento debe escribirse por debajo de un nivel de lectura de octavo grado, libre de abreviaturas y términos complejos, y contener solo una pregunta para garantizar la comprensión del paciente (Paasche-Orlow et al., 2003). En general, existe una compensación entre la amplitud (número de dominios) y la profundidad (número de elementos) de evaluación. Para minimizar la carga del paciente, se debe alcanzar un equilibrio entre los dos, con un posible sesgo hacia la amplitud dada la incertidumbre del impacto de una enfermedad o tratamiento (Ware, 1984).
Tradicionalmente, una vez que se ha creado una herramienta preliminar, sufre un análisis psicométrico para evaluar sus propiedades de medición (Nunnally, 1978; Rothrock et al., 2011). Los instrumentos se prueban para las propiedades psicométricas de confiabilidad y validez. La fiabilidad se refiere a la precisión del instrumento, o la libertad del error de medición. Generalmente se evalúan varias medidas diferentes de confiabilidad. Los dos más comunes son la consistencia interna y la prueba-retest. La confiabilidad de la consistencia interna es el monto del acuerdo interno entre los elementos (Streiner, 2003). Por ejemplo, todos los ítems destinados a medir el estado funcional deben obtener una puntuación de manera similar y correlacionarse altamente. El objetivo es lograr un equilibrio entre la medición precisa de un concepto particular sin demasiados elementos que evalúen el mismo tema. La confiabilidad de consistencia interna se cuantifica con el coeficiente alfa de Cronbach (Cronbach, 1951). Un valor de más de 0.7 indica buena confiabilidad; Sin embargo, si es demasiado alto (> 0.9), el instrumento puede tener una homogeneidad excesiva que sugiere redundancia del elemento. La fiabilidad de Test-Retest representa cómo los resultados reproducibles de un instrumento son con el tiempo (Litwin, 1995). Por lo general, se mide administrando el instrumento al mismo sujeto en un lapso de tiempo relativamente corto, a menudo una cuestión de semanas. El lapso de tiempo debe ser lo suficientemente corto, por lo que es poco probable que cambie la experiencia del paciente, pero el tiempo suficiente para que el instrumento parezca «fresco» para el paciente. La fiabilidad de prueba-retratación se cuantifica utilizando el estadístico del coeficiente de correlación, con más de 0.7 considerado altamente confiable (Litwin, 1995).
Las escalas de acuerdo Likert (pero no la escala de Likert en general) implican un continuo bipolar subyacente. Por ejemplo, el acuerdo con un elemento como «los padres deben recibir cupones de su gobierno estatal para pagar la educación privada de sus hijos» implica apoyo para una posición conservadora y el desacuerdo implica el apoyo a una posición liberal, donde los conservadores y los liberales son los postes de una sola dimensión.
¿Cómo interpretar los resultados de la escala de Likert?
Muchos proyectos de investigación a nivel de posgrado implican distribuir encuestas y analizar los resultados que entran. La escala Likert es una de las métricas más populares para la investigación de actitud. Si está tomando una encuesta de Likert, verá una serie de declaraciones y se le pedirá que indique si está «totalmente en desacuerdo», «en desacuerdo», «un poco en desacuerdo», están «indecisos», «un poco de acuerdo , «» de acuerdo «o» totalmente de acuerdo «. Cualquiera que sea la respuesta que elija, se le asigna un valor de punto, y los investigadores que realizan la encuesta interpretan los resultados.
Asigne cada valor de respuesta un valor de punto, de 1 a 5 o 1 a 7, dependiendo de cuántas respuestas posibles hay. Algunos diseñadores de encuestas no incluyen las opciones «ligeramente» en el lado de acuerdo o en desacuerdo. Los valores comunes para las opciones comienzan con «totalmente en desacuerdo» en 1 punto y «totalmente de acuerdo» en 5 o 7 puntos.
Tabule sus resultados y encuentre el «modo», o el número más frecuente, y la «media» o la respuesta promedio. Si su muestra es lo suficientemente grande, ambas métricas serán valiosas. El modo le dirá la respuesta más común a cada declaración. Y aunque los valores numéricos para cada respuesta no son tan objetivos como los números de conteo serían, la media le dará la respuesta promedio general.
Cree una representación gráfica de las respuestas utilizando un gráfico de barras, dando una columna a cada una de las opciones de respuesta. Bajo el eje horizontal, etiquete cada una de las opciones de respuesta con el valor de punto, y marque las líneas que cruzan el eje vertical con diferentes números: 50, 100, 150, 200 y así sucesivamente. Estos números variarán según el número de encuestados. Elija una escala que se ajuste a todos sus totales de respuesta, pero también mostrará las diferencias entre ellos de manera significativa. Si solo tiene 30 encuestados, y su primer número en el eje es 100, no podrá mostrar diferencias significativas entre las diversas columnas.
¿Cuántos niveles debe tener una escala likert?
De todos los instrumentos de investigación que existen, la escala Likert tiene que ser uno de los más populares. En el mundo del deporte de élite, las escalas Likert juegan un papel destacado en el monitoreo del bienestar. Muchos, si no la mayoría de nuestros clientes, completan o analizan una encuesta de bienestar todos los días.
• Schutz y Rucker escribieron en 1975 que el número de categorías de respuesta tiene poco o ningún efecto en los resultados. Este hallazgo es ciertamente la excepción en la literatura. La mayoría de la literatura afirma inequívocamente que el número de categorías de respuesta realmente importa, pero vale la pena mencionar los resultados de Schutz y Rucker. • Garner (1960) argumentó que tener más categorías de respuesta maximizó la cantidad de información obtenida. En otras palabras, más categorías permiten al investigador discriminar mejor entre los participantes. Sugirió que se obtiene información máxima utilizando más de veinte categorías de respuesta. • Por el contrario, Green y Rao (1970) encontraron que siete categorías de respuesta maximizaron la información obtenida, con poca información adicional obtenida después de siete categorías. • Jones (1968) examinó las preferencias de los encuestados para escalas con dos o siete categorías de respuesta e informó que la escala dicotómica se consideraba menos «precisa», menos «confiable», menos «interesante» y más «ambigua» que la escala de siete puntos . Los encuestados mostraron claramente una preferencia por las escalas de categoría múltiple sobre escalas dicotómicas. • Cicchetti, Showalter y Tyrer (1985) mostraron usando simulaciones de Monte Carlo que la confiabilidad aumentó al comparar escalas de siete puntos con escalas de dos puntos, pero más allá de siete puntos, e incluso hasta 100 categorías de respuesta, no se encontró un aumento en la confiabilidad. Los investigadores concluyeron que ocho, nueve, diez o incluso escalas de 100 puntos no muestran más confiabilidad que una escala de siete puntos. • También utilizando simulaciones, Lissitz y Green (1975) encontraron el mismo efecto al comparar dos, tres, cinco, siete, nueve y escalas de catorce puntos. • Oaster (1989), Finn (1972), Nunnally (1967) y Ramsay (1973) informaron que la confiabilidad se maximiza con escalas de siete puntos. Pero Jenkins y Taber (1977), McKelvie (1978) y Remmers y Ewart (1941) encontraron evidencia de mayor confiabilidad para escalas de cinco puntos. Preston y Colman (2000) encontraron que las escalas con siete, ocho, nueve o diez categorías eran más confiables que las escalas con dos, tres o cuatro categorías. Además, descubrieron que los encuestados preferían la escala de diez puntos, seguido de la escala de siete puntos y la escala de nueve puntos.
La evidencia anterior son los fragmentos que provienen de solo dos revisiones y no son específicas de la ciencia deportiva. No obstante, en mi experiencia, es seguro decir que la literatura dice que las escalas Likert deberían tener entre 5 y 10 puntos de escala.
¿Qué es escala Likert ejemplos?
Una escala Likert es una herramienta psicométrica para medir una actitud en los individuos. Ella toma su nombre del psicólogo estadounidense Likert que lo desarrolló [1]. Consiste en una o más afirmaciones (declaraciones o elementos) para las cuales la persona entrevistada expresa su grado de acuerdo o desacuerdo.
La escala contiene para cada elemento una graduación que generalmente comprende cinco o siete opciones de respuesta que permiten calificar el grado de acuerdo. El texto de las etiquetas es variable, por ejemplo:
- Totalmente de acuerdo
- Correcto
- Ni en desacuerdo ni de acuerdo
- No estar de acuerdo
- en absoluto de acuerdo
Para las escaleras con un número impar de opciones, el nivel central le permite expresar una ausencia de opinión, lo que hace que sea innecesario una modalidad «no sabe». Las escalas con modalidades pares ven la omisión de la modalidad neutral y se dice que son «elección forzada».
Asociamos con cada modalidad de respuesta un número entero de 1 a 5 o -2 a +2 en caso de 5 modalidades. En consecuencia, es posible considerar el procesamiento de datos cuantitativos, ya sea asimilando los datos de tipo de relación o, como precaución, limitándose a su naturaleza ordinal. En el primer caso, podemos calcular, por ejemplo, el promedio (o cualquier otra medida estadística) de las respuestas dadas por la muestra entrevistada.
Un elemento Likert casi nunca se usa solo: la escala está formada por varios elementos y se recomienda, detectar respuestas «gráficas» (todos los puntos alineados), a veces llamados exceso de velocidad [2], d ‘Insertar al menos un artículo invertido. Según el propio Likert [3], «para evitar cualquier error de espacio o tendencia a un responsable estereotipado, parece deseable tener las diferentes declaraciones tan redactadas que aproximadamente la mitad de ellos tienen un extremo de la actitud continuo hacia la izquierda o la parte superior Parte de las alternativas de reacción y la otra mitad tienen el final del continuo de actitud del sábado correspondiente a la parte derecha o inferior de las alternativas de reacción ». Traducción gratuita: «Para evitar cualquier error espacial o tendencia a una respuesta estereotipada, parece deseable que las diferentes declaraciones se formulen de tal manera que alrededor de la mitad de ellas tengan un extremo de la actitud continua correspondiente a la parte izquierda o superior de Las alternativas de respuesta y la otra mitad en el mismo extremo del continuo de actitud correspondiente a la parte derecha o inferior de las alternativas ”.
Artículos Relacionados:
- 5 ejemplos de la escala de Likert para optimizar su encuesta
- La escala de likert permite medir el nivel de satisfacción de una persona con una pregunta.
- Cómo usar la escala de Likert para medir el impacto de tu campaña de marketing
- 10 ejemplos de preguntas de escala Likert para optimizar tu encuesta
