La Escala de Estrés Percibido de Cohen et al. (1983) es una de las más empleadas para medir el estrés. Sus propiedades psicométricas se han estudiado con muestras de diferentes países, aunque no hay total acuerdo sobre su dimensionalidad. Además, son escasos los estudios que emplean la Teoría de Respuesta al Ítem (TRI). A partir de la necesidad de obtener evidencia sobre las propiedades psicométricas de la escala (versión extensa y breve) en nuestro contexto, analizamos la validez estructural y la precisión de las medidas desde la Teoría Clásica de los Tests (TCT) y la TRI en una muestra de ciudadanos de Córdoba, Argentina.
Material y métodosParticiparon 279 personas (M=36.61años, DS=13.97). Se empleó la versión en español de la Escala de Estrés Percibido.
ResultadosEl análisis factorial confirmatorio evidenció que el modelo de dos factores correlacionados y el modelo bifactorial mostraban ajustes globales adecuados en las dos versiones, aunque en el bifactorial algunos ítems mostraron cargas no significativas. El análisis de consistencia interna evidenció índices adecuados en ambas versiones. Los resultados derivados de la TRI indican que los ítems de las dos dimensiones de la escala se ajustan adecuadamente a un modelo de respuesta graduada, los parámetros estimados muestran que los ítems estiman un amplio rango de valores de los rasgos latentes y que discriminan entre personas con distintos niveles de rasgo. A su vez, se observaron elevadas correlaciones entre los estadísticos derivados de la TCT y la TRI.
ConclusionesLa evidencia obtenida convierte a la escala en un instrumento útil y confiable para ser utilizada en nuestro contexto.
The Perceived Stress Scale (Cohen et al., 1983) (PSS) is one of the scales most frequently used to measure stress. Its psychometric properties have been studied with samples from different countries, although there is no complete agreement on its dimensionality. In addition, few studies have used IRT. Taking into account the need to obtain evidence on the psychometric properties of the scale (extended and short version) in our context, we analyzed the structural validity and precision of the measurements from CTT and IRT in a sample of citizens from Córdoba, Argentina.
Materials and methodParticipated 279 citizens (n=279, M=36.61 years old, SD=13.97). The Spanish version of the Perceived Stress Scales was used.
ResultsConfirmatory factor analysis showed that the model of two correlated factors and the bifactor model showed adequate global adjustments in both versions of the PSS, although in the second one some items showed non-significant loads. The analysis of internal consistency showed adequate indexes in both versions. The results derived from the IRT indicate that the items of the two dimensions of the scale fit appropriately to a graduated response model, the estimated parameters show that the items estimate a wide range of values of the latent traits and that they discriminate between people with different levels of trait. In turn, high correlations between statistical derived from CTT and IRT were observed.
ConclusionsThe evidence obtained makes the scale a useful and reliable instrument to be used in our context.
El estrés ha sido conceptualizado como el grado en que una situación puede ser valorada como incontrolable, impredecible y agobiante (Baik et al., 2019; Cohen, Kamark y Mermelstein, 1983; Nielsen et al., 2016). Incluso se ha definido como una respuesta ante una situación temida (Barbosa-Leiker et al., 2012) que sobrepasa los recursos de afrontamiento de una persona (González Ramírez y Landero Hernández, 2007) e impacta de forma negativa sobre la salud (Cázares de León y Moral de la Rubia, 2016) poniendo en funcionamiento procesos de regulación (Faro, 2015).
Uno de los cuestionarios más utilizadas para evaluar el estrés es la Escala de Estrés Percibido (Perceived Stress Scale [PSS]), propuesta por Cohen et al. (1983). La PSS cuenta con varias versiones, entre las que destacan la versión original, compuesta por 14 ítems (PSS-14), y una versión reducida de 10 ítems (PSS-10). Algunos estudios han encontrado que la versión de 10 ítems posee mejores propiedades psicométricas en comparación con la versión de 14 ítems debido a que la versión extensa contiene 4 ítems que poseen escasa carga factorial (p.ej., Klein et al., 2016; Nordin y Nordin, 2013; Taylor, 2015). Además, existe evidencia que indica que la PSS-10 ha sido usada ampliamente en contextos de investigación clínica y epidemiológica (p.ej., Baik et al., 2019). Su uso extensivo en distintas regiones del globo ha dado lugar a traducciones de la escala en distintos idiomas (p.ej., inglés, español, portugués). A su vez, sus propiedades psicométricas (tanto de la PSS-14 y como de la PSS-10) se han estudiado con muestras de diferentes países (p.ej., Estados Unidos, España, Dinamarca, Turquía, Colombia y Brasil). Sin embargo, la confiabilidad y la validez de esta escala no han sido analizadas con muestras de argentinas.
En cuanto a evidencias de validez estructural de la PSS-14, los resultados son dispares. Los autores de la escala original, entre otros, han observado una estructura unidimensional (p.ej., Cohen y Williamson, 1988; Mitchell, Crane y Kim, 2008). No obstante, prima la evidencia de una estructura de dos dimensiones correlacionadas (p.ej., Eklund, Bäckström y Tuvesson, 2014; González Ramírez y Landero Hernández, 2007). Una dimensión comprende ítems referidos al estrés percibido o la incapacidad para manejarlo, mientras que la otra dimensión agrupa ítems referidos a la capacidad de afrontamiento y resiliencia ante el estrés; estos últimos se invierten para generar una puntuación total de estrés autopercibido. Vale señalar que hay diferencias entre los estudios que han hallado un ajuste adecuado de la PSS-14 a una estructura de dos dimensiones correlacionadas. Por ejemplo, Eklund et al. (2014) encontraron que la estructura de la escala presenta buenos índices de ajuste eliminando el ítem 12, mientras que González Ramírez y Landero Hernández (2007) observaron que modificando la redacción del ítem 12 la escala presenta un adecuado ajuste. Ahora bien, algunos autores señalan que el hecho de que las dimensiones se correspondan con la forma en que están escritos los ítems (estrés negativo vs. estrés positivo) lleva a cuestionar la existencia de dos dimensiones, esto es, puede que la redacción de los ítems tenga mayor incidencia en la evidencia estructural que el constructo de estrés percibido en sí (p.ej., González Ramírez y Landero Hernández, 2007). Así, en contextos tanto clínicos como de investigación es más frecuente el uso de una puntuación total de estrés (Perera et al., 2017).
Con respecto a la versión PSS-10, también hay resultados disímiles. Prima la estructura de dos dimensiones, correlacionadas (p.ej., Manzar et al., 2019; Taylor, 2015) o no correlacionadas (p.ej., Klein et al., 2016). Los estudios que han identificado una estructura de dos dimensiones han arribado a ello empleando los mismos 10 ítems y sin necesidad de eliminar ítems. Además, algunos investigadores también han examinado modelos bifactoriales (Denovan, Dagnall, Dhingra y Grogan, 2019; Lee y Jeon, 2019; Michaelides, Christodoulou, Kkeli, Karekla y Panayiotou, 2016; Perera et al., 2017). Por ejemplo, Perera et al. (2017) observaron que en un factor general de estrés percibido cargaron los 10 ítems, mientras que en un factor específico cargaron los 4 ítems escritos en negativo. En cambio, Denovan et al. (2019) y Lee y Jeon, 2019 hallaron un factor general donde cargaron los 10 ítems y dos factores específicos. Los estudios mencionados han encontrado una estructura bifactorial con muestras de distintos países (Austria, Reino Unido y Corea) empleando la misma versión de la PSS-10. Tanto en la versión PSS-14 como PSS-10 se han empleado métodos exploratorios (análisis de componentes principales o análisis factorial exploratorio) o confirmatorios para obtener evidencia de la validez interna y diversos métodos de estimación (principalmente máxima verosimilitud), lo cual dificulta la comparación de la evidencia reportada. Así, en este estudio nos proponemos analizar distintos modelos teóricos de las versiones extensa y breve de la PSS.
Respecto a la consistencia interna de la PSS-14 y de la PSS-10, la escala parece contar con evidencia aceptable. En general, los estudios recurren al uso del coeficiente alfa de Cronbach, reportando valores entre .74 y .91 para la escala total, en sus dos versiones (p.ej., Benítez, d’Anello y Noel, 2013; Faro, 2015; Jiang et al., 2017; Maroufizadeh et al., 2018; Perera et al., 2017). Algunos estudios también han empleado el coeficiente alfa de Cronbach para evaluar la consistencia interna de las subescalas de la PSS-10 (p.ej., Baik et al., 2019). Excepcionalmente, algunos autores (Campo-Arias, Oviedo y Herazo, 2014; Manzar et al., 2019) han empleado el coeficiente omega de McDonald, hallando valores entre .68 y .80 para la PSS-10.
La mayoría de los estudios previos han recurrido a la Teoría Clásica de los Test (TCT) para investigar las propiedades psicométricas de la PSS (Lee, 2012). No obstante, la TCT presenta algunas limitaciones, como la invarianza de las mediciones respecto al instrumento utilizado y la invarianza de las propiedades de los tests en relación con la muestra utilizada (Muñiz, 2010). En cambio, la Teoría de Respuesta al Ítem (TRI) considera la respuesta de los sujetos en cada uno de los ítems y proporciona estadísticos para los ítems, independientes de la muestra e independientes del conjunto de ítems administrado (Barbero, Prieto, Suárez y Costas, 2001). Debido a esto, desde hace unos años se recomienda utilizar la TRI para complementar los análisis realizados a través de la TCT (p.ej., Iraurgi, Lozano, González y Trujols, 2008).
Algunos autores han avanzado en el estudio de las propiedades de la PSS-10 utilizando distintos modelos de TRI. Taylor (2015) aplicó un modelo de respuesta graduada y observó que los datos se ajustan al modelo de dos dimensiones (positiva y negativa). Respecto a los parámetros de los ítems, encontró que las dos dimensiones estiman un amplio rango de valores de los rasgos latentes y discriminan entre los encuestados con diferentes niveles del rasgo latente. En tanto que Nielsen et al. (2016) aplicaron la versión multinomial del modelo de Rasch, específicamente el modelo de crédito parcial no restringido. Los autores encontraron que los datos no se ajustaron al modelo unidimensional, incluso cuando se realizaron modificaciones como eliminación de ítems, exclusión de personas con respuestas extremas y recategorización de las respuestas. Los principales problemas se focalizaron en los ítems redactados positivamente, específicamente en el ítem 4. El análisis factorial confirmatorio (AFC) y posteriores análisis de dimensionalidad de Rasch indicaron la existencia de dos dimensiones. Considerando la bidimensionalidad de la escala, repitieron el análisis de Rasch para las dos dimensiones y encontraron que los datos tampoco se ajustaron al modelo. Cabe señalar que los autores no evaluaron el funcionamiento diferencial de los ítems ni la dependencia local. Mientras que Medvedev et al. (2017) aplicaron el modelo de crédito parcial y observaron un mejor ajuste al utilizar parcelas de ítems que presentaban dependencia local, específicamente las siguientes parcelas: capacidad de afrontamiento (ítems 4, 5, 7 y 8), control sobre eventos externos (ítems 1, 2 y 9) y percepción de impotencia (ítems 3, 6 y 10). Según nuestro conocimiento, a la fecha no existen estudios que analicen las propiedades psicométricas de la PSS-14 desde la TRI y menos aún que analicen las relaciones entre las estimaciones de los parámetros de la TCT y la TRI.
A partir de la necesidad de obtener evidencia sobre las propiedades psicométricas de la PSS-14 y de la PSS-10 en población cordobesa, en este trabajo se analizó la validez estructural y se examinó la precisión de las medidas desde la TCT y la TRI en una muestra de ciudadanos de Córdoba, Argentina. Además, avanzamos en la comparación de estadísticos derivados de la TCT y TRI.
MétodoParticipantesLa muestra estuvo compuesta por 279 personas de 18 a 65años de la ciudad de Córdoba (M=36.61, DS=13.97) de ambos sexos (49.8% varones y 50.2% mujeres). Se utilizó un muestreo polietápico: en una primera etapa se seleccionaron de manera aleatoria fracciones censales y, dentro de cada una, radios censales (Instituto Nacional de Estadísticas y Censos [INDEC], 2010); luego se definieron de manera aleatoria las manzanas en las cuales encuestar dentro de cada radio; en todas las manzanas se siguió un procedimiento sistemático para la selección de los hogares, y en cada hogar se encuestó a una persona dentro del rango etario bajo estudio procurando alcanzar un 50% de cada sexo. El nivel de confianza fue del 95.5%, con ±6% de margen de error. El nivel socioeconómico de los participantes fue: 17.8% marginal y bajo inferior, 23.6% bajo superior, 23.6% medio bajo, 21.5% medio, 13.5% medio alto y alto.
InstrumentosEscala de estrés percibido (Cohen et al., 1983). Se utilizó una versión traducida al español del instrumento original (Remor, 2006). La escala comprende 14ítems que permiten medir en qué medida se evalúan como estresantes distintas situaciones de la vida. Los ítems de la escala se puntúan en una escala tipo Likert de 5 puntos (0=nunca, 4=muy frecuentemente). Los ítems1, 2, 3, 8, 11, 12 y 14 se refieren a estrés percibido, mientras que los ítems4, 5, 6, 7, 9, 10 y 13 se refieren a afrontamiento del estrés percibido. La puntuación de estos últimos ítems se invierte para arrojar una puntuación total. La puntuación directa indica que a mayor puntuación corresponde mayor nivel de estrés percibido. Se realizaron pequeños ajustes en los ítems7, 10, 11, 12 y 13 en pos de mejorar la comprensión de los mismos al contexto local.
Cuestionario de datos sociodemográficos. Se recabó información sobre edad, sexo y variables indicadoras del nivel socioeconómico: nivel educativo, tipo de ocupación, relación entre la cantidad de aportantes del hogar y la cantidad de habitantes (Comisión de Enlace Institucional, AAM-SAIMO-CEIM, 2006).
ProcedimientoLa recolección de datos estuvo a cargo de encuestadores previamente entrenados por una de las investigadoras. Los encuestadores contactaron a las personas en sus hogares y les aplicaron los cuestionarios.
Análisis de datosPrimero se realizó un análisis de casos y variables. Se consideraron casos atípicos univariados como aquellos que presentaban valores Z>±3.29 y atípicos multivariados a un nivel p<.001 (Tabachnick y Fidell, 2007). Valores de asimetría y curtosis en el rango ±1 se consideraron excelentes, y en el rango ±1.5 fueron aceptables (George y Mallery, 2001).
Segundo, se evaluó de manera confirmatoria la estructura subyacente para la PSS-14 y la PSS-10. Se utilizó el método de estimación de media de mínimos cuadrados ponderados y varianza ajustada, método robusto que ajusta mejor datos de naturaleza ordinal. Se consideraron distintos indicadores (siguiendo a Hu y Bentler, 1999, entre paréntesis se muestran los valores que indican un buen ajuste): χ2, índice de Tucker-Lewis (TLI>.95) e índice de ajuste comparativo (CFI>.95), error cuadrático medio de aproximación (RMSEA<.05). Para cada versión de la escala se evaluaron los siguientes modelos: a)un factor; b)dos factores correlacionados: el primer factor contiene ítems referidos a estrés percibido, mientras que el segundo factor comprende ítems que hacen referencia a afrontamiento del estrés percibido; c)dos factores no correlacionados, comprendiendo los mismos ítems que en el modelo b, y d)bifactorial: semejante al modelo c pero, además, todo los ítems cargan sobre un factor común. En cada versión de la escala se interpretaron los coeficientes de regresión estandarizados del modelo que presentó un mejor ajuste. Adicionalmente, se condujeron análisis con el método de estimación de máxima verosimilitud. De estos resultados solo se exponen los índices de ajuste globales en formato de tabla, dejándolos a disposición para quienes pretendan comparar resultados con estudios precedentes, donde el método más utilizado fue ML.
Tercero, se analizó la correlación ítem-total y la consistencia interna a través del coeficiente alfa de Cronbach (Cronbach, 1951). Adicionalmente, se computó el coeficiente omega de McDonald, el cual ofrece una estimación con mayor precisión que el alfa de Cronbach (McDonald, 1970).
Cuarto, se condujeron análisis en el marco de la TRI para la versión PSS-14 y PSS-10. Teniendo en cuenta el formato de respuesta de los ítems y la extensión de la escala se empleó un modelo de respuesta graduada (Graded Response Model [GRM], De Ayala, 2009; Wang y Chen, 2005). Específicamente, se empleó el GRM de Samejima (1969) implementado en el software IRTPRO 4.2. Se consideraron dos supuestos básicos: unidimensionalidad e independencia local. Para el primero se tuvieron en cuenta los resultados de los análisis factoriales confirmatorios, mientras que para el segundo se consideró el estadístico estandarizado χ2 de dependencia local para cada par de ítems (LD, Chen y Thissen, 1997) que brinda el software utilizado; valores <10 indican problemas de dependencia. También se evaluó el ajuste de cada ítem a través del estadístico S-X2 (Orlando y Thissen, 2000), que evalúa el grado de similitud entre las frecuencias de respuestas predichas por el modelo y las empíricas; valores estadísticamente significativos indican que el modelo no ajuste determinado ítem. En este caso se empleó un nivel del 1% (Stone y Zhang, 2003). Posteriormente se evaluaron los parámetros de discriminación y dificultad de los ítems. También se analizaron la función de información de los ítems y del test de cada modelo.
Por último, se analizaron las relaciones entre los estadísticos obtenidos con la aplicación de modelos de la TCT y de la TRI, para lo cual se siguieron los procedimientos empleados por Barbero et al. (2001). Concretamente, se realizaron análisis de correlación entre los siguientes valores o estadísticos: puntaje bruto y valores theta, promedio de cada ítem y parámetros b, y correlación ítem-total corregida e índice de discriminación a.
Los análisis en el marco de la TCT y los análisis de comparación fueron conducidos con los programas estadísticos SPSS 20 (IBM SPSS), MPlus 7 (Muthén y Muthén, 1998-2011) y R 3.5.1 (R Development Core Team, 2018), mientras que los correspondientes a la TRI se realizaron con el programa IRTPRO 4.2, empleándose como soporte Microsoft Excel 2010.
Aspectos éticosA lo largo de toda la investigación se siguieron los lineamientos éticos para la investigación con humanos recomendados por la Asociación Psicológica Americana (APA, 2010) y los aspectos éticos considerados en la legislación local (Código de Ética de la Federación de Psicólogos, 2013). Los participantes brindaron su consentimiento informado de manera oral, tras recibir información sobre las condiciones de anonimato, confidencialidad y voluntariedad de la participación. A su vez, dispusieron de una cuenta de correo electrónico y teléfono de contacto de la principal responsable de la investigación para evacuar cualquier duda o inquietud que tuvieran.
ResultadosAnálisis descriptivoNinguna variable presentó más del 5% de casos perdidos, en tanto que 10 casos tuvieron un valor ausente y un caso dos valores ausentes. La prueba de MCAR de Little arrojó un valor de χ2=70.710, gl=64, p=.264. En base a ello, se optó por reemplazar los valores ausentes por la moda. Como se aprecia en la Tabla 1, casi todas las variables presentaron valores excelentes de asimetría y curtosis.
Estadísticos descriptivos de los ítems de la Escala de Estrés Percibido
Media | DS | Asimetría | Curtosis | |
---|---|---|---|---|
1. En el último mes, ¿con qué frecuencia ha estado afectado por algo que ocurrió inesperadamente? | 2.90 | 1.26 | .08 | −.96 |
2. En el último mes, ¿con qué frecuencia se ha sentido incapaz de controlar las cosas importantes en su vida? | 2.75 | 1.17 | .20 | −.70 |
3. En el último mes, ¿con qué frecuencia se ha sentido nervioso o estresado? | 3.49 | 1.13 | −.40 | −.60 |
4.R En el último mes, ¿con qué frecuencia ha manejado con éxito los pequeños problemas irritantes de la vida? | 2.20 | .78 | .46 | .71 |
5.R En el último mes, ¿con qué frecuencia ha sentido que ha afrontado efectivamente los cambios importantes que han estado ocurriendo en su vida? | 2.34 | .94 | .52 | .30 |
6.R En el último mes, ¿con qué frecuencia ha estado seguro sobre su capacidad para manejar sus problemas personales? | 2.20 | .86 | .66 | .77 |
7.R En el último mes, ¿con qué frecuencia ha sentido que las cosas le salen bien? | 2.39 | .89 | .35 | .13 |
8. En el último mes, ¿con qué frecuencia ha sentido que no podía afrontar todas las cosas que tenía que hacer? | 2.95 | 1.04 | .21 | −.44 |
9.R En el último mes, ¿con qué frecuencia ha podido controlar las dificultades de su vida? | 2.33 | .81 | .68 | .81 |
10.R En el último mes, ¿con que frecuencia ha sentido que tenía todo bajo control? | 2.85 | 1.01 | .32 | −.12 |
11. En el último mes, ¿con qué frecuencia ha estado enojado o molesto porque las cosas que le ocurrieron estaban fuera de su control? | 3.15 | 1.09 | −.09 | −.53 |
12. En el último mes, ¿con qué frecuencia ha pensado sobre las cosas que le quedan por hacer? | 4.00 | .98 | −1.03 | .83 |
13.R En el último mes, ¿con qué frecuencia ha podido controlar su tiempo? | 2.52 | 1.02 | .39 | −.33 |
14. En el último mes, ¿con qué frecuencia ha sentido que las dificultades se acumulan tanto que no puede superarlas? | 2.69 | 1.17 | .33 | −.63 |
R: puntuación inversa.
Los modelos de dos factores correlacionados y bifactorial presentaron ajustes aceptables. En el modelo b los ítems presentaron cargas factoriales superiores a .40, menos el ítem12 (.258), y la correlación entre los factores fue igual a .54 (Fig. 1A), en tanto que en el modelo d, si bien la mayoría de los ítems presentaron cargas superiores a .40 y estadísticamente significativas, algunos ítems mostraron cargas no significativas o muy bajas (factorB: ítems7, 10, 13; factor común: ítems1 y 12) (Fig. 1B).
Versión PSS-10Semejantes resultados se obtuvieron con la versión reducida de la escala (Tabla 2). Los modelos b y d mostraron índices de ajuste globales aceptables. Al inspeccionar los coeficientes de regresión estandarizados del modelo b, se observa que todos los ítems presentan cargas significativas superiores a .40, y la correlación entre los factores es igual a .628 (Fig. 1C), mientras que en el modelo d, bifactorial, algunos ítems del factorA mostraron cargas no significativas o muy bajas (ítems3, 8, 11 y 14) (Fig. 1D).
Índices de ajuste de distintos modelos para la PSS-14 y PSS-10 utilizando WLSMV y ML
Modelo | χ2 | gl | p | CFI | TLI | RMSEA (IC 90%) |
---|---|---|---|---|---|---|
Estimador WLSMV | ||||||
PSS-14 – 1 factor | 419.621 | 77 | <.000 | .767 | .724 | .127 (.115-.139) |
PSS-14 – 2 factores correlacionados | 200.391 | 76 | <.000 | .915 | .899 | .077 (.064-.090) |
PSS-14 – 2 factores no correlacionados | 523.662 | 77 | <.000 | .696 | .641 | .145 (.133-.157) |
PSS-14 – bifactorial | 137.253 | 63 | <.000 | .949 | .927 | .065 (.050-.080) |
PSS-10 – 1 factor | 152.476 | 35 | <.000 | .860 | .819 | .110 (.093-.128) |
PSS-10 – 2 factores correlacionados | 83.575 | 34 | <.000 | .941 | .922 | .073 (.053-.092) |
PSS-10 – 2 factores no correlacionados | 308.659 | 35 | <.000 | .653 | .579 | .168 (.151-.185) |
PSS-10 – bifactorial | 53.890 | 25 | <.000 | .965 | .938 | .065 (.041-.088) |
Estimador ML | ||||||
PSS-14 – 1 factor | 278.769 | 77 | <.000 | .731 | .682 | .097 (.085-.110) |
PSS-14 – 2 factores correlacionados | 148.619 | 76 | <.000 | .903 | .884 | .059 (.045-.073) |
PSS-14 – 2 factores no correlacionados | 196.973 | 77 | <.000 | .840 | .811 | .075 (.062-.088) |
PSS-14 – bifactorial | 108.210 | 63 | <.000 | .940 | .913 | .051 (.034-.067) |
PSS-10 – 1 factor | 120.359 | 35 | <.000 | .845 | .801 | .094 (.076-.112) |
PSS-10 – 2 factores correlacionados | 69.760 | 34 | <.000 | .935 | .914 | .062 (.041-.082) |
PSS-10 – 2 factores no correlacionados | 130.339 | 35 | <.000 | .827 | .778 | .099 (.081-.118) |
PSS-10 – bifactorial | 47.098 | 25 | <.000 | .960 | .928 | .056 (.031-.081) |
Como se aprecia en la Tabla 3, los coeficientes alfa de Cronbach y omega de McDonald fueron muy semejantes y superiores a .70 tanto para la escala total como para cada una de las dimensiones.
Con respecto a la correlación ítem-total corregida, al considerar cada dimensión se observaron valores superiores a .30, a excepción de los ítems12 y 13 de los factores1 y 2, respectivamente. Al considerar todos los ítems, se observó mayor cantidad de ítems con valores inferiores a .30 de correlación ítem-total corregida; concretamente los ítems1, 12 y 13 (Tabla 4).
Correlación ítem-total corregida de los ítems de la PSS-14 y PSS-10
PSS-14 | PSS-10 | |||
---|---|---|---|---|
Factores | Total | Factores | Total | |
Correlación elemento-total corregida | Correlación elemento-total corregida | Correlación elemento-total corregida | Correlación elemento-total corregida | |
estres1 | .376 | .294 | .391 | .34 |
estres2 | .621 | .600 | .63 | .628 |
estres3 | .492 | .477 | .47 | .47 |
estres4 | .489 | .352 | ||
estres5 | .499 | .356 | ||
estres6 | .485 | .403 | .430 | .348 |
estres7 | .498 | .501 | .476 | .471 |
estres8 | .42 | .430 | .422 | .437 |
estres9 | .486 | .435 | .471 | .403 |
estres10 | .445 | .439 | .386 | .389 |
estres11 | .563 | .572 | .557 | .579 |
estres12 | .215 | .120 | ||
estres13 | .226 | .208 | ||
estres14 | .547 | .514 | .571 | .551 |
Tal como se observa en la Tabla 3, los coeficientes alfa de Cronbach y omega de McDonald fueron superiores a .70 para la dimensiónA y la escala total, pero un tanto menor (.66) para la dimensiónB, que contenía 4ítems.
En cuanto a la correlación ítem-total corregida, en todos los casos los valores fueron superiores a .30 (Tabla 4).
Teoría de Respuesta al ÍtemTeniendo en cuenta los resultados de los AFC, tanto para la versión PSS-14 como para la PSS-10 se evaluaron las dimensiones de estrés negativo (A) y de estrés positivo (B) por separado. Los valores del estadístico LD estuvieron en un rango aceptable, lo cual indica que no hay problemas de dependencia. Como se aprecia en la Tabla 5, los valores del estadístico S-χ2 indican un ajuste adecuado para la mayoría de los ítems, siendo la excepción el ítem12 (PSS-14, dimensiónA).
Estadísticos de ajuste de los ítems de las dimensiones A y B de la PSS-14 y PSS-10
PSS-14 | PSS-10 | |||||||
---|---|---|---|---|---|---|---|---|
LD | S-χ2 | gl | p | LD | S-χ2 | gl | p | |
Dimensión A | −.2 a 4.6 | −.2 a 4.6 | ||||||
estres1 | 51.23 | 54 | .5828 | 52.73 | 50 | .3680 | ||
estres2 | 38.87 | 45 | .7285 | 37.03 | 40 | .6056 | ||
estres3 | 57.19 | 47 | .1464 | 51.95 | 44 | .1913 | ||
estres8 | 57.04 | 49 | .2005 | 54.78 | 49 | .2642 | ||
estres11 | 55.29 | 46 | .1635 | 60.79 | 42 | .0303 | ||
estres12 | 78.59 | 48 | .0035 | |||||
estres14 | 54.53 | 46 | .1814 | 38.27 | 42 | .6365 | ||
Dimensión B | −.6 a 6 | 0 a 3.3 | ||||||
estres4 | 31.13 | 27 | .2652 | |||||
estres5 | 28.20 | 33 | .7059 | |||||
estres6 | 36.21 | 30 | .2009 | 37.58 | 21 | .0144 | ||
estres7 | 39.13 | 32 | .1797 | 19.58 | 21 | .5494 | ||
estres9 | 34.76 | 29 | .2118 | 25.19 | 19 | .1539 | ||
estres10 | 44.43 | 40 | .2898 | 32.02 | 23 | .0994 | ||
estres13 | 60.80 | 42 | .0302 |
Nota. LD=estadístico estandarizado de dependencia local; S-χ2=estadístico de ajuste del ítem.
Los parámetros estimados para cada modelo se presentan en la Tabla 6. En la PSS-14, los parámetros de discriminación de los ítems de las dimensionesA yB fueron, en gran parte, superiores a1. La excepción son los ítems1 (a=.97) y12 (a=.56) de la dimensiónA, y el ítem13 de la dimensiónB (a=.61). En la versión PSS-10, todos los ítems de cada dimensión mostraron valores superiores a1 en el parámetro de discriminación, a excepción del ítem1 (a=.99). En cuanto al nivel de dificultad, los valores cubren un amplio rango del continuo −3 (categorías más bajas) a +3 (categorías más altas), aunque algunos valores se encuentran por fuera de ese rango (resaltado en negrita en la Tabla 6). Los ítems12 y 13 de la PSS-14 presentan los valores más extremos.
Estimación de parámetros para cada dimensión de la PSS-14 y PSS-10
PSS-14 | PSS-10 | |||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
a | ee | b1 | ee | b2 | ee | b3 | ee | b4 | ee | bprom | a | ee | b1 | ee | b2 | ee | b3 | ee | b4 | ee | bprom | |
Dimensión A | ||||||||||||||||||||||
estres1 | .97 | (.15) | −1.95 | (.31) | −.54 | (.16) | .95 | (.18) | 2.34 | (.35) | .20 | .99 | (.16) | −1.93 | (.29) | −.53 | (.15) | .94 | (.18) | 2.32 | (.35) | .20 |
estres2 | 2.11 | (.28) | −1.26 | (.14) | −.28 | (.09) | .88 | (.11) | 1.80 | (.18) | .29 | 2.17 | (.30) | −1.24 | (.13) | −.27 | (.08) | .88 | (.11) | 1.78 | (.19) | .29 |
estres3 | 1.40 | (.19) | −2.57 | (.32) | −1.31 | (.18) | −.11 | (.11) | 1.28 | (.17) | −.68 | 1.33 | (.18) | −2.65 | (.33) | −1.35 | (.18) | −.12 | (.11) | 1.31 | (.18) | −.70 |
estres8 | 1.17 | (.17) | −2.71 | (.37) | −.68 | (.15) | 1.02 | (.17) | 2.43 | (.33) | .02 | 1.15 | (.17) | −2.75 | (.37) | −.68 | (.14) | 1.04 | (.17) | 2.46 | (.34) | .02 |
estres11 | 1.84 | (.24) | −1.99 | (.21) | −.86 | (.12) | .49 | (.10) | 1.61 | (.17) | −.19 | 1.80 | (.24) | −2.01 | (.21) | −.87 | (.11) | .50 | (.10) | 1.62 | (.18) | −.19 |
estres12 | .56 | (.14) | −6.73 | (1.69) | −4.39 | (1.06) | −2.23 | (.56) | 1.23 | (.36) | −3.03 | |||||||||||
estres14 | 1.65 | (.21) | −1.40 | (.17) | −.17 | (.10) | 1.04 | (.14) | 1.97 | (.21) | .36 | 1.70 | (.22) | −1.38 | (.15) | −.16 | (.09) | 1.03 | (.14) | 1.94 | (.21) | .36 |
Dimensión B | ||||||||||||||||||||||
estres4 | 1.66 | (.23) | −1.32 | (.17) | .65 | (.11) | 2.66 | (.32) | 3.48 | (.49) | 1.37 | |||||||||||
estres5 | 1.73 | (.23) | −1.24 | (.16) | .33 | (.10) | 1.89 | (.21) | 2.73 | (.33) | .93 | |||||||||||
estres6 | 1.67 | (.23) | −1.19 | (.16) | .66 | (.11) | 2.24 | (.26) | 3.13 | (.40) | 1.21 | 1.60 | (.27) | −1.23 | (.17) | .66 | (.13) | 2.30 | (.31) | 3.20 | (.46) | 1.23 |
estres7 | 1.44 | (.20) | −1.56 | (.21) | .25 | (.11) | 2.12 | (.26) | 3.42 | (.46) | 1.06 | 1.58 | (.27) | −1.49 | (.20) | .22 | (.10) | 2.04 | (.26) | 3.25 | (.46) | 1.01 |
estres9 | 1.52 | (.21) | −1.79 | (.22) | .59 | (.12) | 2.14 | (.25) | 3.47 | (.48) | 1.10 | 1.63 | (.26) | −1.74 | (.21) | .57 | (.12) | 2.09 | (.27) | 3.35 | (.48) | 1.07 |
estres10 | 1.30 | (.19) | −2.44 | (.32) | −.51 | (.14) | 1.32 | (.18) | 2.33 | (.30) | .18 | 1.23 | (.20) | −2.52 | (.36) | −.54 | (.14) | 1.37 | (.21) | 2.44 | (.35) | .19 |
estres13 | .61 | (.14) | −2.95 | (.66) | .19 | (.20) | 2.82 | (.64) | 5.61 | (1.29) | 1.42 |
a: parámetro de discriminación; b: parámetro de dificultad; ee: error estándar.
Se muestran en negrita valores de b superiores a 3.
En la Figura 2 se muestra la función de información de los ítems y del test de cada una de las dimensiones de la PSS-14. Como se aprecia, la dimensiónA muestra un máximo valor de información de 5.45 a un nivel theta=1, con valores relativamente constantes entre −1.5 y 1.5. Los ítems12, 1 y 8 resultaron los menos informativos. La dimensiónB alcanza el máximo de información de 5.33 correspondiente con theta=2.5. En esta dimensión el ítem13 no parece aportar información sobre el rasgo en estudio.
Similares resultados produjeron los análisis en base a la PSS-10 (Fig. 3). El valor de información máximo que alcanza la dimensiónA es 5.38 a un valor de theta=1, y la dimensiónB de 3.68 a theta=2.5. Los ítems1, 8 y 3 (dimensiónA) y 10 (dimensiónB) resultaron casi nada informativos.
Comparación entre estadísticos de la TCT y la TRIAl considerar la PSS-14, el puntaje bruto de la dimensiónA presentó una media de 21.94 (DS=4.95) y la dimensiónB una media de 16.82 (DS=3.90). La correlación con los valores theta fue r=.976 para la dimensiónA y de r=.975 para la dimensiónB (p<.001). Al considerar la PSS-10, el puntaje bruto promedio de la dimensiónA fue 17.94 (DS=4.64) y la dimensiónB fue 9.76 (DS=2.51). En este caso, la correlación con los valores theta fue r=.982 para la dimensión A y r=.985 para la dimensión B (p<.001).
La relación entre los puntajes promedios de los ítems y los índices de dificultad fue estadísticamente significativa en todos los casos; no obstante, la magnitud de la relación fue singular. En la PSS-14, la correlación más alta se observó con el bprom (r=−.954, p<.001), seguida por las correlaciones con los parámetros centrales (b2 y b3) con valores r entre −.944 y −.951 (p<.001), mostrando los b extremos correlaciones más bajas (b1: r=−.798, p=.001; b4: r=−.687, p=.007). Semejantes resultados se obtuvieron con la PSS-10. La correlación con el bprom fue la más alta (r=−.994, p<.001), seguida por las correlaciones con los parámetros centrales (b2 y b3) con valores r entre −.990 y −.962 (p<.001), mientras que los b extremos evidenciaron correlaciones un poco más bajas (b1: r=−.708, p=.022; b4: r=−.875, p=.001).
Con respecto a la relación entre la correlación r ítem-total corregida y el índice de discriminación a, al considerar la PSS-14 se observaron correlaciones positivas tanto para la dimensiónA (r=.983, p<.001) como para la dimensiónB (r=.957, p<.001). Cuando se analizó la PSS-10, solo resultó significativa la relación con la dimensiónA (r=.988, p<.000) pero no con laB (r=.866, p=.134).
DiscusiónEn esta investigación analizamos las propiedades psicométricas de uno de los instrumentos más utilizados para evaluar el estrés, la PSS propuesta por Cohen et al. (1983). Concretamente, examinamos la validez estructural y la confiabilidad de la versión extensa (PSS-14) y reducida (PSS-10) de la escala, evaluamos el desempeño de los ítems y la escala total, y comparamos los valores estimados a partir de la TCT y la TRI.
Los resultados del análisis factorial confirmatorio evidenciaron que el modelo de dos factores correlacionados y el modelo bifactorial mostraban ajustes globales adecuados. En el primer caso, se observaron cargas factoriales adecuadas en gran parte de los ítems (tanto en la versión extensa como en la breve). La correlación entre los factores fue de gran magnitud (r=.54 y .63, versión extensa y breve, respectivamente), lo cual evidencia la presencia de un constructo subyacente a los factores observados. En el caso de los modelos bifactoriales, en ambas versiones de la escala algunos ítems presentaron cargas factoriales no significativas en términos estadísticos. Estos resultados están en consonancia con los hallazgos más frecuentes sobre la dimensionalidad de la escala (ver, p.ej., Manzar et al., 2019; Michaelides et al., 2016; Taylor, 2015). En función de estos resultados, se sugiere emplear la puntuación total de la escala cuando se la vincula con otras variables.
El análisis de consistencia interna arrojó valores alfa de Cronbach adecuados (entre .656 y .789) tanto para la puntuación total como para cada dimensión de la PSS-14 y la PSS-10. Los valores de omega resultaron semejantes aunque un poco mayores (entre .657 y .798), evidenciando una adecuada confiabilidad de la escala. En la PSS-14 los ítems1, 12 y 13 mostraron bajas correlaciones ítem-total corregida. Esto ofrece evidencia adicional sobre las dificultades asociadas a los ítems12 y 13, excluidos en la versión reducida.
Los resultados derivados de la TRI indican que los ítems de las dos dimensiones (estrés negativo y positivo) de la escala (PSS-14 y PSS-10) se ajustan adecuadamente a un modelo de respuesta graduada. Los parámetros estimados muestran que los ítems de cada dimensión estiman un amplio rango de valores de los rasgos latentes y que discriminan, en general, entre personas con distintos niveles del rasgo latente. Una excepción a ello fueron los ítems1 y 12 de la dimensiónA y 13 de la dimensiónB de la PSS-14, que presentaron valores de discriminación bajos. Aunque las dimensionesA y B ofrecen información sobre un amplio rango de los rasgos latentes, las funciones de información de los ítems pusieron nuevamente de manifiesto que algunos ítems resultan escasamente informativos (12, 13, 1, 8 y 10). Cabe destacar que otros autores también han encontrado valores de χ2 que indican un ajuste inadecuado para los ítems (Nielsen et al., 2016) y valores extremos en los análisis de discriminación y función de la información de los ítems (Taylor, 2015). Ahora bien, resulta difícil comparar nuestros resultados con lo observado en estudios previos, ya que han empleado la versión reducida de 10ítems (PSS-10) y diferentes modelos de TRI, como el Modelo de Crédito Parcial no Restringido (Medvedev et al., 2017; Nielsen et al., 2016). Dado que son escasos los estudios que han indagado las propiedades psicométricas de la PSS utilizando TRI (Taylor, 2015), sería positivo contar con nueva evidencia en este sentido.
Con respecto a las relaciones entre los estadísticos obtenidos al aplicar TCT y TRI, los resultados evidenciaron relaciones significativas. En particular, las elevadas relaciones entre los puntajes brutos y theta tienen notoria importancia práctica, ya que se puede recaer en el uso de la suma de las puntuaciones directas para estimar el nivel de estrés percibido de las personas, evitando el cálculo de theta. A pesar de las altas correlaciones observadas en las distintas comparaciones realizadas, vale recordar que la TRI ofrece algunas ventajas, como la invarianza de medición, a diferencia de la TCT.
La interpretación de los resultados de esta investigación no está libre de limitaciones. El método de muestreo utilizado fue probabilístico, lo que garantiza la extensión de estos resultados a la población de referencia (habitantes de Córdoba de 18 a 65años), pero no más allá de ella. No obstante, la PSS tiene gran utilidad clínica (Lee, Chung, Suh y Jung, 2014), aunque en esta investigación no incluimos muestras de ese tipo. Así, futuros estudios podrían obtener evidencia de validez de la PSS utilizando muestras particulares.
En otro orden, vale señalar que en los análisis de TRI solo se consideraron modelos unidimensionales dado que son los más estudiados y para los que el software empleado ofrece mayor información. Sin embargo, teniendo en cuenta que habitualmente se utiliza la puntuación total de la escala (sin discriminar dimensiones), sería positivo avanzar con la aplicación de modelos multidimensionales (Reckase, 2009). Es importante señalar que en este estudio analizamos las propiedades psicométricas de los ítems correspondientes a la versión reducida de 10ítems de la escala, pero a partir de la aplicación de la escala completa. Queda para futuros estudios indagar si la aplicación de la versión abreviada conduce a los mismos resultados aquí reportados. Además, teniendo en cuenta la utilidad práctica de la escala en contextos sanitarios o la posibilidad de aplicarla en situaciones de tiempo limitado (p.ej., entrevistas telefónicas), sería conveniente contar con propiedades psicométricas de la versión de 4ítems (Cohen et al., 1983; Cohen y Williamson, 1988). Adicionalmente, se sugiere avanzar en estudios que arrojen evidencia sobre otros tipos de validez y confiabilidad de la escala.
Más allá de las limitaciones expuestas, a través de este estudio esperamos contribuir a la discusión sobre la dimensionalidad de la escala. Además, se destaca que la PSS evidenció buenas propiedades psicométricas tanto de confiabilidad como de validez en una muestra de población general de la ciudad de Córdoba (Argentina), lo cual la convierte en un instrumento útil y confiable para ser utilizada en distintos ámbitos.
FinanciaciónEl presente trabajo ha sido financiado por la Agencia Nacional de Promoción Científica y Tecnológica (subsidio número PICT2014-1835).
Conflicto de interesesLos autores declaran no tener ningún conflicto de intereses.