ARTÍCULOS

Análisis factorial confirmatorio del inventario multicultural de la expresión de la ira y hostilidad

Confirmatory factor analysis of the multicultural anger expression and hostility inventory

 

Manolete S. Moscoso*, César Merino-Soto**, Sergio Dominguez-Lara*** Cecilia B. Chau**** y Mary Claux*****

*, **, *** Universidad de San Martín de Porres, Perú

****, ***** Pontificia Universidad Católica del Perú, Perú

*manolete@manoletemoscoso.com mmoscoso@health.usf.edu **sikayax@yahoo.com.ar ***sdominguezmpcs@gmail.com ****cchau@pucp.edu.pe *****mclaux@pucp.edu.pe


RESUMEN

El propósito principal del presente estudio fue verificar la estructura factorial de las dos escalas que componen el Inventario Multicultural de la Expresión de la Ira y Hostilidad desde una perspectiva confirmatoria. Se utilizó el Análisis Factorial Confirmatorio en una muestra de 264 participantes provenientes de una universidad privada de Lima, Perú. El muestreo fue no probabilístico e incluyó estudiantes (25%), personal docente (17.8%) y personal administrativo (57.2%). La confiabilidad del instrumento fue evaluada mediante los modelos congenérico, tau-equivalente y paralelo para cada una de las seis subescalas del instrumento, así como también calculada en base al coeficiente alfa de Cronbach con intervalos de confianza. Resultados: El análisis factorial realizado en la presente muestra peruana identificó cuatro dimensiones para la Escala de la Ira (ira manifiesta, ira contenida, control de la ira manifiesta y control de la ira contenida) y dos factores para la Escala de la Hostilidad (reacción impulsiva a la ira; y temperamento), lo cual replica sustancialmente los resultados de estudios previos realizados en América Latina con muestras hispanoparlantes. El modelo congenérico nos indica un ajuste adecuado para cada una de las subescalas de la ira y hostilidad. En base a los resultados del Análisis Factorial Confirmatorio realizado en el presente estudio, la estructura factorial de ambas escalas del Inventario Multicultural de la Ira y Hostilidad es robusta y demuestra sustancial evidencia empírica de validez de construcción y consistencia interna del instrumento.

Palabras clave: Ira, hostilidad, validez de constructo, análisis factorial, consistencia interna.


ABSTRACT

The main purpose of this study was to verify the factorial structure of the two scales that make up the Multicultural Inventory of Expression of Anger and Hostility from a confirmatory perspective. We performed the Confirmatory Factor Analysis with a non-probability sample of 264 participants from a private university in Lima, Peru. The sampling included university students (25%), faculty members (17.8%) and administrative staff (57.2%). The reliability of the instrument was evaluated using the congeneric, tau-equivalent and parallel models for each of the six subscales of the instrument, as well as calculated based on Cronbach's alpha coefficient with confidence intervals. Results: Factor analysis performed in the present Peruvian sample identified four dimensions for the Anger Expression Scale (Anger-In, Anger-Out, Anger/Control In, and Anger/Control-Out) and two factors for the Hostility Scale (impulsive reaction to anger; and temperament), which substantially verified the factor structure of previous studies conducted in Latin American samples. The congeneric modelindicates an appropriate fit for each of the subscales of anger and hostility. Based on the results of the Confirmatory Factor Analysis performed in the present study, the factorial structure of both scales of the Multicultural Anger Expression and Hostility Inventory is robust and shows substantial empirical evidence of construction validity and internal consistency of the instrument.

Keywords: Anger, hostility, construct validity, factor analysis, internal consistency.


Introducción

La ira y hostilidad son emociones que tienen implicaciones significativas en el área de la salud, así como también en el estudio de la violencia genérica y familiar. Un número elevado de investigaciones científicas han demostrado que la ira y hostilidad contribuyen al desarrollo de la hipertensión arterial y enfermedades cardiacas, especialmente bajo condiciones de estrés crónico (Spielberger y Moscoso, 1995). La ira es una emoción, la cual incluye «sentimientos subjetivos negativos que varían en intensidad desde la experiencia de una mínima irritación o molestia hasta la expresión de rabia intensa» (Moscoso y Spielberger, 1999a). La expresión de la ira es una reacción emocional transitoria causada generalmente por efectos de estrés crónico, actos de injusticia, amenazas, provocación y frustraciones de la vida diaria.

Mientras que la experiencia de la ira puede ser manejada adecuadamente sin requerir atención psicológica, la ira manifiesta, por lo general, incluye alguna forma de respuesta agresiva o violenta. Esta puede manifestarse en forma verbal caracterizada por críticas de carácter negativo, amenazas e insultos, como también a través de agresiones físicas a otras personas y actos violentos. Las consecuencias sociales de la expresión manifiesta de la ira y de hostilidad se reflejan vívidamente en el grave problema de la violencia genérica, lo cual produce un costo social muy elevado para el entorno familiar y de la comunidad en general (Moscoso y Perez-Nieto, 2003; Spielberger, Moscoso y Brunner, 2005). En este contexto, la evaluación clínica de la ira y hostilidad cumple un rol central en cualquier programa de prevención o tratamiento psicológico orientado al manejo adecuado y reducción de esta emoción.

Estudios anteriores relacionados con la medición psicométrica de la ira y hostilidad adaptaron modelos teóricos basados en los conceptos de estado-rasgo, así como también en el control de la ira (Spielberger, 1988). De manera particular, en la región de América Latina y el Caribe se realizaron estudios de adaptación de State-Trait Anger Expression Inventory (STAXI) con el propósito de tener a disposición un instrumento psicométrico de medición de la ira, válido y confiable, y con un gran potencial para ser generalizable multiculturalmente. Dichos estudios permitieron la elaboración y publicación del Inventario Multicultural Latinoamericano de la Expresión de la Ira (ML-STAXI; Moscoso, 2000; Moscoso y Spielberger, 1999b). Estudios posteriores y de revisión empírica nos indican que a pesar de existir un notable consenso general en relación a los postulados teóricos del ML-STAXI, de 44 ítems, existe la necesidad de replicar la estructura factorial de la expresión de la ira y hostilidad en base al Análisis Factorial Confirmatorio (AFC) con la intención de evaluar ciertas discrepancias metodológicas y de medición psicométrica del instrumento (Alcazar, Deffenbacher y Byrne, 2011; Moscoso y Spielberger, 2011).

El propósito principal del presente estudio fue verificar la estructura factorial de las escalas de la expresión de la ira y hostilidad compuestas por 34 ítems, desde una perspectiva confirmatoria, utilizando una muestra peruana de docentes, personal administrativo y estudiantes de una universidad privada de Lima Metropolitana. El segundo objetivo de nuestra investigación estuvo orientado a confirmar la estructura interna de las subescalas del control de la ira y su adecuación psicométrica dentro del instrumento global.

Método

Participantes

La muestra utilizada está compuesta por un total de 264 participantes (120 mujeres, 45.5 %) provenientes de una universidad privada en Lima Metropolitana, de los cuales 151 tenían funciones administrativas (57.2 %), 47 cumplían labor docente (17.8 %) y 66 eran estudiantes (25.0 %). Excepto 4 docentes, el resto de la muestra fue de nacionalidad peruana (268, 98.5 %). La edad varió entre 18 y 70 años (M = 40.3, DE = 13.3). Al respecto, no se detectaron diferencias estadísticas (t 270= 0.459) o prácticas (d = 0.05) entre varones y mujeres. El muestreo utilizado fue no probabilístico. Se obtuvo información demográfica de cada sujeto en relación a edad, ocupación, nacionalidad, género y nivel de educación. Con el propósito de satisfacer el modelo de promedios sujetos/variables (STV) basado en el número de variables que nuestro instrumento contiene, se determinó la necesidad de incluir por lo menos 230 participantes en la muestra (Bryant y Yarnold, 1995).

Instrumento

El Inventario Multicultural Latinoamericano de la Expresión de la Ira y Hostilidad (IMIHOS) utilizado en el presente estudio es un instrumento psicométrico de 34 ítems que está compuesto por dos escalas (Expresión de la ira y Hostilidad) y seis subescalas (Ira manifiesta, Ira contenida, Control de la ira manifiesta, Control de la ira contenida, Reacción impulsiva a la ira y Temperamento). Las dos escalas de ira y hostilidad miden diferencias individuales en la tendencia a: (a) expresar ira hacia otras personas u objetos en el ambiente, (b) experimentar y suprimir la ira, (c) control de la ira manifiesta, (d) control de la ira contenida, (e) características inherentes de hostilidad y (f) reacciones impulsivas de sentimientos de hostilidad. Los ítems del IMIHOS han sido seleccionados con el propósito de evaluar Çla intensidad de la ira como una alteración emocional del comportamiento en el contexto del estrés crónico, el control de la ira, así como también la disposición a experimentar y expresar sentimientos de hostilidad como un rasgo de personalidadÈ (Moscoso, 2000; Moscoso y Spielberger, 2011). Las respuestas a cada ítem presentan puntajes que varían de 1 a 4. Las opciones de respuesta en cada ítem son las siguientes: Casi nunca (1), Algunas veces (2), Frecuentemente (3), Casi siempre (4).

Procedimiento

El instrumento en estudio fue aplicado a una muestra de empleados administrativos, personal docentes y estudiantes de una universidad privada de Lima Metropolitana a través de sus correos electrónicos institucionales o personales. El protocolo de investigación, así como también los cuestionarios de la ira y hostilidad, de depresión y el consentimiento informado fue aprobado por el comité de ética de dicha institución universitaria. Los participantes del estudio fueron informados del propósito de estudio, del carácter voluntario de su participación y del absoluto derecho a abandonar el estudio en caso encontraran alguna objeción en responder a los ítems de las pruebas de autorreporte. Igualmente, los participantes fueron informados acerca de la anonimidad en sus respuestas y participación en el estudio.

Análisis de datos

Los análisis factoriales exploratorios del instrumento original reportados con anterioridad (Moscoso, 2000; Moscoso y Spielberger, 1999a, 1999b) proporcionan la información principal para iniciar un enfoque analítico de la estructura interna desde una perspectiva confirmatoria, respecto de su configuración (número de factores y pertenencia de los ítems a estos), covariación interfactorial e invarianza de los parámetros de los ítems, un procedimiento que se relaciona con el estudio del sesgo de estos.

Previamente al análisis estructural del IMIHOS, se reportan las características descriptivas de los ítems. El análisis de la estructura interna se realizó mediante un análisis factorial confirmatorio con el programa EQS 6.2 (Bentler y Wu, 2012; Brown, 2006). Se utilizó el método de máxima verosimilitud con matrices de correlación policórica, por cuanto los ítems son medidas categóricas y mejor aproximadas a variables continuas con este tipo de estadístico correlacional (Beaducel y Herzberg, 2006; Dominguez, 2014; Lee, Poon y Bentler, 1995). En base al AFC se examinaron varios modelos de medición separadamente, tanto para la escala de la expresión de la ira como también para la escala de hostilidad. En ambas escalas se evaluaron los modelos de dos factores oblicuos (M1 ), el bifactor (M2 ) y el modelo unidimensional (M3 ).

Con el objeto de valorar cada modelo, se utilizaron índices de ajuste como el RMSEA (= .05), CFI (=.95) y la prueba general X2 corregida para atenuar el efecto de la falta de normalidad de las variables, SB-X2 (Satorra y Bentler, 1994). Para examinar el modelo bifactor, se aplicaron también tres índices adicionales: (a) el coeficiente omega (ωh) como una estimación del factor general de saturación de la prueba, es decir, al monto de varianza total que puede ser atribuida al factor general (Zinbarg, Yovel, Revelle y McDonald, 2006); (b) la varianza común explicada (ECV), que se interpreta como el monto de varianza común que se debe al factor general, en el cual un valor = .60 indica que existe poca varianza común entre factores más allá que la perteneciente al factor general (Reise, Scheines, Widaman y Haviland, 2013); (c) el porcentaje de correlaciones no contaminadas (PUC), en este caso, por la multidimensionalidad (Reise et al., 2013).

La validez interna convergente del instrumento fue analizada por medio de la varianza extraída promedio (AVE), considerando como punto de corte .50 con el propósito de argumentar que los ítems representan apropiadamente al constructo (Fornell y Larcker, 1981). La validez interna discriminante se analizó comparando el AVE y el cuadrado de las correlaciones interfactoriales.

El análisis de confiabilidad fue evaluado por consistencia interna con los puntajes observados y las variables latentes. Para este último se eligió el mejor modelo identificado en cada una de las dos escalas del IMIHOS. Preliminarmente, se evaluaron los modelos de medición congenérico, tau-equivalente y paralelo en cada una de las seis subescalas que conforman las dos escalas de la expresión de la ira y hostilidad. La comparación de estos modelos se hizo mediante la obtención de la significancia práctica de los cambios observados en el CFI, ΔCFI = .01 (Cheung y Rensvold, 2002) y en el TLI, ΔTLI = .01 (Gignac, 2007). Ambos coeficientes son poco sensibles al tamaño muestral, lo cual sustenta su uso en muestras de tamaño moderado como la utilizada en el presente estudio (Kenny, 2015).

Los análisis de la prueba también incluyen el reporte del coeficiente alfa (Cronbach, 1951) con intervalos de confianza (IC; Dominguez y Merino, 2015). Asimismo, fueron calculados el coeficiente alfa (αordinal; Dominguez, 2012), el coeficiente omega (ω; McDonald, 1999) y el coeficiente H (Hancock y Mueller, 2001), en virtud de ser métodos coherentes con el marco de análisis factorial exploratorio realizado anteriormente. Debido a que el análisis se focalizó a nivel de variables latentes y se observó la presencia de errores correlacionados (ver sección Resultados), se efectuó la corrección respectiva del coeficiente alfa (αordinal; Pascual-Ferrá y Beatty, 2015) usando como parte del cálculo el promedio de las correlaciones policóricas interítem (rij) y el coeficiente omega (ω, Raykov, 2001).

Se examinó la invarianza de los parámetros de los ítems mediante la evaluación del funcionamiento diferencial de los ítems (DIF). Se aplicó el procedimiento no paramétrico para la detección potencial de DIF basado en el análisis de tablas de contingencia de las repuestas de los ítems ordinales en cada nivel de su puntaje de escala (Elosua y Wells, 2013). Se implementó mediante dos pruebas de significancia: en primer lugar, la prueba M - X2con gl = 1, la cual es una generalización del método de Mantel (1963) para ítems dicotómicos. Un resultado M - X 2 > 3.84 detecta un DIF en el nivel p < .05, utilizando para el presente estudio 6.63 (p < .01). En segundo lugar, se aplicó la estimación estandarizada del índice común de probabilidad acumulativa de Liu-Agresti (LA LOR), en el cual los valores > |2.00| indican significancia estadística (Liu y Agresti, 1996; Penfield, 2007; Penfield y Algina, 2003). De igual manera, se estimó la significancia práctica del DIF usando los mismos resultados obtenidos con el estimador LA LOR. La magnitud del DIF para ítems politómicos mediante LA LOR va en los niveles de trivial (< 0.43), moderado (< 0.64) y grande (³ 0.63); más allá del rango [-1, +1], indican un DIF robusto (Van Dam, Earleywine y Danoff-Burg, 2009). La determinación de la importancia práctica del DIF se evaluó mediante el análisis racional del contenido de los ítems con DIF y su efecto sobre la varianza del test total o funcionamiento diferencial del test, v2, (DFT; Penfield, 2005; Penfield y Algina, 2006).

Resultados

Análisis descriptivo de los datos

La mayor parte de los ítems presentan índices estandarizados de asimetría moderados y fuertes (Standardized Skew Index [SSI] ³ .50; Malgady, 2007). Algunos ítems presentan un exceso de curtosis (p. ej. ítem 14 de la escala de la ira). Un significativo número de ítems presentan efecto de techo o piso, es decir, que más del 15 % de los participantes obtienen el puntaje máximo o mínimo posible en un ítem (Terwee et al., 2007). En términos generales, se observa que el puntaje promedio tiende a ser más bajo cuando los ítems se refieren a conductas que implican una menor expresión emocional y contrariamentelas respuestas de control obtienen los promedios más elevados.

 

Estructura interna del IMIHOS

En base a los análisis factoriales exploratorios de estudios previos, se evaluó el ajuste del modelo oblicuo de cuatro factores de la escala de la ira (M1). Los índices de ajuste estuvieron debajo de los puntos de corte convencionales: SB-X2(246) = 528.737 (p < .01), CFI = .898, RMSEA = .073 (IC 90 % = .065, .082), SRMR = .118. Los êndices de Lagrange (Sšrbom, 1989) permitieron identificar residuales correlacionados, los cuales mejorar’an el ajuste de M1. De forma sucesiva se model— la correlaci—n de dos pares de residuales (entre los ’tems 16 y 21, entre 1 y 18), considerando argumentos conceptuales y emp’ricos. Los ’ndices de ajuste alcanzaron magnitudes marginales; sin embargo aceptables: SB-χ2 (244) = 469.711 (p < .01),CFI = .936, RMSEA = .059 (IC 90 % = .051, .067), SRMR = .117. La correlaci—n (φ) entre los residuales de los ’tems 16 (Controlo mis sentimientos de c—lera) y 21 (Trato de calmarme lo m‡s pronto posible) fue de .691 (p < .05), y la correlaci—n entre los residuales de los reactivos 1 (Controlo mi humor colŽrico) y 18 (Trato de relajarme) fue .534 (p < .05).

Respecto de las cargas de cada factor, se observó una heterogeneidad moderada en F3 y F4 (Control de la ira contenida y manifiesta) y una aparente variedad en F1 y F2 (Ira manifiesta e Ira contenida respectivamente). En estas dos últimas subescalas se llegó incluso a valores alrededor de .30 y otros alrededor de .85, lo cual indica un amplio rango de sus cargas. Las cargas estructurales que indican la relación del ítem con los factores no representativos para su medición muestran valores mínimos, alrededor de .10, sugiriendo que la solución tiende a ser factorialmente simple (Graham, Graham y Thompson, 2003; Hoyle, 1995). Los resultados excepcionales en este aspecto consistieron en las cargas factoriales de las dimensiones F3 (Control de la ira contenida) y F4 (Control de la ira manifiesta), las cuales muestran magnitudes elevadas. Por otro lado, las correlaciones interfactoriales son bajas excepto entre las subescalas de control, las cuales demuestran mayor varianza compartida entre ambas.

El primer modelo analizado en la escala de la hostilidad fue el de dos factores oblicuos (M1), el cual demostró muy buenos índices de ajuste: SB-X2(34) = 45.708 (p = .087), CFI = .993, RMSEA (IC 90 %) = .036 (.000, .061), SRMR = .081. Las cargas factoriales presentan magnitudes significativamente elevadas y las cargas estructurales son de moderada magnitud, lo cual sugiere una varianza compartida entre los factores (Graham et al., 2003). Asimismo, se realizó un análisis del modelo bifactor (M2) a fin de analizar el grado de influencia del factor general sobre los ítems en comparación con los factores específicos. Los índices de ajuste fueron cercanos a M1: SB-X2(25) = 18.148 (p = .836), CFI = 1.000, RMSEA (IC 90 %) = .000(.000, .030), SRMR = .027, lo que ofrece un panorama más claro. El ωh (Zinbarg et al., 2006) del factor general es mucho mayor que el de los factores específicos; de igual manera, ECV = .616, PUC = .533 y coeficiente H > .70 para el factor general. En contraste, los factores específicos obtuvieron valores menores.

Estos resultados sugieren que la estructura dimensional de la escala de hostilidad podría ser explicada suficientemente por un factor general (Rodriguez, Reise y Havilland, 2016). Con el propósito de corroborar este resultado, se analizó el modelo unidimensional (M3), el cual indica que ω(35) = 152.967 (p < .01), CFI = .928, RMSEA (IC 90 %) = .113 (.095, .131), SRMR = .111 (ver Tabla 3). Estos hallazgos no reflejan la unidimensionalidad de los datos, por lo que es más prudente mantener la estructura de dos dimensiones en función al marco conceptual del instrumento. A partir de los índices de Lagrange se identificó que al correlacionar los residuales de los ítems 4 (Me enfado cuando hago algo bien y no es apreciado) y 8 (Me siento furioso cuando hago un buen trabajo y se me valora poco), cuya magnitud fue de .458 (p < .05), el ajuste mejora sustancialmente: SB-X2 (34) = 95.878 (p < .01), CFI = .962, RMSEA (IC 90 %) = .083 (.064, .103), SRMR = .100. No se consideró la necesidad de corregir los coeficientes de confiabilidad debido a que la correlación entre residuales fue modelada entre ítems que no pertenecen a la misma dimensión.

Respecto de las evidencias internas de validez, la solución factorial de la escala de la ira produjo un AVE debajo de .50, considerándose significativos en base al marco teórico del instrumento utilizado (Fernández-Arata, Juárez y Merino, 2015). En relación a la escala de la hostilidad, los AVE son robustos en cada factor. En ambas escalas, las AVE son superiores a la varianza compartida entre factores, lo cual demuestra una clara evidencia de validez discriminativa.

Confiabilidad del IMIHOS

Se utilizaron los modelos congenérico y tau-equivalente para cada factor de las escalas de la ira y hostilidad en vista de que uno de los requisitos para usar el coeficiente alfa (a) es la unidimensionalidad y la similaridad de varios parámetros de los ítems (Meyer, 2010). En general, el modelo congenérico mostró un ajuste adecuado para cada una de las seis subescalas de la ira y hostilidad. Posteriormente se forzó la igualdad de las cargas factoriales en base al modelo tau-equivalente, comparándolo con el modelo congenérico en el CFI y TLI.

ònicamente las subescalas del Control de la ira contenida, Control de la ira manifiesta y de Reacción a la ira en la escala de hostilidad parecen cumplir con el modelo tau- equivalente. La Tabla 4 resume claramente estos resultados.

Estimaciones: El αordinal, así como los coeficientes ω y H, alcanzó niveles que se consideran adecuados, lo cual indica una buena confiabilidad del constructo (Gadermann, Guhn y Zumbo, 2012; Raykov y Hancock, 2005). El coeficiente alfa (α), calculado para la escala de la ira, presentó magnitudes bajas en las subescalas Ira manifiesta e Ira contenida. En la escala de hostilidad, los indicadores fueron apropiados (Merino, Navarro y Garcia, 2014). Una medida adicional de consistencia interna es la correlación interítem promedio (rij ; Cronbach, 1951), realizada a partir de las correlaciones policóricas interítem, aceptándose como recomendables valores entre .40 y .50 (Clark y Watson, 1995). ònicamente las subescalas de la Ira manifiesta e Ira contenida presentaron magnitudes bajas en este tipo de correlaciones (ver Tabla 4).

Funcionamiento diferencial de ítems (DIF)

En la Tabla 5 se exhiben los resultados del análisis DIF para cada ítem. De acuerdo a los niveles de significancia práctica elegidos, se obtuvo que el 79.4 % de los ítems mostró magnitudes bajas de LA LOR, mientras que el 20.6 % presentan magnitudes moderadas de DIF y solo un ítem (2.9 %) muestra una magnitud elevada de DIF. ònicamente los ítems 20 y 22 presentan significancia estadísticamente relevante. Utilizando el estadístico M-X2 ninguno de los ítems es estadísticamente significativo. Los dos ítems antes mencionados exhibieron moderado DIF, en que los varones respondieron con más intensidad en el ítem 20 y, contrariamente, las mujeres en el ítem 22. El efecto total de estos ítems sobre el funcionamiento diferencial de test en cada subescala, medido por el estimador de varianza v2, exhibió predominantemente valores mínimos: < .07 (Penfield, 2005; Penfield y Algina, 2006). El análisis lógico de ambos ítems con moderado DIF no indica un patrón conceptualmente significativo para confirmar cualitativamente este DIF.

Discusión

Los estudios previos de análisis factorial del IMIHOS fueron de tipo exploratorio, lo cual tiene ciertas ventajas durante el proceso de construcción de los ítems y evaluación de un modelo teórico. Los análisis exploratorios toman en cuenta la covariación natural de los ítems sin imponer restricciones que sugieran un desarrollo avanzado de su marco conceptual. Sin embargo, una comprobación que contraste directamente el modelo subyacente del IMIHOS no ha sido aplicada hasta la fecha y ello representa una magnífica oportunidad de investigación para evaluar el instrumento desde una metodología de tipo confirmatoria.

Los estudios preliminares del IMIHOS han utilizado descriptivamente los puntajes totales de la escala de hostilidad, lo cual es razonable por cuanto sus dos subescalas muestran una covariación moderada o alta. El modelo bifactor permite dividir la varianza de los ítems en dos, una relacionada con un factor general y la otra asociada con los factores específicos. En este sentido, se puede respaldar la validez de un puntaje total o de los puntajes parciales (Reise, 2012; Rodriguez et al., 2016). El presente estudio consideró ampliar las evidencias de validez del IMIHOS debido a la creciente demanda de instrumentos psicométricos con una dimensionalidad adecuada, a fin de garantizar, en la medida de lo posible, inferencias válidas.

Un aspecto importante a destacar fue el comportamiento de los ítems en relación a sus propiedades descriptivas. Los ítems del instrumento mostraron un patrón estable de respuestas elevadas en los ítems socialmente más aceptados (e.g., control emocional) y respuestas con puntajes bajos en ítems que reflejan una expresión emocional irracional. Si bien esto podría interpretarse de manera favorable para los participantes evaluados resaltando su capacidad de control ante las circunstancias estresantes y la baja frecuencia con la que expresan su ira de forma irracional, no se descarta que dichas respuestas hayan sido influidas por el sesgo de deseabilidad social.

En cuanto al análisis dimensional, es remarcable observar que los cuatro factores para la escala de la ira y las dos dimensiones para la escala de hostilidad se mantienen en la presente muestra peruana, lo cual replica los hallazgos de estudios previos realizados por Moscoso y Spielberger (Moscoso, 2000; Moscoso y Spielberger, 1999a). De manera concluyente, la estructura factorial de cada escala es robusta bajo el enfoque del análisis factorial confirmatorio. Los datos reportados en esta investigación demuestran claramente que en las dos escalas del IMIHOS existen factores que están relacionados teóricamente (validez interna convergente), como también dimensiones que se distinguen empíricamente uno de otro (validez interna discriminante). Sin embargo, no se observa evidencia que sustente el uso de un puntaje global para el instrumento, como en el caso del STAXI (Spielberger,1988).

El análisis de la confiabilidad del IMIHOS en el presente estudio reporta algunos alcances relevantes: en primer lugar, el análisis preliminar de los supuestos para el uso del coeficiente alfa (α) indicó la inviabilidad de su aplicación. Los resultados obtenidos corroboraron que la insatisfacción del requisito tau-equivalente derivó en una infraestimación del coeficiente alfa (α) en comparación a los otros estimadores (ω, αordinal y H) en la escala de la iray, en menor grado, en la escala de la hostilidad. En segundo lugar, estos hallazgos indican que posiblemente ciertos ítems no representan a los diferentes constructos analizados en un mismo nivel, lo cual se refleja además en las correlaciones interítem, o que su utilización introduce más errores de medición que el permitido debido a una varianza no relacionada con el constructo a medir.

Asimismo, es posible que el efecto de piso y techo observado en el análisis descriptivo haya influido en la magnitud de los coeficientes alfa (α) obtenidos, en vista que la restricción en el rango de respuestas afecta directamente la varianza de los ítems. La planificación de futuros estudios con el IMIHOS podría considerar la reformulación de ciertos ítems o elaborar una versión más breve con los ítems que mejor representen el constructo usando criterios factoriales internos o externos (Moscoso, 2014). De este modo, el análisis de las variables latentes y la magnitud de los coeficientes de confiabilidad (αordinal, ω y H) son más favorable en ambas escalas.

En relación a la evaluación del sesgo, el análisis del funcionamiento diferencial del ítem sugiere que las diferencias existentes entre varones y mujeres pueden ser inconsecuentes y no tener un mayor efecto acumulativo sobre el funcionamiento diferencial de ambas escalas del IMIHOS. Los indicadores de la magnitud del DIF aplicados fueron consistentemente bajos y son más recomendables en la interpretación del DIF (Hambleton, 2006). En el caso de nuestro estudio, el énfasis fue dado a este tipo de indicadores debido que se puede necesitar un mayor tamaño muestral (³ 500) para controlar mejor el error Tipo I usando los procedimientos no paramétricos de DIF (Guilera, Gómez-Benito, Hidalgo y Sánchez-Meca, 2013). Aunque esto es favorable para el proceso de validación del IMIHOS, las características de la presente muestra y el patrón de respuestas pueden ser un contexto único de estos resultados y, por lo tanto, difícil de replicarse en otro estudio. En este sentido, los resultados de la presente investigación nos permiten concluir que no existe evidencia de funcionamiento diferencial en el ítem y en el test.

Referencias

Alcazar, R., Deffenbacher, J., & Byrne, Z. (2011). Assessing the factor structure of the Anger Expression Inventory (ML- STAXI) in a Mexican sample. International Journal of Psychology and Psychological Therapy. 11(2), 307-318.

Beaducel, A. & Herzberg, P. Y. (2006). On the performance of maximum likelihood versus means and variance adjusted weighted least squares estimation in CFA. Structural Equation Modeling: A Multidisciplinary Journal, 13(2), 186- 203.

Bentler, P. M. & Wu, E. J. C. (2012). EQS 6.2 for Windows [Programa estadístico]. California: Multivariate Software, Inc.

Brown, T. A. (2006). Confirmatory factor analysis for applied research. Nueva York: The Guilford Press.

Bryant, B. F. & Yarnold, P. R. (1995). Principal components analysis and exploratory and confirmatory factor analysis. In L. G. Grimm & P. R. Yarnold (Eds.), Reading and understanding multivariate statistics (pp. 99-136). Washington, D. C.: American Psychological Association.

Cheung, G. W. & Rensvold, R. B. (2002). Evaluating goodness- of-fit indexes for testing measurement invariance. Structural Equation Modeling, 9(2), 233-255.

Clark, L. A. & Watson, D. (1995). Constructing validity: Basic issues in objective scale development. Psychological Assessment, 7(3), 309-319.

Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16(3), 297-334.

Dominguez, S. (2012). Propuesta para el cálculo del Alfa Ordinal y Theta de Armor. Revista de Investigación en Psicología, 15(1), 213-217.

Dominguez, S. (2014). ¿Matrices policóricas/tetracóricas o matrices Pearson? Un estudio metodológico. Revista Argentina de Ciencias del Comportamiento, 6(1), 39-48.

Dominguez, S. & Merino, C. (2015) ¿Por qué es importante reportar los intervalos de confianza del coeficiente alfa de Cronbach? Revista Latinoamericana de Ciencias Sociales, Niñez y Juventud, 13(2), 1326-1328.

Elosua, P. & Wells, C. (2013). Detecting DIF in polytomous items using MACS, IRT and ordinal logistic regression. Psicológica 34, 327-342.

Fernández-Arata, M., Juárez, A., & Merino, C. (2015). Análisis estructural e invarianza de medición del MBI-GS en trabajadores peruanos. Liberabit, 21(1), 9-20.

Fornell, C. & Larcker, D. (1981). Evaluating structural equation models with unobservable variables and measurement error. Journal of Marketing Research, 18(1), 39-50.

Gadermann, A. M., Guhn, M., & Zumbo, B. D. (2012). Estimating ordinal reliability for Likert-type and ordinal item response data: A conceptual, empirical, and practical guide. Practical Assessment, Research, & Evaluation, 17(3), 1-13. Recuperado de: http://pareonline.net/getvn.asp?v=17&n=3

Gignac, G. (2007). Multi-factor modeling in individual differences research: Some recommendations and suggestions. Personality and Individual Differences, 42(1), 37-48.

Graham, J. M., Guthrie, A. C., & Thompson, B. (2003). Consequences of not interpreting structure coefficients in published CFA research: A reminder. Structural Equation Modeling: A Multidisciplinary Journal, 10(1), 142-153.

Guilera, G., Gómez-Benito, J., Hidalgo, M. D., & Sánchez-Meca, J. (2013). Type I error and statistical power of the Mantel- Haenszel procedure for detecting DIF: A meta-analysis. Psychological Methods, 18(4), 553-571.

Hambleton, R. K. (2006). Good practices for identifying differential item functioning. Medicine Care, 44(11, Supl. 3), 82-88.

Hancock, G. R., & Mueller, R. O. (2001). Rethinking construct reliability within latent variable systems. In R. Cudeck, S. du Toit, & D. Sšrbom (Eds.), Structural equation modeling: Past and present. A Festschrift in honor of Karl G. Jšreskog (pp. 195-216). Illinois: Scientific Software International, Inc.

Hoyle, R. H. (1995). The structural equation modeling approach: Basic concepts and fundamental issues. In R. H. Hoyle (Ed.), Structural equation modeling: Concepts, issues and applications (pp. 1-15). California: Sage Publications.

Kenny, D. A. (2015). Measuring model fit. Recuperado de: http://davidakenny.net/cm/fit.htm

Lee, S. Y., Poon, W. Y., & Bentler, P. M. (1995). A two-stage estimation of structural equation models with continuous and polytomous variables. British Journal of Mathematical and Statistical Psychology, 48(2), 339-358.

Liu, I. & Agresti, A. (1996). Mantel-Haenszel type inference for cumulative odds ratios with a stratified ordinal response. Biometrics, 52(4), 1223-1234.

Malgady, R. (2007). How skewed are psychological data? A standardized index of effect size. The Journal of General Psychology, 134(3), 355-359.

Mantel, N. (1963) Chi-square tests with one degree of freedom: extensions of the Mantel-Haenszel procedure. Journal of American Statistical Association, 58(303), 690-700.

McDonald, R. P. (1999). Test theory: A unified treatment. Nueva Jersey: Lawurence Erlbaum Associates.

Merino, C., Navarro, J., & García, W. (2014). Revisión de la consistencia interna del Inventario de Inteligencia Emocional de Bar-On, EQ-I: YV. Revista Peruana de Psicología y Trabajo Social, 3(1), 141-154.

Meyer, J. P. (2010). Reliability. Nueva York: Oxford University Press.

Moscoso, M. S. (2000). Estructura factorial del Inventario Multicultural Latinoamericano de la Expresión de la Cólera y Hostilidad. Revista Latinoamericana de Psicología, 32(2), 321 343.

Moscoso, M. S. (2014). Medición psicométrica de la expresión de la ira y hostilidad. Revista de Psicología, 16(2), 169-181.

Moscoso, M. S. & Perez-Nieto, M. A. (2003). Anger, hostility and aggression assessment. En Fernandez-Ballesteros R. (Eds.). Encyclopedia of Psychological Assessment (pp. 22- 27). Londres: Sage Publications.

Moscoso, M. S. & Spielberger, C. D. (1999a). Evaluación de la experiencia, expresión y control de la cólera en Latinoamérica. Psicología Contemporánea, 6(1), 4-13.

Moscoso, M. S. & Spielberger, C. D. (1999b). Measuring the experience, expression, and control of anger in Latin America: The Spanish multi-cultural state-trait anger expression inventory. Interamerican Journal of Psychology, 33(2), 29- 48.

Moscoso, M. S. & Spielberger, C. D. (2011). Cross-cultural assessment of emotions: The expression of anger. Revista de Psicología, 29(2), 343-360.

Pascual-Ferrá. P & Beatty, M. J. (2015). Correcting internal consistency estimates inflated by correlated item errors. Communication Research Reports, 32(4), 347-352.

Penfield, R. D. (2005). DIFAS: Differential Item Functioning Analysis System. Computer Program Exchange. Applied Psychological Measurement, 29(2), 150-151.

Penfield, R. D. (2007). An approach for categorizing DIF in polytomous items. Applied Measurement in Education, 20(3), 335-355.

Penfield, R. D. & Algina, J. (2003). Applying the Liu-Agresti estimator of the cumulative common odds ratio to DIF detection in polytomous items. Journal of Educational Measurement, 40(4), 353-370.

Penfield, R. D. & Algina, J. (2006). A generalized DIF effect variance estimator for measuring unsigned differential test functioning in mixed format tests. Journal of Educational Measurement, 43(4), 295-312.

Raykov, T. (2001). Bias in coefficient alpha for fixed congeneric measures with correlated errors. Applied Psychological Measurement, 25(1), 69-76.

Raykov, T. & Hancock, G. R. (2005). Examining change in maximal reliability for multiple-component measuring instruments. British Journal of Mathematical and Statistical Psychology, 58(1), 65-82.

Reise, S. P. (2012). The rediscovery of bifactor measurement models. Multivariate Behavioral Research, 47(5), 667-696.

Reise, S. P., Scheines, R., Widaman, K. F., & Haviland, M. G. (2013). Multidimensionality and structural coefficient bias in structural equation modeling: A bifactor perspective. Educational and Psychological Measurement, 73(1), 5-26.

Rodriguez, A., Reise, S. P., & Haviland, M. G. (2016). Evaluating bifactor models: calculating and interpreting statistical indices. Psychological Methods, 21(2), 137-150.

Satorra, A. & Bentler, P. M. (1994). Corrections to test statistics and standard errors in covariance structure analysis. In A. von Eye & C. C. Clogg (Eds.), Latent variables analysis: Applications for developmental research (pp. 399-419). California: Sage.

Sšrbom, D. (1989). Model modification. Psychometrika, 54(3), 371-384.

Spielberger, C. D. (1988). Manual for the State-Trait Anger Expression Inventory (STAXI). Florida: Psychological Assessment Resources.

Spielberger, C. D. & Moscoso, M. S. (1995). La expresión de la cólera y hostilidad: Sus efectos en el sistema cardiovascular. Psicología Contemporánea, 2, 32-43.

Spielberger, C. D., Moscoso, M. S., & Brunner, T. M. (2005). Cross-cultural assessment of emotional states and personality traits. In R. K. Hambleton, P. F. Merenda & C. D. Spielberger (Eds.), Adapting educational and psychological tests for cross-cultural assessment (pp. 343-367). Nueva Jersey: Lawrence Erlbaum Associates.

Terwee, C. B., Bot, S. D., Boer, M. R. de, Windt, D. A. van der, Knol, D. L., Dekker, J., ... Vet, H. C. de (2007). Quality criteria were proposed for measurement properties of health status questionnaires. Journal of Clinical Epidemiology, 60(1), 34-42

Van Dam, N. T., Earleywine, M., & Danoff-Burg, S. (2009). Differential item function across meditators and non- meditators on the Five Facet Mindfulness Questionnaire. Personality and Individual Differences, 47(5), 516-521.

Zinbarg, R. E., Yovel, I., Revelle, W., & McDonald, R. P. (2006). Estimating generalizability to a latent variable common to all of a scale's indicators: A comparison of estimators for uh. Applied Psychological Measurement, 30(2), 121-144.

Los autores agradecen a Patty Vilela por su colaboración y apoyo logístico en la recolección de datos.

La elaboración del presente estudio ha sido financiada de manera parcial por parte del Instituto de Investigación en Psicología de la Universidad de San Martín de Porres a Manolete S. Moscoso, Ph.D.

*, **, *** Universidad de San Martín de Porres, Perú

****, ***** Pontificia Universidad Católica del Perú, Perú

* manolete@manoletemoscoso.com mmoscoso@health.usf.edu

** sikayax@yahoo.com.ar

*** sdominguezmpcs@gmail.com

**** cchau@pucp.edu.pe

***** mclaux@pucp.edu.pe

Recibido: 19 de agosto de 2016

Aceptado: 05 de noviembre de 2016