Chap 18. 이요인(Bifactor) 측정 모델

안녕하세요! 이번엔 여러분과 함께 이요인 측정 모델(Bifactor Measurement Models)의 깊이 있는 세계를 탐구하게 되어 기쁩니다.

이요인 모델은 1930년대 홀징거(Holzinger)에 의해 처음 제안된 이후, 최근 10년 사이 심리 및 교육 측정 분야에서 비약적인 발전을 이루었습니다. 이 모델의 핵심은 우리가 측정하고자 하는 심리적 구인이 ‘위계적’이라는 점을 인정하는 데서 출발합니다.

본 강의 노트를 통해 이요인 모델의 이론적 기초부터 실무적인 분석 방법까지, 교육 현장의 데이터를 예로 들어 상세히 살펴보겠습니다.

1. 이요인 모델의 기초: 왜 이요인(Bifactor)인가?

교육 현장에서 우리가 측정하는 많은 구인(Construct)은 복합적입니다. 예를 들어, ‘학업적 자기효능감’을 측정할 때 이는 전반적인 자신감을 반영하기도 하지만, 과목별(국어, 수학, 영어) 특수성도 함께 포함합니다.

1.1 두 가지 핵심 원리

이요인 모델을 이해하기 위해서는 다음 두 가지 원리를 기억해야 합니다.

구인의 위계성: 심리적 구인은 광범위한 수준(일반 요인)부터 좁은 수준(집단 요인)까지 위계적으로 존재합니다.
분산의 분할: 개별 문항의 분산은 네 가지로 나뉩니다.
- 일반 분산(General): 모든 문항이 공유하는 것.
- 집단 분산(Group): 특정 하위 문항들끼리만 공유하는 것.
- 특수 분산(Specific): 해당 문항만의 고유한 체계적 분산.
- 오차 분산(Error): 비체계적 분산.

2. 탐색적 이요인 모델 (Exploratory Bifactor Models)

탐색적 단계에서는 각 문항이 일반 요인이나 어떤 집단 요인에도 자유롭게 부하(load)될 수 있도록 허용합니다.

2.1 주요 분석 접근법

Schmid-Leiman (SL) 해법: 상관 요인 모델을 직교화(orthogonalization)하여 이요인 구조로 변환하는 고전적 방식입니다. 하지만 교차 부하가 있는 데이터에서는 일반 요인을 과대추정하는 경향이 있습니다.
Jennrich-Bentler (JB) 해법: 분석적 회전(Analytic rotation)을 통해 직접 이요인 구조를 찾아냅니다.
직접 방법 (DSL, DBI): 타겟 행렬을 사용하여 유클리드 거리가 가장 가까운 최적의 해를 찾습니다.

3. 확인적 이요인 모델 (Confirmatory Bifactor Models)

최근 학계에서는 “이요인 열풍(bifactor mania)”이라고 불릴 만큼 이 모델이 자주 사용됩니다. 그 이유는 이요인 모델이 기존의 2차(Second-order) 모델보다 데이터 적합도가 더 좋게 나오는 경우가 많기 때문입니다.

3.1 주의할 점: “적합도가 높다고 항상 좋은 모델인가?”

많은 연구에서 이요인 모델이 승리하지만, 전문가들은 주의를 당부합니다.

복잡성 수용: 이요인 모델은 데이터 내의 사소한 복잡성(작은 교차 부하 등)을 더 잘 흡수하기 때문에 적합도가 인위적으로 높게 나타날 수 있습니다.
무작위 데이터의 함정: 심지어 무작위로 생성된 노이즈 데이터조차 이요인 모델이 다른 모델보다 더 잘 설명하는 경향이 있습니다.
실질적 의미: 통계적 적합도보다는 추출된 ‘일반 요인’과 ‘집단 요인’이 개념적으로 어떤 의미를 갖는지 해석하는 것이 훨씬 중요합니다.

4. 교육 연구를 위한 가상 데이터 실습

이요인 모델의 유용성을 살펴보기 위해 ‘창의적 문제해결 역량 검사’ 데이터를 가정해 보겠습니다.

[스토리 배경]

A 교육청에서는 중학생들의 ‘창의적 문제해결력’을 측정하기 위해 15문항으로 구성된 척도를 개발했습니다. 이론적으로는 (1) 유창성, (2) 융통성, (3) 독창성이라는 3개의 하위 요인이 존재한다고 보지만, 모든 문항은 궁극적으로 하나의 ‘일반 창의성’을 측정한다고 가정합니다.

4.1 데이터 생성 및 분석 (jamovi & R)

jamovi의 jmv 라이브러리나 lavaan 패키지를 사용하여 분석할 수 있습니다.

# R을 활용한 이요인 CFA 예시 (lavaan 패키지)
library(lavaan)

# 모델 정의: 일반 요인(G)과 3개의 집단 요인(S1, S2, S3)
# 모든 요인은 서로 독립(직교)한다고 가정함
bifactor_model <- '
  G  =~ q1 + q2 + q3 + q4 + q5 + q6 + q7 + q8 + q9 + q10 + q11 + q12 + q13 + q14 + q15
  S1 =~ q1 + q2 + q3 + q4 + q5
  S2 =~ q6 + q7 + q8 + q9 + q10
  S3 =~ q11 + q12 + q13 + q14 + q15
  
  # 요인 간 상관을 0으로 고정 (이요인 모델의 기본 가정)
  G ~~ 0*S1; G ~~ 0*S2; G ~~ 0*S3
  S1 ~~ 0*S2; S1 ~~ 0*S3; S2 ~~ 0*S3
'
# jamovi에서는 'SEMLj' 모듈에서 위 구문을 입력하여 분석 가능합니다.

5. 핵심 심리측정 지표 (Bifactor Indices)

이요인 모델을 보고할 때 단순히 적합도( $CFI$ , $RMSEA$ )만 제시하는 것은 불충분합니다. 다음 지표들을 반드시 포함해야 합니다.

지표명	설명	해석 기준
ECV (Explained Common Variance)	전체 공통 분산 중 일반 요인이 설명하는 비중	값이 클수록(예: .70 이상) 데이터가 본질적으로 단일차원임을 의미
$\omega_H$ (Omega Hierarchical)	총점 분산 중 일반 요인에 의해 설명되는 신뢰도	.80 이상이면 하위 요인이 있더라도 총점을 단일 점수로 해석 가능
$\omega_{HS}$ (Omega Hierarchical Subscale)	일반 요인을 통제한 후 하위 요인이 가진 고유한 신뢰도	이 값이 낮으면 해당 하위 점수(Subscale score)를 별도로 보고할 근거가 약함

5.1 실습 예시 해석

우리의 ‘창의성’ 데이터 분석 결과가 다음과 같다고 가정해 봅시다.

$\omega_H = .85$ : 학생들의 총점은 매우 신뢰할 만하며, 대부분 ‘일반 창의성’을 반영합니다.
$\omega_{HS} = .05$ : 일반 요인을 제거하고 나니 ‘유창성’이나 ‘독창성’ 자체의 고유 분산은 거의 없습니다.
결론: 이 검사는 하위 점수를 각각 매기기보다는, 하나의 전체 점수로 학생을 평가하는 것이 훨씬 정확합니다.

6. 이요인 문항반응이론 (Bifactor IRT)

IRT에서도 이요인 모델은 강력합니다. 특히 단일차원 IRT 모델을 적용했을 때 발생하는 모수 추정의 편향을 확인하는 데 유용합니다.

조건부 경사(Conditional Slopes): 집단 요인이 0인 특정 상황에서의 문항 변별도.
주변 경사(Marginal Slopes): 집단 요인의 영향을 통합(integrating)하여 계산한 변별도로, 단일차원 IRT 모델과 직접 비교 가능합니다.
만약 단일차원 모델의 정보 함수가 이요인 모델보다 훨씬 높게 나온다면, 이는 다차원성으로 인해 정보량이 과대추정된 것일 수 있습니다.

7. 결론 및 제언

이요인 모델은 우리에게 중요한 질문을 던집니다. “우리가 측정하는 하위 요인들이 정말로 독립적인 의미가 있는가, 아니면 일반 요인의 그림자에 불과한가?”

교육 측정 전문가로서 여러분께 권장하는 분석 절차는 다음과 같습니다.

다양한 모델 비교: 단일차원, 상관 요인, 이요인 모델을 모두 적합시켜 보세요.
지표 보고: 적합도에만 매몰되지 말고 ECV, $\omega_H, \omega_{HS}$ 를 통해 하위 점수의 유용성을 검증하세요.
이론적 정당성: 통계적으로 적합도가 좋다고 해서 무조건 수용하지 말고, 일반 요인에서 정제된(cleansed) 집단 요인이 교육적으로 어떤 의미가 있는지 고민하세요.

참고문헌

Abad, F. J., Garcia-Garzon, E., Garrido, L. E., & Barrada, J. R. (2017). Iteration of partially specified target matrices: Application to the bi-factor case. Multivariate Behavioral Research, 52(4), 416–429.
Bonifay, W., & Cai, L. (2017). On the complexity of item response theory models. Multivariate Behavioral Research, 52(4), 465–484.
Jennrich, R. I., & Bentler, P. M. (2011). Exploratory bi-factor analysis. Psychometrika, 76(4), 537–549.
Reise, S. P. (2012). The rediscovery of bifactor measurement models. Multivariate Behavioral Research, 47(5), 667–696.
Rodriguez, A., Reise, S. P., & Haviland, M. G. (2016). Applying bifactor statistical indices in the evaluation of psychological measures. Journal of Personality Assessment, 98(3), 223–237.
Schmid, J., & Leiman, J. M. (1957). The development of hierarchical factor solutions. Psychometrika, 22(1), 53–61.
Waller, N. G. (2018). Direct Schmid-Leiman transformations and rank-deficient loadings matrices. Psychometrika, 83(4), 858–870.

WaurimaL

Educational Measurement & Psychometrics