카테고리 보관물: 구조방정식

구조방정식 모델링에 관한 내용

Chap 29. 혼합모형(Mixture Models)

안녕하세요?
이번에는 교육 연구에서 집단의 이질성을 파악하는 아주 강력한 도구인 혼합 모형(Mixture Models)에 대해 깊이 있게 다루어 보겠습니다.

과거 아리스토텔레스 시대부터 과학의 기초는 사물을 유사성에 따라 분류하는 것이었습니다. 교육 현장에서도 우리는 학생들을 단순히 ‘전체 평균’으로 보는 것이 아니라, 서로 다른 학습 양식이나 심리적 특성을 가진 여러 잠재적 집단(Latent Groups)으로 이해할 필요가 있습니다.

1. 혼합 모형의 개념과 기초

혼합 모형은 데이터가 여러 개의 하위 분포(Components)가 합쳐진 형태라고 가정하는 통계적 접근법입니다.

1.1. 왜 혼합 모형인가?

전통적인 군집 분석(K-means 등)은 학생을 특정 집단에 ‘딱’ 잘라 배정합니다(Crisp membership). 반면, 혼합 모형은 확률적 소속(Probabilistic membership)을 제공합니다. 예를 들어, 한 학생이 ‘자기주도형’ 집단에 속할 확률이 85%, ‘교사의존형’ 집단에 속할 확률이 15%라고 알려주는 식이죠. 이는 분류의 불확실성을 과학적으로 다룰 수 있게 해줍니다.

1.2. 주요 모델의 유형

심리학과 교육학에서 가장 많이 쓰이는 형태는 다음과 같습니다.

잠재 프로파일 분석 (LPA): 연속형 변수(예: 시험 점수, 자아존중감 척도)를 사용하여 집단을 구분합니다.
잠재 계층 분석 (LCA): 범주형/이분형 변수(예: 예/아니오 설문 응답)를 사용하여 집단을 구분합니다.

2. 모형의 추정과 의사결정

혼합 모형을 성공적으로 구현하기 위해서는 몇 가지 중요한 통계적 결정을 내려야 합니다.

2.1. EM 알고리즘과 지역 최적해(Local Optima)

혼합 모형은 보통 EM(Expectation-Maximization) 알고리즘을 통해 추정됩니다. 이 과정에서 주의할 점은 ‘가장 좋은 해’라고 생각한 결과가 사실은 특정 조건에서만 나타나는 지역 최적해(Local Optima)일 수 있다는 점입니다.

WaurimaL의 팁: 이를 방지하기 위해 무작위 시작값(Random Starts)을 충분히(예: 1,000 ~ 5,000개) 설정하는 것이 필수적입니다. 시작값이 적으면 데이터의 실제 구조를 놓칠 위험이 큽니다.

2.2. 공분산 구조의 결정

데이터의 형태(부피, 모양, 방향)를 어떻게 가정하느냐에 따라 14가지 이상의 모델이 존재합니다.

모델 유형	부피 (Volume)	모양 (Shape)	방향 (Orientation)	특징
EII	동일	구형	해당 없음	가장 제약이 많은 형태 (K-means와 유사)
VII	가변	구형	해당 없음	집단별 크기는 다르지만 모양은 동그라미
VVV	가변	가변	가변	가장 유연하며 데이터에 최적화됨

2.3. 집단 수 선정 (BIC와 ICL)

“우리 반 학생들은 몇 개의 유형으로 나뉘는가?”를 결정할 때 가장 널리 쓰이는 지표는 BIC(Bayesian Information Criterion)입니다. 일반적으로 BIC 값이 가장 작은 모델을 선택합니다. 만약 집단 간 구분이 명확한 모델을 원한다면 ICL(Integrated Completed Likelihood) 지표를 함께 고려하는 것이 좋습니다.

3. 교육 현장의 사례: “학습 동기 프로파일 분석”

이해를 돕기 위해 가상의 고등학생 200명의 데이터를 생성하여 분석해 보겠습니다.

3.1. 모의 데이터 시나리오

변수: 내재적 동기(IM), 외재적 동기(EM), 학습 불안(ANX), 자기효능감(SE)
잠재된 스토리: 1. 고동기형: 모든 점수가 높음. 2. 불안형: 동기는 있으나 불안도가 매우 높음. 3. 무기력형: 모든 점수가 전반적으로 낮음.

3.2. R을 이용한 분석 코드

Jamovi의 snowRMM 모듈로도 가능하지만, 보다 정밀한 제어를 위해 R의 mclust 혹은 mixture 패키지를 권장합니다.

# 필요한 패키지 로드
library(mclust)
library(tidyverse)

# 1. 모의 데이터 생성 (교수 재량)
set.seed(2026)
n <- 200
# 세 개의 집단 생성 (고동기, 불안, 무기력)
g1 <- matrix(rnorm(n*0.4*4, mean=4, sd=0.5), ncol=4) # 고동기
g2 <- matrix(rnorm(n*0.3*4, mean=c(3,4,4,3), sd=0.6), ncol=4) # 불안형
g3 <- matrix(rnorm(n*0.3*4, mean=2, sd=0.7), ncol=4) # 무기력
data <- rbind(g1, g2, g3)
colnames(data) <- c("IM", "EM", "ANX", "SE")

write.csv(data,"chap29.csv",row.names = F)

# 2. 혼합 모형 적합 (집단 수 1~5개 테스트)
fit <- Mclust(data, G=1:5)

# 3. 결과 요약 및 집단 수 확인
summary(fit) 
# 최적 모델과 집단 수(G) 출력

# 4. 시각화: 프로파일 플롯
means <- fit$parameters$mean
matplot(means, type="b", pch=1:fit$G, main="Student Learning Profiles")

# 5. 모형 적합 (예: mclust 사용)
fit1 <- Mclust(data, G=3)

# 6. 1번 집단 80개, 2번 집단 60개, 3번 집단 60개를 하나의 벡터로 만듭니다.
actual_classes <- c(rep(1, 80), rep(2, 60), rep(3, 60))

# 7. 예측된 집단 할당 (MAP 분류)
# 각 관측치를 가장 높은 사후 확률을 가진 집단에 할당합니다.
predicted_classes <- fit1$classification

# 8. 실제 집단 정보와 비교하여 ARI 계산
# actual_classes는 데이터 세트에 포함된 실제 집단 레이블입니다.
final_ari <- adjustedRandIndex(actual_classes, predicted_classes)

# 9. 결과 해석
# 결과 출력
cat("분석 결과 ARI 수치:", final_ari, "\n")

chap29 다운로드

4. 분석 결과의 해석과 주의사항

분석이 끝났다고 해서 바로 “우리 학생들은 3개 집단이다!”라고 결론지어서는 안 됩니다.

4.1. 직접적 vs 간접적 적용

직접적 적용: 실제로 데이터 안에 질적으로 다른 ‘진짜 집단’이 존재한다고 믿는 경우입니다.
간접적 적용: 데이터가 단순히 비정규분포(기울어짐 등)를 띠고 있어서, 이를 설명하기 위해 여러 개의 정규분포를 빌려 쓰는 경우입니다.

대부분의 사회과학 데이터는 후자인 경우가 많습니다. 따라서 ‘집단 분류’ 자체에 매몰되기보다는, 전체적인 데이터의 이질성을 이해하는 수단으로 혼합 모형을 활용해야 합니다.

4.2. 분류 정확도 (ARI)

분석 결과로 나온 집단 분류가 얼마나 정확한지 판단하기 위해 ARI(Adjusted Rand Index)를 확인합니다. ARI가 0.8 이상이면 ‘우수’, 0.65 이상이면 ‘수용 가능’한 수준으로 봅니다.

5. 결론: 연구자를 위한 제언

혼합 모형은 매우 유연하지만, 그만큼 오용하기 쉽습니다.

시각화가 우선입니다: 분석 전 산점도나 요인 점수 분포를 통해 실제로 집단이 나뉠 만한 구조인지 먼저 확인하세요.
이론적 근거를 가지세요: 통계 지표(BIC)가 4개를 추천하더라도, 교육학적 이론으로 설명되지 않는 집단이라면 모형을 재검토해야 합니다.
복제 가능성을 염두에 두세요: 혼합 모형은 과적합(Overfitting)의 위험이 크므로, 다른 샘플에서도 동일한 구조가 나타나는지 확인하는 과정이 필요합니다.

참고문헌 (APA Style)

Bauer, D. J., & Curran, P. J. (2003). Distributional assumptions of growth mixture models: Implications for overextraction of latent trajectory classes. Psychological Methods, 8(3), 338–363.
Celeux, G., & Govaert, G. (1995). Gaussian parsimonious clustering models. Pattern Recognition, 28(5), 781–793.
Dempster, A. P., Laird, N. M., & Rubin, D. B. (1977). Maximum likelihood from incomplete data via the EM algorithm. Journal of the Royal Statistical Society: Series B (Methodological), 39(1), 1–22.
McLachlan, G. J., & Peel, D. (2000). Finite mixture models. Wiley.
Steinley, D. (2026). Mixture Models. In The SAGE Handbook of Quantitative Methods in Psychology. SAGE. (Original work published 2023)
Steinley, D., & Brusco, M. J. (2011). Evaluating the performance of model-based clustering: Recommendations and cautions. Psychological Methods, 16(1), 63–79.

Chap 28. 적은 표본과 많은 변수를 가진 구조방정식 모델링

안녕하세요? 이번에는 ‘표본은 작고 변수는 많은(Small $N$ , Large $p$ )’ 상황에서의 구조방정식 모델링(Structural Equation Modeling, SEM)입니다. 현장에서 교육 연구를 진행하다 보면 설문 문항(변수)은 수백 개에 달하는데, 특정 소수 집단이나 특수 학교 학생들을 대상으로 하여 표본을 충분히 확보하지 못하는 경우가 비일비재하죠.

이런 고차원적 문제(High-dimensional problems) 상황에서 기존의 통계적 방법론을 그대로 적용하면 어떤 오류가 발생하는지, 그리고 이를 해결하기 위한 최신 기법들은 무엇인지 함께 알아보겠습니다.

1. 작은 표본과 많은 변수의 딜레마

구조방정식(SEM)의 핵심 강점은 측정 오차를 분리하고 잠재 변수 간의 관계를 명확히 추정하는 것입니다. 하지만 본래 SEM은 대표본( $N$ )과 상대적으로 적은 변수( $p$ )를 가정하고 개발된 점근적(Asymptotic) 방법론입니다.

교육 연구 현장에서 흔히 발생하는 문제는 다음과 같습니다.

수렴 실패 및 불안정성: 표본이 적으면 표본 공분산 행렬( $S$ )이 ‘full rank’가 되지 않아 수렴에 수천 번의 반복 계산이 필요하거나 아예 수렴하지 않을 수 있습니다.
다중공선성: 변수가 많아지면 변수 간 상관관계가 지나치게 높아져 행렬이 근사 특이(Near-singular) 상태에 빠지기 쉽습니다.
부적절한 적합도: 점근적 이론에 기반한 카이제곱( $\chi^2$ ) 통계량은 변수가 많고 표본이 작을 때 모델을 과도하게 기각하는 경향(Type I error 인플레이션)이 있습니다.

[사례 연구: 학업 스트레스와 학교 적응]

어느 중학교의 학습 지원 대상 학생 50명을 대상으로 ‘학업 스트레스 지표(150문항)’를 조사했다고 가정해 봅시다. 150개의 문항(변수)에 대해 표본이 50명뿐이라면, 기존의 최대우도법(ML)은 거의 확실하게 오류를 뱉어낼 것입니다.

2. 모델 매개변수 추정의 해결책

표본 공분산 행렬 $S$ 가 특이 행렬(Singular matrix)이 되어 계산이 불가능할 때, 우리는 릿지(Ridge) 방법을 고려할 수 있습니다.

2.1 릿지 최대우도법 (Ridge ML)

전통적인 방법은 $S$ 의 대각선에 일정한 상수를 더해 양의 정구조(Positive definite) 행렬로 만드는 것입니다.

Yuan & Chan (2008) 제안: $S$ 대신 $S_a = S + aI$ (여기서 $a = p/N$ )를 사용하여 추정의 속도와 수렴율을 획기적으로 높였습니다.

2.2 릿지 일반화최소자승법 (Ridge GLS)

일반적인 GLS는 표본이 작고 변수가 많을 때 매우 불안정합니다. 이를 보완하기 위해 가중치 행렬 $W$ 를 조정한 릿지 GLS가 제안되었습니다.

Yang & Yuan (2019): 비정규 분포 데이터에서 릿지 GLS가 NML(정규분포 기반 ML)보다 효율적인 추정치를 제공함을 입증했습니다.

2.3 베이지안(Bayesian) 접근법

베이지안 방식은 점근적 이론에 의존하지 않기 때문에 소표본 연구에서 강력한 대안이 됩니다.

사전 정보(Priors)의 활용: 과거 연구나 전문가 견해를 바탕으로 사전 분포를 설정하면, 데이터가 부족하더라도 안정적인 추정이 가능합니다.
주의사항: 잘못된 사전 정보를 설정할 경우 편향된 결과를 초래할 수 있으므로 신중해야 합니다.

3. 모델 적합도 평가의 교정

전통적인 $T_{ML}$ 통계량은 소표본에서 믿을 수 없습니다. 이를 교정하기 위한 다양한 ‘휴리스틱’ 및 ‘통계적 교정’ 방법들이 제안되었습니다.

교정 방법	주요 특징	추천 상황
Swain 교정	$(N-1)$ 을 $N_{Swain}$ 으로 대체하여 교정	일반적인 소표본
Yuan & Bentler (2017) $T_{rml}^{(c20)}$	경험적 결과에 기반한 평균 및 분산 교정	비정규 분포 및 소표본
Tian & Yuan (2019) $T_{a}^{(b)}$	2,000개 이상의 조건에서 캘리브레이션된 최신 통계량	변수가 매우 많은 경우( $p \le 120$ )

4. 실전 가이드: R을 활용한 소표본 SEM 분석

많은 교육학도가 사용하는 jamovi의 기본 SEMLj 모듈은 이러한 고차원 교정 기능을 모두 제공하지는 못합니다. 따라서 R의 lavaan 패키지를 활용한 분석이 권장됩니다.

[모의 데이터 시나리오]

스토리: ‘교사 효능감’과 ‘직무 만족도’의 관계 모델링.
상황: 특수 교사 80명 대상( $N=80$ ), 문항 수는 총 60개( $p=60$ ).

# 필요한 라이브러리 로드
library(lavaan)

# 1. 모의 데이터 생성 (N=80, p=60인 고차원 데이터)
set.seed(2026)
data <- matrix(rnorm(80 * 60), 80, 60)
colnames(data) <- paste0("v", 1:60)
df <- as.data.frame(data)

# 2. 모델 정의 (간략화된 예시)
model <- '
  F1 =~ v1 + v2 + v3 + v4 + v5 + v6 + v7 + v8 + v9 + v10
  F2 =~ v11 + v12 + v13 + v14 + v15 + v16 + v17 + v18 + v19 + v20
  F2 ~ F1
'

# 3. Satorra-Bentler 교정 적용 분석 (소표본/비정규성 대비)
fit_sb <- sem(model, data = df, test = "Satorra.Bentler")

# 4. 결과 출력
summary(fit_sb, fit.measures = TRUE, standardized=TRUE)

chap28 다운로드

5. 결론 및 제언

소표본과 다변수 상황에서의 SEM은 “불가능한 작업”이 아니라 “세심한 교정이 필요한 작업”입니다. 분석 시 다음 원칙을 기억하세요.

릿지 추정법을 통해 수렴 불안정성을 해결하세요.
단순 카이제곱 대신 경험적으로 교정된 통계량( $T_{rml}$ , $T_{a}^{(b)}$ )을 확인하세요.
표준 오차의 정확성을 위해 부트스트랩(Bootstrap) 기법 활용을 검토하세요.
가능하다면 강력한 사전 정보를 바탕으로 한 베이지안 SEM을 고려해 보시기 바랍니다.

참고문헌

Marcoulides, K. M., Yuan, K.-H., & Deng, L. (2022). Structural equation modeling with small samples and many variables. In Handbook of Structural Equation Modeling.
Yuan, K.-H., & Chan, W. (2008). Structural equation modeling with near singular covariance matrices. Computational Statistics & Data Analysis, 52, 4842-4858.
Tian, Y., & Yuan, K.-H. (2019). Mean and variance corrected test statistics for structural equation modeling with many variables. Structural Equation Modeling, 26, 827-846.

WaurimaL의 한 마디:

이 내용이 여러분의 학위 논문이나 연구 설계에 실질적인 도움이 되길 바랍니다. 혹시 여러분의 연구 데이터에서 “표본이 너무 적어 분석이 안 된다”는 경고 메시지가 뜬다면, 제가 제안한 릿지(Ridge) 옵션을 먼저 검토해 보시는 건 어떨까요?

Chap 27. 탐색적 구조방정식 모델링(Exploratory Structural Equation Modeling, ESEM)

안녕하세요?

이번에는 고전적인 확인적 요인분석(CFA)의 한계를 극복하고, 실제 교육 현장의 복잡한 데이터를 가장 잘 반영할 수 있는 최신 분석 기법인 탐색적 구조방정식 모델링(Exploratory Structural Equation Modeling, ESEM)에 대해 깊이 있게 살펴보겠습니다.

Alexandre J. S. Morin의 연구를 기반으로, 여러분이 교육 현장에서 마주할 수 있는 구체적인 사례와 함께 구성했습니다.

1. 왜 ESEM이 필요한가? (CFA의 한계와 교육 데이터의 복잡성)

보통 우리는 설문지나 시험 문항을 만들 때, 특정 문항이 하나의 요인만을 측정한다고 가정합니다. 예를 들어 ‘수업 참여도’ 검사에서 “나는 수업 시간에 선생님의 질문에 대답한다”라는 문항은 오직 ‘행동적 참여’ 요인에만 속해야 한다고 생각하죠. 이것이 바로 확인적 요인분석(CFA)의 핵심인 ‘영(0) 부하량(Zero cross-loadings)’ 가정입니다.

하지만 현실은 다릅니다. 학생의 대답은 그 학생의 ‘정서적 즐거움’이나 ‘인지적 노력’과도 관련이 있을 수밖에 없습니다. CFA에서 이러한 미세한 관계(교차 부하량, cross-loadings)를 강제로 ‘0’으로 고정하면 다음과 같은 문제가 발생합니다.

요인 간 상관의 팽창: 실제보다 요인들이 훨씬 더 가깝게 연결된 것처럼 보입니다.
모델 적합도 저하: 복잡한 척도(예: 5~10개 요인, 50문항 이상)에서는 CFA로 좋은 적합도를 얻기가 거의 불가능합니다.

ESEM은 이러한 CFA의 통계적 엄밀함과 탐색적 요인분석(EFA)의 유연성을 결합한 모델입니다. 모든 문항이 모든 요인에 부하될 수 있도록 허용하면서도, 요인 간의 경로 분석이나 집단 비교가 가능하게 해줍니다.

2. 핵심 개념: 심리측정적 다차원성 (Psychometric Multidimensionality)

교육 데이터를 이해할 때 우리는 두 가지 형태의 다차원성을 고려해야 합니다.

(1) 구성개념 관련 다차원성 (Construct-Relevant)

개념적 관련 요인: ‘학업 자아개념’과 ‘학업 흥미’는 서로 다른 개념이지만 태생적으로 겹치는 부분이 있습니다. ESEM은 이들 사이의 교차 부하량을 허용하여 요인을 더 정확하게 정의합니다.
계층적 구조: ‘전반적인 학업 능력(Global)’과 ‘언어/수리/과학 특수 능력(Specific)’이 동시에 존재할 때 발생합니다. 이를 위해 이요인(Bifactor) 모델을 사용합니다.

(2) 구성개념 무관 다차원성 (Construct-Irrelevant)

문항의 ‘긍정/부정 문구 효과’나 ‘유사한 단어 반복’으로 인해 발생하는 오차 간 상관을 의미합니다. 이는 분석에서 반드시 통제되어야 합니다.

3. 데이터 생성 스토리: “학교 참여도의 다차원적 구조”

우리는 중학생 500명을 대상으로 학교 참여도를 측정한다고 가정합니다. 참여도는 전통적으로 세 가지 하위 요인으로 나뉩니다.

행동적 참여 (F1: Behavioral): 수업 규칙 준수, 숙제 제출 등 외현적 행동
정서적 참여 (F2: Emotional): 학교에 대한 소속감, 교사 및 교우와의 유대감
인지적 참여 (F3: Cognitive): 자기주도 학습 전략, 학습 내용에 대한 깊은 이해 노력

왜 ESEM이 필요한가?

실제 학교 현장에서 “나는 수업 시간에 선생님의 질문에 집중한다”는 문항은 행동적 참여를 측정하도록 설계되었지만, 선생님과의 관계(정서적 참여)나 학습 전략(인지적 참여)과도 통계적으로 유의미한 상관(교차 부하량, Cross-loadings)을 가질 수밖에 없습니다. 만약 CFA(확인적 요인분석)를 사용하여 이 교차 부하량을 강제로 0으로 고정하면, 요인 간 상관이 비정상적으로 높게 추정되는 오류(부풀려진 상관)가 발생하게 됩니다.

[분석 실습용 R 코드 예시]

# 1. 필수 패키지 설치 및 로드
if(!require(lavaan)) install.packages("lavaan")
library(lavaan)

# 2. 학교 참여도(School Engagement) 모의 데이터 생성 모델 정의
# 따옴표(')의 시작과 끝을 반드시 확인하세요.
population_model <- '
  # [주 부하량] 행동(F1), 정서(F2), 인지(F3) 참여도
  F1 =~ 0.7*x1 + 0.8*x2 + 0.6*x3 + 0.9*x4
  F2 =~ 0.6*y1 + 0.7*y2 + 0.8*y3 + 0.7*y4
  F3 =~ 0.5*z1 + 0.6*z2 + 0.7*z3 + 0.8*z4

  # [교차 부하량] Morin(2023)의 설계를 반영한 복잡성 추가
  F1 =~ 0.15*y1 + (-0.10)*z2
  F2 =~ 0.12*x3 + 0.18*z4
  F3 =~ 0.10*x1 + (-0.15)*y4

  # [요인 간 상관] 참여도 요인들 간의 실제 관계 설정
  F1 ~~ 0.25*F2
  F1 ~~ 0.20*F3
  F2 ~~ 0.35*F3
' # <--- 여기서 따옴표를 닫는 것이 중요합니다!

# 3. 데이터 생성 (N=500, 중학생 표본 가정)
set.seed(2026)
engagement_data <- simulateData(population_model, sample.nobs = 500)

이러한 상황에서 우리는 네 가지 모델을 순차적으로 비교해야 합니다.

CFA: 교차 부하량 없음 (가장 엄격)
ESEM: 교차 부하량 허용 (더 현실적)
Bifactor-CFA: ‘전반적 행복감’ 요인 + 3개 특수 요인
Bifactor-ESEM: 위 모델에 교차 부하량까지 허용 (가장 정교)

Chap27 다운로드

4. 분석 도구 및 방법 (jamovi & R)

현재 jamovi의 기본 인터페이스에서는 완전한 ESEM(특히 Bifactor-ESEM)을 직접 구현하기 어렵습니다. 따라서 R의 lavaan 패키지나 Mplus를 주로 사용하지만, 여기서는 여러분이 접근하기 쉬운 R 코드를 활용한 논리를 설명하겠습니다.

(1) 회전 방식 (Rotation)

ESEM은 요인을 해석하기 좋게 돌리는 ‘회전’ 과정이 필수입니다.

Geomin 회전: 기계적으로 요인을 단순화합니다.
Target 회전: 분석가가 이론에 근거하여 주 요인과 교차 부하량(0에 가깝게 유도)을 지정하는 방식입니다. 확인적 목적으로 사용할 때 권장됩니다.

(2) 모델 적합도 판단 기준

지표	우수함	수용 가능
CFI / TLI	$.95$ 이상	$.90$ 이상
RMSEA	$.06$ 이하	$.08$ 이하

5. 고급 분석: 측정 동일성과 DIF

검사가 공정한지 확인하는 과정입니다.

(1) 측정 동일성 (Measurement Invariance)

형태 동일성: 남녀 학생 모두 동일한 요인 구조를 갖는가?
약한 동일성 (Weak): 요인 부하량이 집단 간 같은가? (상관 분석의 전제 조건)
강한 동일성 (Strong): 문항의 절편이 같은가? (잠재 평균 비교의 전제 조건)

(2) 문항 반응 편향 (DIF, Differential Item Functioning)

집단별로 샘플 수가 너무 작거나 연속형 변수(예: 성적)에 따른 편향을 보고 싶을 때는 MIMIC 모델을 사용하여 DIF를 탐색합니다.

6. 결론 및 제언

ESEM은 CFA가 가진 ‘지나치게 깨끗한 모델’의 환상을 깨고, 데이터가 가진 있는 그대로의 복잡성을 수용합니다. 교육 현장의 데이터는 대개 지저분하고 얽혀 있습니다. CFA 적합도가 낮다고 문항을 지우기보다는, ESEM을 통해 우리 데이터의 다차원성을 정확하게 모델링하는 것이 더 과학적인 접근입니다.

WaurimaL의 한마디:

“여러분의 연구 데이터가 CFA에서 계속 거부당한다면, 그것은 데이터의 잘못이 아니라 모델이 너무 경직되었기 때문일 수 있습니다. ESEM이라는 더 넓은 세상을 탐험해 보세요!”

참고문헌

Asparouhov, T., & Muthén, B. (2009). Exploratory structural equation modeling. Structural Equation Modeling, 16(3), 397-438.
Marsh, H. W., Morin, A. J. S., Parker, P. D., & Kaur, G. (2014). Exploratory structural equation modeling: An integration of the best features of exploratory and confirmatory factor analysis. Annual Review of Clinical Psychology, 10, 85-110.
Morin, A. J. S. (2023). Exploratory structural equation modeling. In Specialized and Advanced Models and Applications (Chap. 27, pp. 503-524).
Morin, A. J. S., Arens, A. K., & Marsh, H. W. (2016). A bifactor exploratory structural equation modeling framework for the identification of distinct sources of construct-relevant psychometric multidimensionality. Structural Equation Modeling, 23(1), 116-139.

Chap 26. 다층 구조방정식 모델링

안녕하세요?
이번에는 교육 데이터의 복잡한 계층 구조를 가장 정교하게 분석할 수 있는 틀인 다층 구조방정식 모델링(Multilevel Structural Equation Modeling, 이하 MSEM)에 대해 살펴보겠습니다.

학교 현장에서 수집되는 데이터는 대부분 ‘학생’이 ‘학급’이나 ‘학교’에 속해 있는 위계적 구조(Hierarchical structure)를 가집니다. 이러한 데이터를 일반적인 회귀분석으로 돌리면 “관측치의 독립성” 가정이 깨져 결과가 왜곡됩니다. 이번엔 왜 MSEM이 필요한지, 그리고 어떻게 실제 데이터에 적용하는지 심도 있게 다뤄보겠습니다.

1. 왜 다층 구조방정식(MSEM)인가?

1.1 전통적 분석의 한계

전통적인 단일 수준(Single-level) 분석은 모든 학생이 서로 독립적이라고 가정합니다. 하지만 같은 학교에 다니는 학생들은 비슷한 교육 환경과 교사의 영향을 공유하므로 서로 닮아 있기 마련입니다. 이 ‘유사성’을 무시하면 표준오차가 과소추정되어, 실제로는 유의하지 않은 결과가 통계적으로 유의하게 나오는 제1종 오류를 범할 가능성이 커집니다.

1.2 MLM과 MSEM의 차이

흔히 사용하는 다층 모형(MLM)은 주로 관측 변수 간의 회귀 관계에 집중합니다. 반면 MSEM은 다음과 같은 독보적인 장점을 가집니다:

잠재 변수(Latent Variables) 활용: 직접 측정할 수 없는 ‘학업 자기효능감’이나 ‘학교 풍토’ 같은 개념을 측정 오차를 제거한 상태로 분석할 수 있습니다.
동시 추정: 여러 개의 종속 변수나 매개 경로를 한 번에 분석할 수 있습니다.
다양한 데이터 구조 대응: 횡단 데이터뿐만 아니라 반복 측정된 종단 데이터, 교차 분류 데이터 등에도 유연하게 적용됩니다.

2. 기본 원리와 수식의 이해

MSEM의 핵심은 전체 분산을 집단 내(Within-group) 분산과 집단 간(Between-group) 분산으로 완전히 분리하는 것입니다.

2.1 공분산 구조의 분해

개별 학생 $i$ 가 속한 학교 $j$ 의 관측치 $y_{ij}$ 에 대한 공분산 구조는 다음과 같이 표현됩니다.

$\Sigma_{T} = \Sigma_{W} + \Sigma_{B}$

여기서 $\Sigma_{W}$ 는 학생 수준의 차이를, $\Sigma_{B}$ 는 학교 수준의 차이를 의미합니다.

2.2 측정 모델 (MCFA)

다층 확인적 요인분석(MCFA)에서는 각 수준에서 고유한 요인 부하량( $\Lambda$ ), 요인 분산( $\Psi$ ), 잔차( $\Theta$ )를 가집니다.

$\Sigma_{T} = \Lambda_{B}\Psi_{B}\Lambda_{B}^{\prime} + \Lambda_{W}\Psi_{W}\Lambda_{W}^{\prime} + \Theta_{B} + \Theta_{W}$

3. 실전 사례: 학생의 자기효능감과 학교 생활 만족도

이해를 돕기 위해 가상의 교육 연구 시나리오를 만들어 보겠습니다.

연구 시나리오

대상: 100개 중학교에 재학 중인 학생 2,000명 (학교당 평균 20명).

측정 변수:

학업 자기효능감(SelfEfficacy): 문항 1, 2, 3 (잠재변수)

학교 생활 만족도(Satisfaction): 문항 4, 5, 6 (잠재변수)

연구 질문: 학생 개인의 자기효능감이 만족도에 미치는 영향은 어떠한가? 또한, 학교 전체의 평균적인 자기효능감 수준이 학교의 평균 만족도에 영향을 주는가?

3.1 모의 자료 생성 (R 코드)

jamovi의 SEMLj 모듈은 내부적으로 R의 lavaan 패키지를 사용합니다. 정교한 다층 분석을 위해 R 코드를 활용해 데이터를 생성하고 분석해 보겠습니다.

# 필요한 패키지 로드
library(lavaan)

# 1. 데이터 생성 (100개 학교, 학교당 20명)
set.seed(123)
n_schools <- 100
n_students_per_school <- 20
N <- n_schools * n_students_per_school

school_id <- rep(1:n_schools, each = n_students_per_school)

# 잠재 변수 생성 (Within & Between)
eta_W_eff <- rnorm(N)
eta_W_sat <- 0.6 * eta_W_eff + rnorm(N, sd = 0.8)

eta_B_eff <- rep(rnorm(n_schools, sd = 0.5), each = n_students_per_school)
eta_B_sat <- rep(0.8 * unique(eta_B_eff) + rnorm(n_schools, sd = 0.3), each = n_students_per_school)

# 문항 생성 (측정 오차 포함)
y1 <- 1.0 * (eta_W_eff + eta_B_eff) + rnorm(N, sd = 0.5)
y2 <- 0.9 * (eta_W_eff + eta_B_eff) + rnorm(N, sd = 0.5)
y3 <- 0.8 * (eta_W_eff + eta_B_eff) + rnorm(N, sd = 0.5)
y4 <- 1.0 * (eta_W_sat + eta_B_sat) + rnorm(N, sd = 0.5)
y5 <- 1.1 * (eta_W_sat + eta_B_sat) + rnorm(N, sd = 0.5)
y6 <- 0.9 * (eta_W_sat + eta_B_sat) + rnorm(N, sd = 0.5)

edu_data <- data.frame(school_id, y1, y2, y3, y4, y5, y6)

chap26 다운로드

4. 단계별 분석 모델 구성

모델 1: 단일 수준 분석 (Naive Analysis)

학교 구조를 무시하고 분석하는 방식입니다. 문항들이 잠재 변수를 잘 측정하는지 초기 확인 용도로 사용하지만, 추정치는 편향될 수 있습니다.

모델 2: 집단 내 요인 모델 (Within-Group Factors)

학교 간 차이를 통제하고 학생 개인 수준의 구조만 파악합니다. 학교 간 분산은 포화 모델(Saturated model)로 처리하여 학생 수준의 추정치를 정교화합니다.

모델 3: 다층 구성적 요인 모델 (Configural Factor Model)

가장 권장되는 모델로, 학생 수준과 학교 수준 모두에서 요인 구조를 설정합니다. 특히 요인 부하량( $\lambda$ )을 수준 간에 동일하게 제약(Invariance)하면, 두 수준의 잠재 변수가 동일한 개념적 의미를 갖는다고 해석할 수 있습니다.

5. MSEM 매개 효과 분석 (2-1-1 모델)

교육 연구에서 매우 중요한 2-1-1 매개 모델을 살펴봅시다. 예를 들어, 학교의 예산 지원(Level 2)이 학생의 자기효능감(Level 1)을 매개로 학생의 성취도(Level 1)에 영향을 주는 경우입니다.

장점: 전통적인 MLM은 상위 수준의 변수가 하위 수준의 결과에 미치는 복잡한 매개 경로를 평가하는 데 한계가 있지만, MSEM은 이를 편향 없이 추정해냅니다.
측정 오차 통제: 관측 변수의 합산 점수가 아닌 잠재 변수를 사용하므로 매개 효과 추정치가 더 정확합니다.

6. 결과 해석 및 적합도 평가

MSEM 분석 결과는 다음 지표들을 통해 종합적으로 판단합니다:

6.1 모델 적합도 (Model Fit)

전체 적합도: CFI, RMSEA, SRMR 등을 확인합니다. 단, 샘플 사이즈가 큰 학생 수준의 정보에 의해 지표가 왜곡될 수 있음을 주의해야 합니다.
수준별 적합도: 최근에는 집단 내(Within)와 집단 간(Between) 적합도를 분리하여 보고하는 추세입니다.

6.2 잠재 변수의 ICC

측정 문항뿐만 아니라 잠재 변수 자체의 ICC(Intraclass Correlation)를 계산할 수 있습니다. 이는 학교 간 차이에 의해 설명되는 잠재적 특성의 비율을 나타내며, 교육 정책의 효과를 평가하는 핵심 지표가 됩니다.

7. 결론 및 제언

MSEM은 교육 데이터의 복잡성을 있는 그대로 수용하면서도, 측정 오차를 배제한 순수한 개념적 관계를 밝혀낼 수 있는 강력한 도구입니다.

WaurimaL의 한마디:

“통계는 현상의 복잡함을 단순화하는 것이 아니라, 그 복잡함 속에서 질서를 찾는 과정입니다. 학교라는 울타리 속의 아이들을 이해하기 위해 MSEM이라는 안경을 써보시기 바랍니다.”

참고문헌

Asparouhov, T., & Muthén, B. (2010). Bayesian analysis of latent variable models using Mplus. Retrieved from www.statmodel.com/download/bayesadvantages18.pdf.
Heck, R. H., & Reid, T. (2025). Multilevel structural equation modeling. In Handbook of Structural Equation Modeling (Chap. 26, pp. 481-499).
Muthén, B. O. (1994). Multilevel covariance structure analysis. Sociological Methods and Research, 22(3), 376-398.
Preacher, K. J., Zhang, Z., & Zyphur, M. J. (2011). Alternative methods for assessing mediation in multilevel data: The advantages of multilevel SEM. Structural Equation Modeling, 18, 161-182.
Stapleton, L. M., Yang, J. S., & Hancock, G. R. (2016). Construct meaning in multilevel settings. Journal of Educational and Behavioral Statistics, 41(5), 481-520.

Chap 25. 구조방정식(SEM)과 잠재 변수 모델링을 활용한 심리측정 척도 평가

안녕하세요!
이번에는 “구조방정식(SEM)과 잠재 변수 모델링을 활용한 심리측정 척도 평가”에 관한 내용을 여러분이 이해하기 쉽게 교육 현장의 사례를 곁들여 살펴보겠습니다.

이 내용은 척도를 개발하거나 평가하려는 연구자들에게 필수적인 기초부터 고급 기법(잠재 혼합 모델 등)까지를 다룹니다.

1. 왜 척도 평가가 중요한가?

교육 및 사회과학 연구에서 우리가 측정하려는 대상(예: 학습 동기, 수학 불안, 지능)은 눈에 직접 보이지 않는 잠재 변수(Latent Variables)인 경우가 많습니다. 이러한 잠재 변수는 직접 잴 수 없기 때문에, 우리는 여러 개의 설문 문항이나 과제(지표, Indicators)를 통해 간접적으로 그 수준을 추론합니다.

이때 핵심은 “우리가 사용한 문항들이 정말로 그 잠재 특성을 잘 반영하고 있는가?”를 평가하는 것입니다. 이를 위해 구조방정식 모델링(SEM)과 잠재 변수 모델링(LVM)이 활용됩니다.

2. 고전검사이론(CTT)과 요인분석(FA): 기초 다지기

척도 평가의 가장 기본이 되는 수식은 고전검사이론의 관찰점수 분해입니다.

(1) 기본 방정식

$X = T + E$

$X$ : 학생이 설문지에서 얻은 실제 점수(관찰점수)
$T$ : 학생의 진정한 능력이나 특성(진점수, 잠재 변수)
$E$ : 측정 과정에서 발생하는 오차(측정 오차)

(2) 동질적 검사 모델 (Congeneric Model)

단일 요인 모델과 실질적으로 동일하게 취급되는 이 모델은 각 문항이 하나의 공통 요인에 서로 다른 가중치(부하량)로 연결되어 있다고 가정합니다. 교육 현장에서는 한 시험의 여러 문항이 하나의 수학적 사고력을 측정한다고 볼 때 이 모델을 적용합니다.

3. 척도의 잠재 구조 확인: EFA에서 CFA로

척도가 의도한 대로 구성되어 있는지 확인하기 위해 두 단계의 과정을 거칩니다.

1단계: 탐색적 요인분석 (EFA)

목적: 문항들이 몇 개의 요인으로 묶이는지 가설을 생성합니다.
절차: 전체 데이터의 일부(예: 1/2)를 사용하여 요인의 수( $m$ )를 변화시켜가며 최적의 구조를 찾습니다.

2단계: 확인적 요인분석 (CFA)

목적: EFA에서 세운 가설이 새로운 데이터에서도 맞는지 검증합니다.
절차: 나머지 데이터(Hold-out sample)를 사용하여 모델의 적합도(AIC, BIC 등)를 평가합니다.

[WaurimaL의 팁] 군집 효과(Clustering Effects)를 주의하세요!

학교 교육 연구에서는 학생들이 ‘학급’이나 ‘학교’에 속해 있습니다. 같은 반 학생들은 경험을 공유하므로 독립성 가정이 위배될 수 있습니다. 이를 무시하면 오차가 과소 추정되어 잘못된 결론을 내릴 수 있으므로 다층 모델링(Multilevel Modeling) 접근이 필요합니다.

4. 문항 반응 이론(IRT): 문항 하나하나를 현미경으로 보기

척도 전체의 신뢰도를 넘어, 개별 문항이 얼마나 어려운지, 얼마나 변별력이 있는지를 평가할 때 IRT를 사용합니다.

변별도( $a_j$ ): 능력이 높은 학생과 낮은 학생을 얼마나 잘 구분하는가?
난이도( $b_j$ ): 정답을 맞힐 확률(또는 긍정 응답 확률)이 50%가 되는 지점은 어디인가?

5. 고급 주제: 관찰되지 않은 이질성(Unobserved Heterogeneity)

최근 연구에서 가장 강조되는 부분입니다. 전체 집단이 하나라고 가정하고 분석하면 심각한 오류에 빠질 수 있습니다.

(1) 잠재 혼합 모델 (Latent Mixture Modeling)

우리 눈에는 보이지 않지만, 모집단 안에 성격이 다른 여러 잠재 계층(Latent Classes)이 존재할 수 있습니다. 예를 들어, ‘수학 효능감’ 척도를 분석할 때 ‘일반 학생 집단’과 ‘수포자 집단’은 문항에 반응하는 방식 자체가 다를 수 있습니다.

(2) 혼합 모델을 무시할 때의 위험성

허위적 Bifactor 구조: 실제로는 집단이 두 개인데 하나로 합쳐 분석하면, 존재하지 않는 요인이 있는 것처럼 보일 수 있습니다.
잘못된 문항 교정: 집단별로 문항의 난이도가 다른데 이를 평균 내버리면, 어느 집단에도 맞지 않는 잘못된 문항 특성치가 산출됩니다.

6. 실습: 학교 소속감 척도 평가 (가상 데이터 사례)

전문가로서 ‘학교 소속감(School Belongingness)’을 측정하는 5개 문항을 예로 들어 보겠습니다.

[스토리 설정]

행복중학교 교사들은 학생들의 학교 소속감을 측정하기 위해 5개 문항(5점 리커트 척도)을 개발했습니다.

나는 학교에 오는 것이 즐겁다.
우리 학교 선생님들은 나를 존중해 주신다.
나는 우리 학교의 일원이라는 것이 자랑스럽다.
학교에서 친구들과 함께 있을 때 편안하다.
우리 학교는 나에게 중요한 장소다.

조사 결과, 전체 학생은 약 500명이며, 내부적으로는 ‘교우관계 중심 집단’과 ‘학업 중심 집단’이라는 두 개의 잠재 계층이 존재한다고 가정합니다.

jamovi 및 R 구현 방법

1) jamovi 활용 (CFA 분석)

Factor 탭 -> Confirmatory Factor Analysis 선택.
문항 1~5를 ‘Factor 1’에 투입.
Model Fit에서 RMSEA, CFI, TLI 확인.
Reliability Analysis에서 Cronbach’s $\alpha$ 와 McDonald’s $\omega$ 확인.

2) R 활용 (잠재 혼합 모델링 – `tidyLPA` 패키지 예시)

잠재 계층이 존재하는지 확인하기 위해 R 코드를 작성해 보겠습니다.

# 필요한 패키지 로드
library(tidyLPA)
library(dplyr)

# 가상 데이터 생성 (전문가적 식견을 바탕으로 한 모의 데이터)
set.seed(123)
# 집단 1: 소속감이 높은 집단 (250명)
group1 <- matrix(rnorm(250 * 5, mean = 4.2, sd = 0.5), ncol = 5)
# 집단 2: 소속감이 낮은 집단 (250명)
group2 <- matrix(rnorm(250 * 5, mean = 2.5, sd = 0.8), ncol = 5)
df <- as.data.frame(rbind(group1, group2))
colnames(df) <- paste0("item", 1:5)

# 잠재 프로파일 분석(LPA) 수행 - 집단 수 결정 (1개 vs 2개)
results <- df %>%
  estimate_profiles(1:3) # 1개부터 3개 집단까지 비교

# 결과 비교 (BIC가 가장 낮은 모델 선택)
get_fit(results)

chap25 다운로드

7. 결론 및 제언

척도 평가를 단순히 신뢰도 계수( $\alpha$ ) 하나 확인하는 것으로 끝내서는 안 됩니다.

구조 확인: EFA/CFA를 통해 잠재 구조를 탄탄히 검증하십시오.
집단 특성 고려: 데이터 뒤에 숨겨진 이질적인 집단(잠재 계층)이 있는지 혼합 모델링으로 확인하십시오.
표본 크기: 복잡한 잠재 변수 모델을 사용할 때는 충분한 표본 크기가 확보되어야 결과가 안정적입니다.

참고문헌

Raykov, T. (2025). Psychometric scale evaluation using structural equation modeling and latent variable modeling. In R. Hoyle (Ed.), Handbook of structural equation modeling (2nd ed., pp. 462-480). Guilford Press.
Bollen, K. A. (1989). Structural equations with latent variables. Wiley.
Crocker, L., & Algina, J. (2006). Introduction to classical and modern test theory. Harcourt College Publishers.
Muthén, L. K., & Muthén, B. (2021). Mplus user’s guide. Authors.
Raykov, T., & Marcoulides, G. A. (2011). Introduction to psychometric theory. Taylor & Francis.
Reckase, M. (2009). Multidimensional item response theory. Springer.

Chap 24. 잠재 상호작용을 활용한 동적 조절 분석: 일반 교차 지연 패널 모델(GCLM)의 확장

안녕하세요?
이번에는 잠재 상호작용을 활용한 동적 조절 분석에 대해 살펴보겠습니다.

1. 왜 ‘동적 조절(Dynamic Moderation)’인가?

기존의 교차 지연 패널 모델(Cross-Lagged Panel Model, CLPM)은 두 변수가 시간이 흐름에 따라 서로 어떤 영향을 주고받는지(상호 인과성)를 파악하는 데 유용했습니다. 하지만 전통적인 CLPM은 두 가지 큰 한계가 있습니다.

안정적 특성(Trait) 무시: 개인의 고유한 성향(예: 지능, 성격)처럼 변하지 않는 ‘안정적 요인’을 통제하지 못해 계수가 왜곡될 수 있습니다.
동적 관계의 불변성 가정: A가 B에 미치는 영향이 모든 사람에게, 모든 상황에서 동일하다고 가정합니다.

현실의 교육 현장에서는 그렇지 않습니다. 예를 들어, ‘학업 자기효능감’이 ‘학업 참여도’에 미치는 영향은 학생이 처한 최근의 상황(충격, Impulse)이나 다른 변수의 수준에 따라 달라질 수 있습니다. 이를 분석하기 위해 우리는 일반 교차 지연 패널 모델(General CLPM, GCLM)에 잠재 상호작용(Latent Interaction)을 결합한 동적 조절 모델을 학습할 것입니다.

2. GCLM의 핵심 구성 요소

GCLM은 단순히 과거가 현재에 미치는 영향뿐만 아니라, 시스템 내에 발생하는 ‘예상치 못한 사건(충격)’이 어떻게 흐르는지를 추적합니다.

자기회귀(AR) 및 교차지연(CL) 효과: 과거의 변수가 현재의 자신과 상대 변수에 미치는 영향입니다.
이동평균(MA) 및 교차지연 이동평균(CLMA): 과거에 발생한 ‘충격(Impulse)’이 단기적으로 현재에 미치는 영향을 조절합니다.
단위 효과(Unit Effects, $\eta$ ): 시간의 흐름과 상관없이 개인별로 일정하게 유지되는 ‘안정적인 특성’입니다.
충격(Impulse, $u_t$ ): 특정 시점에서 발생하는 무작위적 변화나 사건을 의미합니다.

3. 교육 연구 사례: 학업 자기효능감(ASE)과 학업 참여(AE)

[가상의 시나리오]

연구 질문: “고등학생의 학업 자기효능감(ASE)이 학업 참여(AE)에 미치는 영향은, 학생이 겪은 최근의 ‘자기효능감의 갑작스러운 변화(충격)’에 의해 조절되는가?”

참여 대상: 고등학생 300명 ( $N=300$ )
측정 시점: 1학년 1학기부터 2학년 2학기까지 총 4회 ( $T=4$ )
변수: 학업 자기효능감(ASE), 학업 참여(AE)

4. 모의 자료 생성 및 분석 (R 코드 구현)

jamovi의 기본 SEM 모듈(SEMLj)은 이동평균(MA) 구조와 잠재 상호작용을 동시에 처리하는 데 제약이 있으므로, 인과 관계 추론에 특화된 R의 lavaan 패키지를 활용하여 분석을 진행합니다.

4.1. 모의 자료 생성 (R)

# 필요한 패키지 로드
if(!require(lavaan)) install.packages("lavaan")
if(!require(tidyverse)) install.packages("tidyverse")
library(lavaan)
library(tidyverse)

# 1. 데이터 시뮬레이션 (N=300, T=4)
set.seed(2025)
n <- 300
t <- 4

# 안정적 단위 효과(Trait) 생성
eta_ase <- rnorm(n, 0, 0.8)
eta_ae  <- rnorm(n, 0, 0.8)

# 시점별 충격(Impulse) 및 변수 생성
ase <- matrix(0, n, t)
ae <- matrix(0, n, t)

for(i in 1:t) {
  u_ase <- rnorm(n, 0, 0.5)
  u_ae <- rnorm(n, 0, 0.5)
  
  if(i == 1) {
    ase[,i] <- eta_ase + u_ase
    ae[,i]  <- eta_ae + u_ae
  } else {
    # GCLM 메커니즘: AR + CL + Interaction (Dynamic Moderation)
    # 이전 시점의 충격 간 상호작용이 현재에 미치는 영향 가정
    interaction_effect <- 0.2 * (ase[,i-1] * ae[,i-1]) 
    
    ase[,i] <- 0.5*ase[,i-1] + 0.2*ae[,i-1] + eta_ase + u_ase + interaction_effect
    ae[,i]  <- 0.5*ae[,i-1] + 0.3*ase[,i-1] + eta_ae + u_ae + interaction_effect
  }
}

df <- data.frame(ase, ae)
colnames(df) <- c("ASE1", "ASE2", "ASE3", "ASE4", "AE1", "AE2", "AE3", "AE4")

chap24 다운로드

4.2. GCLM 및 동적 조절 모델 명세 (lavaan)

# GCLM 모델 정의 (단위 효과 및 MA/CLMA 포함)
gclm_model <- '
  # 단위 효과 (Trait)
  f_ASE =~ 1*ASE1 + 1*ASE2 + 1*ASE3 + 1*ASE4
  f_AE  =~ 1*AE1 + 1*AE2 + 1*AE3 + 1*AE4

  # 잠재 충격(Impulse) 정의
  u_ase2 =~ 1*ASE2; u_ase3 =~ 1*ASE3; u_ase4 =~ 1*ASE4
  u_ae2  =~ 1*AE2; u_ae3  =~ 1*AE3; u_ae4  =~ 1*AE4

  # 자기회귀 및 교차지연 (AR/CL)
  ASE2 ~ beta1*ASE1 + gamma1*AE1
  ASE3 ~ beta1*ASE2 + gamma1*AE2
  ASE4 ~ beta1*ASE3 + gamma1*AE3
  
  AE2 ~ beta2*AE1 + gamma2*ASE1
  AE3 ~ beta2*AE2 + gamma2*ASE2
  AE4 ~ beta2*AE3 + gamma2*ASE3

  # 동적 조절 (잠재 상호작용 항 - 개념적 구현)
  # 실제 분석에서는 indProd 등을 사용하여 상호작용 항 생성 필요
'
# (참고: 실제 잠재 상호작용은 Bayesian 추정이나 2단계 접근법이 권장됨)

5. 결과 해석 가이드

분석 결과 테이블에서 주목해야 할 부분은 다음과 같습니다.

5.1. 주요 파라미터 해석

파라미터	의미	교육적 해석 예시
AR ( $\beta$ )	지속성	지난 학기 효능감이 이번 학기에도 유지되는 정도
CL ( $\gamma$ )	교차 영향	지난 학기 효능감이 이번 학기 학업 참여를 예측하는 정도
MA ( $\delta$ )	단기 충격	어제 받은 칭찬(충격)이 오늘 학업에 미치는 즉각적 효과
Interaction ( $\beta_{xy}$ )	동적 조절	효능감의 갑작스러운 상승이 학업 참여의 지속성을 강화하는가?

5.2. 동적 조절의 시각화

동적 조절 효과가 유의미하다면, 아래와 같은 조절 효과 그래프가 나타납니다.

해석: “과거 학업 자기효능감의 충격( $u_{ase, t-1}$ )이 컸던 학생들(High)은, 학업 참여 충격이 미래의 학업 참여에 미치는 영향(지속성)이 더 강하게 나타납니다.”

6. 결론 및 시사점

본 장에서 다룬 동적 조절 모델은 교육 현장의 복잡한 데이터를 분석하는 데 매우 강력한 도구입니다.

정밀한 인과 추론: 학생 개개인의 성향(Unit Effect)을 통제한 상태에서, 순수한 ‘변화’들 간의 관계를 분석할 수 있습니다.
맞춤형 개입 전략: 어떤 학생들에게 특정 교육 프로그램(충격)이 더 효과적인지, 즉 ‘누구에게, 언제’ 효과가 나타나는지 조절 효과를 통해 파악할 수 있습니다.
이론적 확장: 학업 성취도와 심리적 안녕감 등 다양한 교육적 변수들 사이의 ‘단기적 상호작용’을 이론적으로 검증할 수 있게 해줍니다.

7. 참고문헌

Allison, P. D. (2005). Fixed effects regression methods for longitudinal data using SAS. SAS Institute.
Asparouhov, T., & Muthén, B. (2021). Bayesian estimation of single and multilevel models with latent variable interactions. Structural Equation Modeling, 28(2), 314-328.
Hamaker, E. L., Kuiper, R. M., & Grasman, R. P. (2015). A critique of the cross-lagged panel model. Psychological Methods, 20(1), 102-116.
Zyphur, M. J., Allison, P. D., Tay, L., Voelkle, M. C., Preacher, K. J., Zhang, Z., … & Diener, E. (2020). From data to causes I: Building a general cross-lagged panel model (GCLM). Organizational Research Methods, 23(4), 651-687.
Zyphur, M. J., & Ozkok, O. (2025). Dynamic moderation with latent interactions: General cross-lagged panel models with interaction effects over time. In Handbook of Structural Equation Modeling.

Chap 23. 잠재 상호작용 효과(Latent Interaction Effects)

안녕하십니까?
이번에는 잠재 상호작용 효과(Latent Interaction Effects)에 대해 깊이 있게 다루어 보겠습니다.

우리는 흔히 “A가 B에 영향을 준다”는 선형적인 관계에 익숙하지만, 실제 교육 현장은 훨씬 복잡합니다. 예를 들어, 학습자의 ‘학습 동기’가 ‘학업 성취’에 미치는 영향은 학습자의 ‘자기효능감’ 수준에 따라 달라질 수 있습니다. 이러한 현상을 통계적으로 모델링하는 것이 바로 상호작용 효과입니다. 특히, 측정 오차를 배제하고 이론적 구조를 더 정확히 파악하기 위해 구조방정식 모델(SEM) 내에서 이를 추정하는 방법을 상세히 살펴보겠습니다.

1. 잠재 상호작용 모델의 기초

1.1. 왜 잠재 상호작용인가?

많은 심리학 및 교육학 이론은 인간 행동의 복잡한 패턴을 설명하기 위해 변수 간의 관계가 다른 변수에 의해 조절되는 중재(moderated) 관계를 상정합니다. 대표적인 예가 기대-가치 이론(Expectancy-Value Theory)입니다. 이 이론에 따르면, 특정 과목(예: 수학)에 대한 ‘성공 기대’와 그 과목에 부여하는 ‘가치’는 서로 상호작용하여 학업 성취나 진로 선택을 예측합니다.

전통적인 회귀분석에서는 관측 변수들을 곱해 상호작용 항을 만들지만, 이는 변수에 포함된 측정 오차(Measurement Error)를 무시한다는 치명적인 단점이 있습니다. 구조방정식을 이용한 잠재 상호작용 모델은 이 오차를 고려하여 통계적 검정력(Power)을 높이고 이론적 구성을 더 정교하게 반영합니다.

1.2. 수식적 표현

잠재 상호작용 모델의 구조식은 다음과 같습니다:

$\eta = \alpha + \gamma_1 \xi_1 + \gamma_2 \xi_2 + \omega_{12} \xi_1 \xi_2 + \zeta$

$\eta$ : 잠재 종속 변수 (예: 수학 실력)
$\xi_1, \xi_2$ : 잠재 독립 변수 (예: 성공 기대, 내재적 가치)
$\omega_{12}$ : 잠재 상호작용 효과 (두 독립 변수의 곱에 의한 효과)
$\zeta$ : 회귀식의 잔차

2. 잠재 상호작용 추정의 어려움

잠재 상호작용을 추정하는 것은 일반적인 SEM보다 훨씬 까다롭습니다. 그 이유는 다음과 같습니다.

비정규성(Non-normality): 두 잠재 변수( $\xi_1, \xi_2$ )가 각각 정규분포를 따르더라도, 그 곱인 $\xi_1\xi_2$ 는 필연적으로 비정규분포를 따르게 됩니다.
추정의 편향: 표준 최대우도법(ML)을 그대로 사용하면 모수 추정치는 일치할 수 있으나, 표준오차(SE)가 과소추정되어 1종 오류(Type I error)가 발생할 위험이 커집니다.
계산 복잡성: 관측 변수들의 결합 우도(Likelihood)가 닫힌 형태(closed form)로 존재하지 않아 매우 복잡한 알고리즘(예: EM 알고리즘)이 필요합니다.

3. 주요 추정 접근법

다양한 연구자들이 지난 30년간 이 문제를 해결하기 위해 여러 접근법을 개발해 왔습니다.

3.1. 적률 지표 접근법 (Product Indicator, PI)

가장 고전적인 방법으로, 잠재 변수의 지표(Indicator)들을 서로 곱하여 상호작용 잠재 변수의 지표로 사용하는 방식입니다.

UPI (Unconstrained Product Indicator): Marsh 등(2004)이 제안한 방식으로, 복잡한 비선형 제약 조건을 생략하고 지표를 자유롭게 추정하게 하여 편의성을 높였습니다.

3.2. 분포 분석적 접근법 (Distribution Analytic)

제품 지표를 직접 만들지 않고 분포의 특성을 이용하는 방식입니다.

LMS (Latent Moderated Structural Equations): 비정규 분포를 조건부 정규 분포의 혼합으로 근사하여 추정합니다. 현존하는 방법 중 가장 효율적이고 검정력이 높다고 알려져 있습니다.
QML (Quasi-Maximum Likelihood): LMS보다 계산 속도가 빠르고 독립 변수가 비정규 분포일 때 약간 더 강건(robust)합니다.

3.3. 강건한 접근법 (Robust Approaches)

데이터가 정규성 가정을 심하게 위반할 때 사용합니다.

MIIV-2SLS: 도구 변수(Instrumental Variables)를 사용하여 측정 오차와 구조적 오분류에 강건하게 대응합니다.
2SMM (Two-Stage Method of Moments): 요인 점수를 기반으로 적률을 수정하여 추정하는 방식입니다.

4. 실전 분석 예시: 고등학교 수학 성취도 데이터

이해를 돕기 위해 교육 현장의 시나리오를 바탕으로 모의 데이터를 생성하고 분석해 보겠습니다.

시나리오:

어느 고등학교 1학년 학생 400명을 대상으로 수학 학습 성향을 조사했습니다. 연구자는 ‘수학 자기효능감(Expectancy)’과 ‘수학에 대한 흥미(Intrinsic Value)’가 실제 ‘수학 성적(Achievement)’을 어떻게 예측하는지, 그리고 ‘흥미’가 높을수록 ‘자기효능감’이 성적에 미치는 영향이 더 강해지는지(상호작용)를 확인하고자 합니다.

4.1. 데이터 생성 (R 코드)

분석 도구로 R의 lavaan 패키지를 사용하겠습니다. (jamovi에서는 GAMLj 모듈을 통해 일부 가능하지만, 복잡한 잠재 상호작용은 R 코드가 더 정확합니다.)

# 필요한 패키지 로드
if(!require(lavaan)) install.packages("lavaan")
if(!require(MASS)) install.packages("MASS")

set.seed(123)
N <- 400

# 1. 잠재 변수 생성 (성공 기대 xi1, 내재적 가치 xi2)
sigma_xi <- matrix(c(1.0, 0.4, 0.4, 1.0), 2, 2)
xi <- mvrnorm(N, mu = c(0, 0), Sigma = sigma_xi)
xi1 <- xi[,1]
xi2 <- xi[,2]

# 2. 구조 모델 설정 (상호작용 효과 포함)
# Achievement = 0.5*Expectancy - 0.1*Value + 0.2*(Expectancy*Value) + Error
eta <- 0.5 * xi1 - 0.1 * xi2 + 0.15 * (xi1 * xi2) + rnorm(N, sd = 0.5)

# 3. 측정 모델 생성 (각 잠재변수당 3개의 문항)
# Expectancy 지표 (x1-x3), Value 지표 (x4-x6), Achievement 지표 (y1-y3)
x1 <- 1.0*xi1 + rnorm(N, sd=0.5); x2 <- 0.8*xi1 + rnorm(N, sd=0.5); x3 <- 0.7*xi1 + rnorm(N, sd=0.5)
x4 <- 1.0*xi2 + rnorm(N, sd=0.5); x5 <- 0.9*xi2 + rnorm(N, sd=0.5); x6 <- 0.8*xi2 + rnorm(N, sd=0.5)
y1 <- 1.0*eta + rnorm(N, sd=0.5); y2 <- 1.1*eta + rnorm(N, sd=0.5); y3 <- 0.9*eta + rnorm(N, sd=0.5)

df <- data.frame(x1, x2, x3, x4, x5, x6, y1, y2, y3)

chap23 다운로드

4.2. UPI 접근법을 이용한 분석

가장 널리 쓰이는 UPI 방식을 lavaan으로 구현해 보겠습니다.

# 제품 지표 생성 (x1*x4, x2*x5, x3*x6)
df$x1x4 <- df$x1 * df$x4
df$x2x5 <- df$x2 * df$x5
df$x3x6 <- df$x3 * df$x6

model_upi <- '
  # 측정 모델
  Expectancy =~ x1 + x2 + x3
  Value      =~ x4 + x5 + x6
  Interact   =~ x1x4 + x2x5 + x3x6
  Achieve    =~ y1 + y2 + y3

  # 구조 모델
  Achieve ~ g1*Expectancy + g2*Value + w12*Interact
'
fit <- sem(model_upi, data = df)
summary(fit, standardized = TRUE)

4.3. 결과 해석

분석 결과, 다음과 같은 수치들이 도출되었다고 가정해 봅시다(실제 위 데이터 분석 시 유사하게 나옵니다).

자기효능감( $\gamma_1$ ): 0.52 (p < .001) → 평균적인 흥미 수준에서 자기효능감은 성적에 강한 정적 영향을 미칩니다.
흥미( $\gamma_2$ ): -0.11 (p = .12) → 자기효능감이 평균일 때 흥미 자체의 직접 효과는 미미할 수 있습니다.
상호작용( $\omega_{12}$ ): 0.18 (p = .03) → 유의미한 상호작용 효과 발견!

조절 효과 그래프(Simple Slopes):

그래프를 보면 수학에 대한 흥미가 높은 학생일수록, 자기효능감이 성적 향상으로 이어지는 정도가 훨씬 가파른 것을 알 수 있습니다.

5. 연구자를 위한 제언

데이터 상황에 따라 어떤 알고리즘을 선택해야 할까요?

데이터 상황	추천 접근법	이유
잠재 변수가 정규분포를 따를 때	LMS, QML	가장 높은 검정력과 효율성을 가짐
잠재 변수가 비정규분포일 때	2SMM, NSEMM	정규성 위반에 강건함
모델 오분류가 우려될 때	MIIV-2SLS	특정 부분의 오류가 모델 전체로 퍼지는 것을 방지
매우 유연한 비선형 관계 탐색	세미/비모수 접근법	복잡한 곡선 관계 추정 가능

WaurimaL의 한마디:

잠재 상호작용 모델은 처음에는 어렵게 느껴지지만, 교육 현장의 역동성을 포착하는 데 이보다 강력한 도구는 없습니다. 단순히 통계량을 계산하는 데 그치지 말고, 그 상호작용이 우리 학생들에게 어떤 교육적 함의를 주는지 항상 고민해 보시기 바랍니다.

6. 참고문헌

Bauer, D. J. (2005). A semiparametric approach to modeling nonlinear relations among latent variables. Structural Equation Modeling, 12(4), 513–535.
Bollen, K. A., & Paxton, P. (1998). Interactions of latent variables in structural equation models. Structural Equation Modeling, 5(3), 267–293.
Eccles, J., Adler, T. F., Futterman, R., Goff, S. B., Kaczala, C. M., Meece, J., et al. (1983). Expectancies, values and academic behaviors. In J. T. Spence (Ed.), Achievement and achievement motives (pp. 75–146). San Francisco: Freeman.
Kelava, A., & Brandt, H. (2014). A general nonlinear multilevel structural equation mixture model. Frontiers in Psychology, 5, Article 748.
Kenny, D., & Judd, C. M. (1984). Estimating the nonlinear and interactive effects of latent variables. Psychological Bulletin, 96(1), 201–210.
Klein, A. G., & Moosbrugger, H. (2000). Maximum likelihood estimation of latent interaction effects with the LMS method. Psychometrika, 65(4), 457–474.
Marsh, H. W., Wen, Z., & Hau, K.-T. (2004). Structural equation models of latent interactions: Evaluation of alternative estimation strategies and indicator construction. Psychological Methods, 9(3), 275–300.
Wall, M. M., & Amemiya, Y. (2003). A method of moments technique for fitting interaction effects in structural equation models. British Journal of Mathematical and Statistical Psychology, 56(1), 47-63.

Chap 22. 구조방정식 모델링에서의 매개 및 간접효과

안녕하세요?

본 내용은 매개효과(Mediation)와 간접효과(Indirect Effects)를 중심으로 교육 현장의 실제적인 예시와 함께 jamovi 및 R을 활용한 분석 방법을 살펴보겠습니다.

1. 개요 및 역사적 배경

매개분석은 독립변수( $X$ )가 종속변수( $Y$ )에 영향을 미치는 과정에서 제3의 변수인 매개변수( $M$ )가 어떤 역할을 하는지 탐구하는 방법입니다. 이 개념의 뿌리는 1920년대 Sewall Wright의 경로 분석(Path Analysis)에서 시작되었습니다. Wright는 경로 도표를 통해 변수 간의 인과 관계를 시각화하고, 연쇄적인 경로 계수들의 곱으로 간접적인 영향력을 수치화했습니다.

1970~80년대에 들어서면서 이러한 경로 분석 전통은 측정 오차를 고려하는 심리측정학적 전통과 결합하여 현대의 구조방정식 모델링(SEM)으로 발전했습니다. 이제 우리는 관찰 변수뿐만 아니라 직접 측정하기 어려운 잠재 변수(Latent Variables)를 포함하여 더욱 정교한 매개 모델을 검증할 수 있게 되었습니다.

2. 매개변수의 정의와 유사 개념 구분

연구자는 매개변수를 설정할 때, 유사한 역할을 하는 다른 변수들과 혼동하지 않아야 합니다.

개념	정의	인과 구조
매개변수 (Mediator)	독립변수와 종속변수 사이에서 효과를 전달하는 변수	$X \rightarrow M \rightarrow Y$
교란변수 (Confounder)	$X$ 와 $Y$ 모두에 영향을 주어 둘 사이의 관계를 왜곡하는 변수	$X \leftarrow C \rightarrow Y$
통제변수 (Collider)	$X$ 와 $Y$ 모두로부터 영향을 받는 변수 (분석 시 통제하면 관계가 왜곡됨)	$X \rightarrow C \leftarrow Y$

[WaurimaL Note] 교육 연구에서 ‘학습 동기’가 ‘학습 시간’을 거쳐 ‘성적’에 영향을 준다면 이는 매개 효과입니다. 하지만 ‘지능’이 ‘학습 시간’과 ‘성적’ 모두에 영향을 준다면 이는 교란 효과이므로 지능을 통제해야 정확한 인과 파악이 가능합니다.

3. 매개 모델의 수리적 이해

3.1. 기본 방정식

SEM에서 매개 모델은 다음과 같은 행렬식으로 표현됩니다.

$\eta = B\eta + \Gamma\xi + \zeta$

$\eta$ (Eta): 내생변수(매개변수와 종속변수) 벡터
$\xi$ (Xi): 외생변수(독립변수) 벡터
$\Gamma$ (Gamma): 외생변수가 내생변수에 미치는 직접 효과 행렬
$B$ (Beta): 내생변수 간의 직접 효과 행렬
$\zeta$ (Zeta): 잔차(Residuals) 벡터

3.2. 효과의 분해 (Decomposition)

전체 효과(Total Effect)는 다음과 같이 분해됩니다.

직접 효과 (Direct Effect): 매개변수를 거치지 않고 직접 전달되는 경로 ( $X \rightarrow Y$ )
간접 효과 (Indirect Effect): 매개변수를 통해 전달되는 경로 ( $X \rightarrow M \rightarrow Y$ ). 경로 계수들의 곱으로 계산합니다.
총 효과 (Total Effect): 직접 효과 + 간접 효과

4. [실습] 교육 현장 모의 사례 분석

4.1. 연구 시나리오: “교사 열정이 학생 성적에 미치는 영향”

독립변수(X): 교사의 교수 열정 (Teaching Passion, 3개 문항)
매개변수(M): 학생의 학습 몰입 (Student Engagement, 3개 문항)
종속변수(Y): 학업 성취도 (Academic Achievement, 3개 문항)

우리는 교사의 열정이 학생들의 학습 몰입을 높이고, 이것이 최종적으로 성적 향상으로 이어지는지 확인하고자 합니다.

4.2. 모의 데이터 생성 (R 코드)

실제 분석을 위해 다음과 같이 상관관계가 있는 모의 데이터를 생성합니다.

# 필요한 라이브러리 로드
library(lavaan)
library(psych)

# 데이터 생성 설정
set.seed(2025)
n <- 500

# 잠재변수 생성
Teacher_Passion <- rnorm(n)
Student_Engagement <- 0.5 * Teacher_Passion + rnorm(n, sd = 0.8)
Achievement <- 0.2 * Teacher_Passion + 0.4 * Student_Engagement + rnorm(n, sd = 0.7)

# 관찰변수(문항) 생성 (측정모델)
df <- data.frame(
  x1 = Teacher_Passion + rnorm(n, sd = 0.5), x2 = Teacher_Passion + rnorm(n, sd = 0.5), x3 = Teacher_Passion + rnorm(n, sd = 0.5),
  m1 = Student_Engagement + rnorm(n, sd = 0.5), m2 = Student_Engagement + rnorm(n, sd = 0.5), m3 = Student_Engagement + rnorm(n, sd = 0.5),
  y1 = Achievement + rnorm(n, sd = 0.5), y2 = Achievement + rnorm(n, sd = 0.5), y3 = Achievement + rnorm(n, sd = 0.5)
)

chap22 다운로드

4.3. jamovi에서의 분석 방법

SEMLj 모듈 설치: jamovi의 Modules -> jamovi library에서 SEMLj를 설치합니다.
모델 설정:
- 측정 모델(Measurement Model):
  - Passion =~ x1 + x2 + x3
  - Engagement =~ m1 + m2 + m3
  - Achievement =~ y1 + y2 + y3
- 구조 모델(Structural Model):
  - Engagement ~ a*Passion
  - Achievement ~ b*Engagement + c*Passion
- 매개효과 정의:
  - Indirect := a * b
  - Total := c + (a * b)
Bootstrapping 설정: Options에서 Standard Errors를 Bootstrap으로 설정합니다 (권장 횟수 5,000회 이상).

5. 통계적 유의성 검증: Sobel vs. Bootstrapping

간접효과( $a \times b$ )의 유의성을 검증하는 방법에는 크게 두 가지가 있습니다.

Sobel Test (Delta Method): 간접효과값이 정규분포를 따른다는 가정하에 표준오차를 구합니다. 하지만 간접효과( $a \times b$ )는 대개 비대칭적인 분포를 보이기 때문에 표본이 아주 크지 않으면 제1종 오류나 낮은 검정력의 문제가 발생합니다.
Bootstrapping (권장): 표본 데이터에서 수천 번 재표집하여 간접효과의 경험적 분포를 만듭니다. 정규성 가정이 필요 없으며, 현재 SEM 소프트웨어(Mplus, lavaan, AMOS 등)에서 표준적으로 사용됩니다.

6. 현대적 접근: 인과적 매개 분석 (Causal Mediation)

최근에는 잠재적 결과(Potential Outcomes) 프레임워크를 기반으로 한 인과적 매개 분석이 주목받고 있습니다. 이는 다음과 같은 세부 효과를 정의합니다.

TNDE/PNDE (자연적 직접 효과): 매개변수를 통제했을 때 독립변수가 종속변수에 미치는 순수한 효과
TNIE/PNIE (자연적 간접 효과): 독립변수가 매개변수의 변화를 통해 종속변수에 미치는 효과

이 접근법은 변수 간 상호작용( $X \times M$ )이 존재하거나 종속변수가 이분형인 비선형 모델에서도 정확한 효과 분해를 가능하게 합니다.

7. 측정상의 가정 및 주의점

매개분석의 결과는 측정의 질에 의존합니다.

신뢰도(Reliability): 매개변수의 측정 오차는 매개효과를 과소추정(attenuation)하게 만듭니다. SEM은 잠재변수를 사용함으로써 이 문제를 보완합니다.
타당도(Validity): 매개변수가 다차원적 구조를 가질 경우, 이를 단일 차원으로 묶어 분석하면 결과가 왜곡될 수 있습니다. 이 경우 Bifactor 모델 등을 통해 일반 요인과 특수 요인의 매개 효과를 각각 검증해야 합니다.
측정 불변성(Measurement Invariance): 집단 비교 시(예: 남학생 vs 여학생), 문항들이 각 집단에서 동일하게 기능하는지 먼저 확인해야 합니다. 그렇지 않으면 가짜 상호작용 효과가 나타날 수 있습니다.

8. 결론

매개분석은 단순히 “영향이 있다”를 넘어 “어떻게(How)” 영향이 전달되는지를 설명해 줍니다. 교육 현장에서는 특정 프로그램이 학생의 심리적 기제를 어떻게 변화시켜 성취도를 높이는지 파악함으로써, 보다 효과적인 교육 개입 전략을 수립하는 데 기여할 수 있습니다.

참고문헌 (APA Style)

Alwin, D. F., & Hauser, R. M. (1975). The decomposition of effects in path analysis. American Sociological Review, 40(1), 37–47.
Baron, R. M., & Kenny, D. A. (1986). The moderator-mediator variable distinction in social psychological research: Conceptual, strategic, and statistical considerations. Journal of Personality and Social Psychology, 51(6), 1173–1182.
Gonzalez, O., Valente, M. J., Cheong, J., & MacKinnon, D. P. (2025). Mediation/indirect effects in structural equation modeling. In Handbook of Structural Equation Modeling.
MacKinnon, D. P., Lockwood, C. M., & Williams, J. (2004). Confidence limits for the indirect effect: Distribution of the product and resampling methods. Multivariate Behavioral Research, 39(1), 99–128.
Muthen, L. K., & Muthen, B. O. (1998/2014). Mplus user’s guide. Muthen & Muthen.
Pearl, J. (2012). The causal mediation formula—A guide to the assessment of pathways and mechanisms. Prevention Science, 13(4), 426–436.
Sobel, M. E. (1982). Asymptotic confidence intervals for indirect effects in structural equation models. Sociological Methodology, 13, 290–312.

Chap 21. 평균 분석을 위한 유연한 구조방정식 모델링(Structural Equation Modeling, SEM) 접근법

안녕하세요!

오늘 우리가 함께 살펴볼 내용은 평균 분석을 위한 유연한 구조방정식 모델링(Structural Equation Modeling, SEM) 접근법입니다. 흔히들 평균 차이를 비교한다고 하면 ANOVA(분산분석)나 t-검정만을 떠올리곤 하죠. 하지만 SEM을 활용하면 기존의 OLS(최소자승법) 방식이 가진 한계를 뛰어넘어 훨씬 더 정교하고 유연한 분석이 가능해집니다.

이 내용을 여러분이 교육 현장에서 바로 활용할 수 있도록, ‘교수법에 따른 수학 학습 만족도 차이’라는 가상 시나리오를 바탕으로 살펴보겠습니다. 분석 도구는 jamovi를 기본으로 하되, 복잡한 제약 조건이 필요한 경우 R(lavaan 패키지) 코드를 병행하여 설명하겠습니다.

1. 왜 ANOVA 대신 구조방정식(SEM)인가?

사회과학자들은 집단 간 평균 차이를 검정하기 위해 ANOVA나 MANOVA를 자주 사용합니다. 하지만 이러한 전통적인 방식은 ‘교과서적인(cookbook)’ 방식에 치우쳐 통계적 가정이 충족되는지, 혹은 연구 가설을 가장 잘 반영하는 모델인지 비판적으로 평가하지 못할 때가 많습니다.

SEM을 활용한 평균 분석은 다음과 같은 강력한 장점을 가집니다:

유연성: 관찰변수뿐만 아니라 잠재변수(Latent Variable)에 대한 평균 차이를 검정할 수 있습니다.
가정의 완화: 전통적인 ANOVA가 요구하는 엄격한 가정(오차의 등분산성 등)을 우회하거나 모델 내에서 직접 수정할 수 있습니다.
모델 비교: 단순히 ‘차이가 있다/없다’를 넘어, 이론에 근거한 여러 대안 모델들을 설정하고 데이터와 얼마나 잘 맞는지(Model Fit) 비교 평가할 수 있습니다.

2. 교육 현장 시나리오 및 모의 데이터 생성

🏫 시나리오: “AI 보조 교사 도입에 따른 수학 만족도 분석”

한 고등학교에서 수학 수업의 질을 높이기 위해 세 가지 교수법을 적용했습니다.

집단 1 (통제집단): 기존 강의식 수업
집단 2 (토론집단): 소집단 협력 학습
집단 3 (AI집단): AI 튜터를 활용한 개별화 학습

연구자는 ‘사후 수학 만족도’가 집단별로 차이가 있는지 확인하고자 합니다. 이때, 학생들의 ‘사전 수학 만족도’를 공변량(Covariate)으로 통제하고 싶어 합니다.

📊 모의 데이터 생성 (R 코드)

분석을 위해 $N=150$ (집단당 50명)의 데이터를 생성하겠습니다. 만족도는 4개의 문항(y1~y4)으로 측정되는 잠재변수라고 가정합니다.

# R을 이용한 모의 데이터 생성
set.seed(2025)
n <- 50
# 사전 점수 (Covariate)
pre_score <- rnorm(150, mean=50, sd=10)

# 집단별 사후 잠재평균 설정 (AI집단이 가장 높다고 가정)
group <- c(rep("Control", n), rep("Discussion", n), rep("AI", n))
latent_mean <- c(0, 0.3, 0.7) # 표준화된 차이

# 데이터 생성
y_latent <- c(rnorm(n, 0), rnorm(n, 0.3), rnorm(n, 0.7)) + 0.5 * (pre_score - 50)/10
y1 <- 0.8 * y_latent + rnorm(150, 0, 0.6)
y2 <- 0.7 * y_latent + rnorm(150, 0, 0.7)
y3 <- 0.9 * y_latent + rnorm(150, 0, 0.5)
y4 <- 1.0 * y_latent + rnorm(150, 0, 0.4)

df <- data.frame(group = as.factor(group), pre_score, y1, y2, y3, y4)
# 사후 점수 평균(관찰치) 생성
df$post_sat <- (y1 + y2 + y3 + y4) / 4

chap21 다운로드

3. SEM을 이용한 일원분산분석(One-Way ANOVA)

전통적인 ANOVA는 집단별로 가변수(Dummy variable)를 만들어 회귀분석을 하는 것과 같습니다. SEM에서는 이를 ‘Cell Means Model’로 접근하면 훨씬 이해하기 쉽습니다.

3.1. Cell Means Model의 원리

이 모델은 절편(Intercept)을 제거하는 대신, 모든 집단에 대한 인디케이터 변수를 포함합니다.

비제약 모델(Less Constrained, LC): 각 집단의 평균을 자유롭게 추정합니다.
제약 모델(More Constrained, MC): 모든 집단의 평균이 같다고 제약합니다.

이 두 모델의 적합도(Chi-square) 차이를 비교하여 평균 차이의 유의성을 검정합니다.

3.2. jamovi 및 R 구현

jamovi에서는 SEMLj 모듈을 사용하거나, Rj 모듈에서 lavaan 코드를 직접 입력할 수 있습니다.

# lavaan을 이용한 일원분산분석 SEM
library(lavaan)

# 1. 비제약 모델 (집단별 평균 자유 추정)
model_lc <- '
  post_sat ~ c(m1, m2, m3)*1 
'
fit_lc <- sem(model_lc, data=df, group="group")

# 2. 제약 모델 (모든 평균을 m으로 통일)
model_mc <- '
  post_sat ~ c(m, m, m)*1
'
fit_mc <- sem(model_mc, data=df, group="group")

# 모델 비교 (ANOVA와 동일한 결과)
lavTestLRT(fit_lc, fit_mc)

4. SEM을 이용한 공분산분석(ANCOVA)

사전 점수(pre_score)가 사후 점수에 영향을 미칠 때, 이를 통제하고 순수한 교수법의 효과를 보려면 ANCOVA가 필요합니다.

4.1. 분석 특징

공변량을 중심화(Grand-mean centering)하여 투입하면 SEM의 절편이 ‘조정된 평균(Adjusted Means)’이 됩니다.
SEM에서는 집단 간 회귀 계수(Slope)가 동일하다는 가정을 검정하거나, 오히려 이 가정을 풀어 ‘이질적 회귀선’ 모델을 만들 수도 있어 매우 유연합니다.

5. 잠재평균분석(Latent Mean Analysis): SEM의 진수

사실 우리가 측정한 만족도 문항(y1~y4)에는 측정 오차가 포함되어 있습니다. ANOVA는 이 오차를 무시하지만, SEM은 잠재변수를 통해 오차를 제거한 순수한 특성치 간의 평균을 비교합니다.

5.1. 측정 불변성(Measurement Invariance) 검정

잠재평균을 비교하기 전에는 반드시 “서로 다른 집단이 이 문항들을 동일한 의미로 응답했는가?”를 확인해야 합니다.

형태 불변성: 모델의 구조가 같은가?
측정치 불변성(Metric): 요인 적재량(Loadings)이 같은가?
절편 불변성(Scalar): 관찰변수의 절편이 같은가?

최소한 절편 불변성까지 만족해야 잠재평균을 비교할 자격이 생깁니다.

5.2. 분석 결과 해석

잠재평균분석에서는 한 집단의 평균을 0으로 고정하고, 나머지 집단의 평균이 그로부터 얼마나 떨어져 있는지(상대적 차이)를 추정합니다.

집단	잠재평균 (Estimate)	p-value	해석
기존 강의	0 (고정)	–	기준 집단
토론 학습	0.32	.042	기존보다 유의하게 높음
AI 학습	0.75	<.001	기존보다 매우 유의하게 높음

6. 결론 및 제언

SEM을 활용한 평균 분석은 기존 OLS 기반의 ANOVA보다 훨씬 풍부한 정보를 제공합니다.

측정 오차 통제: 더 정확한 효과 크기를 산출합니다.
다양한 가정 검정: 등분산성 위배 시에도 강건한(Robust) 추정치를 얻을 수 있습니다.
통합적 결론: 여러 측정 문항을 개별 ANOVA로 돌리는 ‘단편적 분석’에서 벗어나, 구조적 차원의 ‘통합적 결론’을 내릴 수 있습니다.

학교 현장에서도 단순한 평균 비교를 넘어, 잠재변수 모델링을 통해 교육 효과를 더욱 정밀하게 검증해 보시길 권장합니다.

📚 참고문헌

Aiken, L. S., West, S. G., & Millsap, R. E. (2008). Doctoral training in statistics, measurement, and methodology in psychology: Replication and extension of the Aiken, West, Sechrest, and Reno (1990) survey of PhD programs in North America. American Psychologist, 63(1), 32–50.
Bollen, K. A. (1989). Structural equations with latent variables. Wiley.
Fan, W., & Hancock, G. R. (2012). Robust means modeling: An alternative to hypothesis testing of independent means under variance heterogeneity and nonnormality. Journal of Educational and Behavioral Statistics, 37(1), 137–156.
Hancock, G. R. (2010). Life after ANOVA: Reframing and extending analysis of variance using a likelihood/information paradigm. Presented at the meeting of the Structural Equation Modeling Special Interest Group of the American Educational Research Association, Denver, CO.
Thompson, M. S., & Green, S. B. (2013). Evaluating between-group differences in latent variable means. In G. R. Hancock & R. O. Mueller (Eds.), A second course in structural equation modeling (2nd ed., pp. 163–218). Information Age.

Chap 20. 확인적 요인분석을 활용한 측정 동일성 검사

안녕하세요?
이번에는 여러분과 함께 확인적 요인분석(CFA)을 활용한 측정 동일성(Measurement Invariance, MI)에 대해 살펴보고자 합니다.

측정 동일성은 우리가 만든 심리 검사나 시험이 서로 다른 집단(예: 남학생과 여학생, 도시와 농촌 학생)에게 ‘공정하게’ 작용하는지 확인하는 필수적인 과정입니다. 만약 측정 동일성이 확보되지 않는다면, 집단 간 점수 차이가 실제 능력의 차이인지 아니면 검사 도구의 편향성 때문인지 알 수 없게 됩니다.

이 내용은 교육 현장의 사례를 들어 측정 동일성의 개념과 절차를 상세히 설명합니다. 분석 도구로는 jamovi를 우선적으로 사용하며, 필요한 경우 R (lavaan) 코드를 병행하겠습니다.

1. 측정 동일성의 기초: 회귀 모델을 통한 이해

측정 동일성을 이해하기 위해 먼저 관찰 변수들 사이의 회귀 모델에서 나타날 수 있는 예측 편향(Prediction Bias)을 살펴보겠습니다.

1.1. 기본 회귀 모델

두 집단(예: 일반고와 자사고)에서 고교 내신( $X$ )으로 대학 성적( $Y$ )을 예측한다고 가정해 봅시다. 회귀 방정식은 다음과 같습니다.

$Y_{i} = a + bX_{i} + e_{i}$

여기서 $a$ 는 절편, $b$ 는 기울기입니다. 측정 동일성(또는 예측 동일성)이 성립하려면 집단에 관계없이 동일한 회귀 식이 적용되어야 합니다.

1.2. 편향의 형태

무편향 (No Bias): 두 집단의 절편과 기울기가 모두 동일합니다.
절편 편향 (Intercept Bias): 기울기는 같지만 절편이 다릅니다. 동일한 내신 점수임에도 한 집단의 대학 성적이 항상 높게 예측되는 경우입니다.
기울기 편향 (Slope Bias): 절편은 같지만 기울기가 다릅니다. 내신 점수가 대학 성적에 미치는 영향력(민감도)이 집단마다 다른 경우입니다.

2. 공통 요인 모델과 측정 동일성

이제 관찰 변수에서 잠재 변수(Latent Variable)를 다루는 요인 분석 모델로 확장해 보겠습니다. 확인적 요인분석(CFA)에서는 다음과 같은 파라미터들이 중요합니다.

요인 부하량 ( $\lambda$ , Lambda): 잠재 요인이 관찰 변수에 미치는 영향(회귀의 기울기 역할).
절편 ( $v$ , Nu): 잠재 요인 점수가 0일 때 관찰 변수의 기댓값.
오차 분산 ( $u$ , Unique factor): 요인으로 설명되지 않는 변량.

3. 측정 동일성의 4단계 절차

측정 동일성은 일반적으로 제약이 가장 적은 모델부터 가장 엄격한 모델 순으로 검증합니다.

1단계: 형태 동일성 (Configural Invariance)

정의: 각 집단에서 요인 구조(요인의 수와 지표 변수의 구성)가 동일한지 확인합니다.
교육 사례: ‘수학 효능감’ 검사가 남학생과 여학생 모두에게 동일하게 3개의 문항으로 구성된 단일 요인 구조를 갖는지 확인합니다.

2단계: 측정 동일성/약한 동일성 (Weak/Metric Invariance)

정의: 집단 간 요인 부하량( $\lambda$ )을 동일하게 제약합니다.
의미: 요인이 변화할 때 문항 반응이 변화하는 정도가 두 집단에서 같음을 의미합니다. 이것이 충족되어야 요인 간 상관이나 회귀 계수를 비교할 수 있습니다.

3단계: 강한 동일성 (Strong/Scalar Invariance)

정의: 요인 부하량과 더불어 문항 절편( $v$ )을 동일하게 제약합니다.
의미: 동일한 잠재 수준을 가진 학생이라면 집단에 상관없이 문항에서 동일한 점수를 얻을 것으로 기대합니다. 이 단계가 통과되어야 집단 간 평균 비교가 가능합니다.

4단계: 엄격한 동일성 (Strict Invariance)

정의: 앞선 제약에 오차 분산( $u$ )까지 동일하게 제약합니다.
의미: 측정의 정밀도(신뢰도)까지 두 집단에서 동일함을 의미합니다.

4. 모의 자료를 활용한 실습: “자기주도학습 검사”

4.1. 가상 시나리오

경기도 교육청 소속 연구사인 당신은 중학생용 ‘자기주도학습 능력’ 검사 도구(3문항)를 개발했습니다. 이 도구가 도시 지역 학생들과 농촌 지역 학생들에게 동일하게 작동하는지 확인하고자 합니다.

4.2. 모의 자료 생성 (R 코드)

# 데이터 생성을 위한 R 코드
set.seed(2025)
n <- 200

# 도시 집단 (City): 높은 부하량, 평균 0
city_latent <- rnorm(n, 0, 1)
city_y1 <- 0.8 * city_latent + rnorm(n, 0, 0.6) + 0.5
city_y2 <- 0.7 * city_latent + rnorm(n, 0, 0.6) + 0.5
city_y3 <- 0.9 * city_latent + rnorm(n, 0, 0.6) + 0.5
city_data <- data.frame(y1=city_y1, y2=city_y2, y3=city_y3, group="City")

# 농촌 집단 (Rural): 도시와 동일한 구조 (강력 동일성 가정)
rural_latent <- rnorm(n, -0.5, 1) # 평균이 0.5 낮음
rural_y1 <- 0.8 * rural_latent + rnorm(n, 0, 0.6) + 0.5
rural_y2 <- 0.7 * rural_latent + rnorm(n, 0, 0.6) + 0.5
rural_y3 <- 0.9 * rural_latent + rnorm(n, 0, 0.6) + 0.5
rural_data <- data.frame(y1=rural_y1, y2=rural_y2, y3=rural_y3, group="Rural")

# 통합 데이터
sim_data <- rbind(city_data, rural_data)

chap20 다운로드

4.3. jamovi에서의 분석 단계

jamovi의 Factor -> Confirmatory Factor Analysis 메뉴를 사용합니다.

Model Builder: y1, y2, y3를 하나의 요인으로 설정합니다.
Filters/Group: group 변수를 ‘Group’ 칸에 넣습니다.
Measurement Invariance: jamovi의 최신 버전(또는 SEMLj 모듈)에서는 측정 동일성 옵션을 체크하면 단계별 모델 비교 표를 자동으로 생성해 줍니다.

분석 결과 예시

모델	χ2	df	p	CFI	RMSEA	비고
1. 형태 동일성	4.21	2	.122	.998	.032	모델 적합함
2. 측정 동일성	5.88	4	.208	.997	.025	1번과 차이 없음 ( $\Delta p > .05$ )
3. 강한 동일성	7.12	6	.310	.998	.018	2번과 차이 없음

해석: 강한 동일성까지 확보되었으므로, 도시 학생과 농촌 학생의 자기주도학습 능력 평균을 비교하는 것은 통계적으로 타당합니다.

5. 결론 및 제언

측정 동일성 검증은 복잡해 보이지만, “우리가 잰 자(Scale)가 모든 집단에게 똑같이 눈금이 매겨져 있는가?”를 묻는 아주 상식적인 과정입니다.

만약 특정 문항이 동일성을 해친다면 해당 문항의 제약을 풀어주는 부분 동일성(Partial Invariance) 모델을 고려할 수 있습니다.
대규모 국제 학업성취도 평가(PISA)와 같이 많은 집단을 비교할 때는 베이지안 접근법이나 정렬(Alignment) 방법이 대안이 될 수 있습니다.

교육 연구자로서 여러분의 도구가 모든 학생에게 공정하게 적용되기를 바랍니다.

참고문헌

Chen, F. F. (2007). Sensitivity of goodness of fit indexes to lack of measurement invariance. Structural Equation Modeling, 14(3), 464-504.
Cheung, G. W., & Rensvold, R. B. (2002). Evaluating goodness-of-fit indexes for testing measurement invariance. Structural Equation Modeling, 9(2), 233-255.
Meredith, W. (1993). Measurement invariance, factor analysis and factorial invariance. Psychometrika, 58(4), 525-543.
Millsap, R. E. (2011). Statistical approaches to measurement invariance. Routledge.
Widaman, K. F., & Reise, S. P. (1997). Exploring the measurement invariance of psychological instruments: Applications in the substance abuse domain. In K. J. Bryant, M. Windle, & S. G. West (Eds.), The science of prevention: Methodological advances from alcohol and substance use research (pp. 281-324). American Psychological Association.

1. 혼합 모형의 개념과 기초

1.1. 왜 혼합 모형인가?

1.2. 주요 모델의 유형

2. 모형의 추정과 의사결정

2.1. EM 알고리즘과 지역 최적해(Local Optima)

2.2. 공분산 구조의 결정

2.3. 집단 수 선정 (BIC와 ICL)

3. 교육 현장의 사례: “학습 동기 프로파일 분석”

3.1. 모의 데이터 시나리오

3.2. R을 이용한 분석 코드

4. 분석 결과의 해석과 주의사항

4.1. 직접적 vs 간접적 적용

4.2. 분류 정확도 (ARI)

5. 결론: 연구자를 위한 제언

참고문헌 (APA Style)

1. 작은 표본과 많은 변수의 딜레마

[사례 연구: 학업 스트레스와 학교 적응]

2. 모델 매개변수 추정의 해결책

2.1 릿지 최대우도법 (Ridge ML)

2.2 릿지 일반화최소자승법 (Ridge GLS)

2.3 베이지안(Bayesian) 접근법

3. 모델 적합도 평가의 교정

4. 실전 가이드: R을 활용한 소표본 SEM 분석

[모의 데이터 시나리오]

5. 결론 및 제언

참고문헌

1. 왜 ESEM이 필요한가? (CFA의 한계와 교육 데이터의 복잡성)

2. 핵심 개념: 심리측정적 다차원성 (Psychometric Multidimensionality)

(1) 구성개념 관련 다차원성 (Construct-Relevant)

(2) 구성개념 무관 다차원성 (Construct-Irrelevant)

3. 데이터 생성 스토리: “학교 참여도의 다차원적 구조”

왜 ESEM이 필요한가?

4. 분석 도구 및 방법 (jamovi & R)

(1) 회전 방식 (Rotation)

(2) 모델 적합도 판단 기준

5. 고급 분석: 측정 동일성과 DIF

(1) 측정 동일성 (Measurement Invariance)

(2) 문항 반응 편향 (DIF, Differential Item Functioning)

6. 결론 및 제언

참고문헌

1. 왜 다층 구조방정식(MSEM)인가?

1.1 전통적 분석의 한계

1.2 MLM과 MSEM의 차이

2. 기본 원리와 수식의 이해

2.1 공분산 구조의 분해

2.2 측정 모델 (MCFA)

3. 실전 사례: 학생의 자기효능감과 학교 생활 만족도

3.1 모의 자료 생성 (R 코드)

4. 단계별 분석 모델 구성

모델 1: 단일 수준 분석 (Naive Analysis)

모델 2: 집단 내 요인 모델 (Within-Group Factors)

모델 3: 다층 구성적 요인 모델 (Configural Factor Model)

5. MSEM 매개 효과 분석 (2-1-1 모델)

6. 결과 해석 및 적합도 평가

6.1 모델 적합도 (Model Fit)

6.2 잠재 변수의 ICC

7. 결론 및 제언

참고문헌

1. 왜 척도 평가가 중요한가?

2. 고전검사이론(CTT)과 요인분석(FA): 기초 다지기

(1) 기본 방정식

(2) 동질적 검사 모델 (Congeneric Model)

3. 척도의 잠재 구조 확인: EFA에서 CFA로

1단계: 탐색적 요인분석 (EFA)

2단계: 확인적 요인분석 (CFA)

4. 문항 반응 이론(IRT): 문항 하나하나를 현미경으로 보기

5. 고급 주제: 관찰되지 않은 이질성(Unobserved Heterogeneity)

(1) 잠재 혼합 모델 (Latent Mixture Modeling)

(2) 혼합 모델을 무시할 때의 위험성

6. 실습: 학교 소속감 척도 평가 (가상 데이터 사례)

[스토리 설정]

jamovi 및 R 구현 방법

1) jamovi 활용 (CFA 분석)

2) R 활용 (잠재 혼합 모델링 – tidyLPA 패키지 예시)

7. 결론 및 제언

참고문헌

1. 왜 ‘동적 조절(Dynamic Moderation)’인가?

2. GCLM의 핵심 구성 요소

3. 교육 연구 사례: 학업 자기효능감(ASE)과 학업 참여(AE)

[가상의 시나리오]

2) R 활용 (잠재 혼합 모델링 – `tidyLPA` 패키지 예시)