본문 바로가기

통계

ANOVA에 대한 간략정리

ANOVA(Analysis of Variance)는 두 개 이상의 그룹 간의 평균 차이를 비교하기 위해 사용되는 통계적 방법입니다. 주로 실험 연구에서 변수의 영향을 평가할 때 사용됩니다. ANOVA는 각 그룹 내의 변동과 그룹 간의 변동을 비교하여 유의한 차이가 있는지 판단합니다.

ANOVA의 종류

  1. 일원분산분석 (One-Way ANOVA):
    • 하나의 독립 변수(요인)만을 고려하여 각 그룹 간의 평균 차이를 비교합니다.
    • 예: 서로 다른 다이어트 프로그램의 효과를 비교하기 위해 여러 그룹의 체중 감소를 비교.
  2. 이원분산분석 (Two-Way ANOVA):
    • 두 개의 독립 변수(요인)와 이들 간의 상호작용 효과를 고려하여 평균 차이를 비교합니다.
    • 예: 다이어트 프로그램과 운동 프로그램의 조합이 체중 감소에 미치는 영향을 비교.
  3. 반복 측정 ANOVA (Repeated Measures ANOVA):
    • 같은 피험자에게 여러 번 측정을 수행할 때, 시간에 따른 변화나 반복 측정 간의 차이를 분석합니다.
    • 예: 같은 그룹의 피험자에게 시간 경과에 따른 학습 성취도를 측정.

ANOVA의 가정

ANOVA를 수행하기 위해서는 몇 가지 기본 가정이 필요합니다:

  1. 정규성: 각 그룹의 데이터가 정규분포를 따릅니다.
  2. 등분산성 (Homoscedasticity): 각 그룹의 분산이 동일합니다.
  3. 독립성: 각 샘플이 서로 독립적입니다.

ANOVA의 과정

  1. 귀무가설 (H0): 모든 그룹의 평균이 동일하다.
  2. 대립가설 (H1): 적어도 하나의 그룹 평균이 다르다.

ANOVA의 계산

ANOVA는 다음의 기본 단계를 거쳐 계산됩니다

1.총 제곱합 (Total Sum of Squares, SST):

  • 데이터의 전체 변동을 나타냅니다. SST=i=1N(XiX)2
  • Xi : 관측값
  • : 전체 평균
  • N : 전체 관측값의수

2.처리 제곱합 (Between-Group Sum of Squares, SSB):

  • 그룹 간의 변동을 나타냅니다. SSB=j=1knj(XjX)2
  • nj : j번째 그룹의 샘플 수
  • Xj : j번째 그룹의 평균
  • k: 그룹의 수

3.오차 제곱합 (Within-Group Sum of Squares, SSW):

  • 그룹 내의 변동을 나타냅니다. SSW=j=1ki=1nj(XijXj)2
  • Xij : j번째 그룹의 i번째 관측값

4.자유도 (Degrees of Freedom):

  • 총 자유도: N−1
  • 처리 자유도: k−1
  • 오차 자유도: N−k

ANOVA의 해석

  • F-통계량을 구하고, 해당 F-분포에서 p-값을 찾아서 유의수준(보통 0.05)과 비교합니다.
  • p-값이 유의수준보다 작으면 귀무가설을 기각하고, 그룹 간에 유의미한 차이가 있다고 결론 내립니다.