R을 활용한 독립표본 t검정하기
- R
- 2024. 7. 18.
독립표본 t검정
독립표본 t검정은 두 개의 독립된 모집단의 평균을 비교할 때 사용하는 검정방법입니다.
예를 들어, 성별에 따라 공부 성취도가 다른지를 검정한다고 할 때 서로 독립적인 남,여에 대해서 통계적 검정을 하기 위해 독립표본 t검정을 사용합니다. 이때, '성별'이 독립변수, 종속변수는 '공부 성취도'가 됩니다.
두 가지 교육 방법(A,B)에 대한 학생들의 시험 성적에 미치는 영향을 통계적으로 검정해보는 예제입니다.
독립표본 t검정을 수행하려면 등분산검정 시행후 수행하게 됩니다.
일반적으로 등분산검정은 F-test를 시행하는데 R에서 F-test 등분산검정 메쏘드는 다음과 같습니다.
var.test(x,y,alternative) : 모집단1,모집단2 적용시
var.test(formula,data,alternative) : 수치형 벡터(종속변수)~집단분류(독립변수) 적용시
- x : 모집단1(수치형 벡터)
- y : 모집단2(수치형 벡터)
- formula : 수치형벡터(종속변수)~집단분류(독립변수), 데이터프레임을 적용시킬 때 사용
- data : 등분산 검정을 수행할 데이터
- alternative : 양측검정 - "two.sided", 단측검정 - "less","greater" 입력
t.test(x,y,alternative, var.equal=FALSE)
t.test(formula,data,alternative,var.equal=FALSE)
- x : 모집단1(수치형 벡터)
- y : 모집단2(수치형 벡터)
- formula : 수치형 벡터(종속변수)~집단분류(독립변수)
- data : t검정할 데이터
- alternative : 양측검정 - "two-sided", 단측검정 - "less","greater"
- var.equal : 등분산성을 만족하는지의 여부(TRUE or FALSE)
검정할 데이터
# 교육 방법 A와 B의 성적 데이터
method_A <- c(85, 88, 84, 90, 86, 87, 89, 83, 91, 85)
method_B <- c(78, 82, 80, 79, 81, 77, 83, 80, 76, 78)
등분산 검정
# 등분산 확인
# 등분산 검정 (F-검정)
var_test_result <- var.test(method_A, method_B)
# 결과 출력
print(var_test_result)
등분산 검정의 귀무가설은 두 모집단의 분산이 같다고 설정합니다.
따라서, 위 데이터는 p-value가 0.601로 유의수준 0.05보다 크므로 귀무가설이 기각되지 않습니다. 두 모집단의 분산은 같다고 할 수 있습니다.
R을 활용한 독립표본 t검정
등분산이므로 var.equal=TRUE으로 설정해 t-test를 실행합니다.
# 독립표본 t-검정 수행
t_test_result <- t.test(method_A, method_B, alternative="greater", var.equal = TRUE)
# 결과 출력
print(t_test_result)
- t값 : 6.7552
- 자유도(df) = 18
- p-value : 1.246e-06
p-value는 유의수준 0.05보다 작으므로 귀무가설이 기각됩니다.
p-값이 매우 낮기 때문에, 교육 방법 A와 B의 평균 성적에 유의미한 차이가 있다고 결론지을 수 있습니다. 따라서 교육 방법 A가 교육 방법 B보다 시험 성적에 더 긍정적인 영향을 미친다고 판단할 수 있습니다.
함께 보면 좋은글
'R' 카테고리의 다른 글
세상 간단한 R로 웹 스크래핑하기 (0) | 2024.07.24 |
---|---|
R studio 패키지 설치 오류 모음 (0) | 2024.07.20 |
R을 이용한 대응표본 t-검정하기 (0) | 2024.07.15 |
[R]국내 주가 데이터 가져오기 (0) | 2022.06.25 |
[R] 파이차트 원 안에 글자 넣기 (0) | 2022.06.16 |