R을 활용한 독립표본 t검정하기

반응형
    반응형

    독립표본 t검정

    독립표본 t검정은 두 개의 독립된 모집단의 평균을 비교할 때 사용하는 검정방법입니다.
    예를 들어, 성별에 따라 공부 성취도가 다른지를 검정한다고 할 때 서로 독립적인 남,여에 대해서 통계적 검정을 하기 위해 독립표본 t검정을 사용합니다. 이때, '성별'이 독립변수, 종속변수는 '공부 성취도'가 됩니다.

     

    두 가지 교육 방법(A,B)에 대한 학생들의 시험 성적에 미치는 영향을 통계적으로 검정해보는 예제입니다.

    독립표본 t검정을 수행하려면 등분산검정 시행후 수행하게 됩니다.
    일반적으로 등분산검정은 F-test를 시행하는데 R에서 F-test 등분산검정 메쏘드는 다음과 같습니다.

     

    var.test(x,y,alternative) : 모집단1,모집단2 적용시
    var.test(formula,data,alternative) : 수치형 벡터(종속변수)~집단분류(독립변수) 적용시

    • x : 모집단1(수치형 벡터)
    • y : 모집단2(수치형 벡터)
    • formula : 수치형벡터(종속변수)~집단분류(독립변수), 데이터프레임을 적용시킬 때 사용
    • data : 등분산 검정을 수행할 데이터
    • alternative : 양측검정 - "two.sided", 단측검정 - "less","greater" 입력

    t.test(x,y,alternative, var.equal=FALSE)
    t.test(formula,data,alternative,var.equal=FALSE)

    • x : 모집단1(수치형 벡터)
    • y : 모집단2(수치형 벡터)
    • formula : 수치형 벡터(종속변수)~집단분류(독립변수)
    • data : t검정할 데이터
    • alternative : 양측검정 - "two-sided", 단측검정 - "less","greater"
    • var.equal : 등분산성을 만족하는지의 여부(TRUE or FALSE)

    검정할 데이터

    # 교육 방법 A와 B의 성적 데이터
    method_A <- c(85, 88, 84, 90, 86, 87, 89, 83, 91, 85)
    method_B <- c(78, 82, 80, 79, 81, 77, 83, 80, 76, 78)
    

    등분산 검정

    # 등분산 확인
    # 등분산 검정 (F-검정) 
    var_test_result <- var.test(method_A, method_B) 
    
    # 결과 출력 
    print(var_test_result)

    등분산 검정의 귀무가설은 두 모집단의 분산이 같다고 설정합니다.
    따라서, 위 데이터는 p-value가 0.601로 유의수준 0.05보다 크므로 귀무가설이 기각되지 않습니다. 두 모집단의 분산은 같다고 할 수 있습니다.

    R을 활용한 독립표본 t검정

    등분산이므로 var.equal=TRUE으로 설정해 t-test를 실행합니다.

    # 독립표본 t-검정 수행
    t_test_result <- t.test(method_A, method_B, alternative="greater", var.equal = TRUE)
    
    # 결과 출력
    print(t_test_result)

    • t값 : 6.7552
    • 자유도(df) = 18
    • p-value : 1.246e-06

    p-value는 유의수준 0.05보다 작으므로 귀무가설이 기각됩니다.
    p-값이 매우 낮기 때문에, 교육 방법 A와 B의 평균 성적에 유의미한 차이가 있다고 결론지을 수 있습니다. 따라서 교육 방법 A가 교육 방법 B보다 시험 성적에 더 긍정적인 영향을 미친다고 판단할 수 있습니다.

     

    함께 보면 좋은글

     

     

    R을 이용한 대응표본 t-검정하기

    R을 이용한 대응표본 t-검정대응표본 t검정은 단일 모집단에서 두 개의 표본집단을 만들었을때, 그 두개에 대한 평균의 차이를 비교합니다.예를 들어 수면약을 만들었을 때 이 수면약이 효과가

    seong6496.tistory.com

     

     

     

    R 데이터 타입 소개(종류, 타입확인)

    R 데이터 타입 R의 데이터 타입 내용입니다. R의 데이터 타입 종류와 확인방법에 대해 포스팅하려고 합니다. 각각을 모두 다 설명할 수는 없고 어떤 게 있는지에 초점을 맞췄습니다. R은 1,2,n차원

    seong6496.tistory.com

     

     

     

    [R] 벡터 다루기(내장함수와 연산)

    몇가지 함수에 의해 벡터를 생성해보겠습니다. 벡터 반복 함수(rep) rep는 지정한 벡터를 반복 횟수만큼 반복시켜서 생성합니다. time으로 하면 자체를 반복하고 each를 하면 각 원소마다 반복합니

    seong6496.tistory.com

     

    댓글

    Designed by JB FACTORY

    ....