홈 / 데이터 분석 / Article 13

데이터 분석 · 통계와 검정

가설검정, 유의수준, p-value 한 번에 정리

가설검정은 통계 파트에서 가장 많이 헷갈리는 주제다. 귀무가설과 대립가설, 유의수준과 p-value 관계를 문장으로 설명할 수 있을 정도로 정리해야 한다.

Article 13 • 초급 • 10분 읽기

이 글에서 꼭 잡아야 할 것

가설검정은 계산보다 해석에서 틀리는 경우가 더 많다. p-value가 작다는 의미, 유의수준 0.05가 뜻하는 바, 귀무가설을 기각하지 못했다는 말의 의미를 정확히 말할 수 있어야 한다. 특히 “귀무가설이 참임이 증명되었다” 식의 표현은 잘못된 해석이라는 점을 꼭 기억해야 한다.

난이도 초급

모듈 통계와 검정

학습 시간 10분

핵심 키워드 Hypothesis, p-value, Alpha

개념 지도와 이해 포인트

귀무가설과 대립가설 귀무가설은 기본 상태, 대립가설은 검증하려는 주장이다. 대부분의 문제는 이 설정부터 시작한다.

유의수준과 p-value 유의수준은 판단 기준이고 p-value는 관측 결과의 드문 정도다. 둘을 비교해 가설 기각 여부를 판단한다.

1종·2종 오류 참인 귀무가설을 기각하면 1종 오류, 거짓인 귀무가설을 기각하지 못하면 2종 오류다. 시험 단골 개념이다.

대표 문법 패턴

from scipy import stats

sample = [74, 77, 79, 81, 76, 78, 80]
t_stat, p_value = stats.ttest_1samp(sample, popmean=75)

print("t-stat:", t_stat)
print("p-value:", p_value)

문법 읽는 포인트

가설검정은 가설 설정과 해석이 핵심이다.
p-value는 귀무가설이 참일 때 현재 결과 이상이 나올 확률로 이해하는 편이 좋다.
기각하지 못함과 채택은 같은 말이 아니라는 점에 주의하자.

핵심 용어

Hypothesis
p-value
Alpha

유의수준과 p-value 비교 문장 써 보기

이 단순 비교 로직이 시험 해석 문제의 핵심이다. 숫자를 비교하고 어떤 문장을 써야 하는지만 익혀도 상당수 문항을 안정적으로 풀 수 있다.

alpha = 0.05
p_value = 0.021

if p_value < alpha:
    print("귀무가설 기각")
else:
    print("귀무가설 기각 불가")

수험 체크포인트와 자주 하는 실수

시험 체크포인트

귀무가설과 대립가설을 직접 써 보는 연습이 가장 중요하다.
p-value 해석 문장을 정확히 기억하자.
1종 오류와 2종 오류는 사례형으로 정리하면 잘 안 잊힌다.

자주 하는 실수

p-value를 귀무가설이 참일 확률이라고 오해하는 실수
기각 불가를 곧 채택이라고 표현하는 실수
유의수준과 p-value 방향 비교를 반대로 하는 실수

연결 학습

가설검정 해석이 안정되면 회귀와 분류 성능 비교도 더 쉽게 읽힌다. 시험 직전에는 asdp.sqld.kr에서 검정 해석 문항을 짧게 반복하는 방식이 효과적이다.

작성자 이름과 댓글 내용을 입력하면 바로 등록됩니다. 답글은 한 단계까지 지원하고, 댓글은 최대 200자까지 작성할 수 있습니다.

댓글을 불러오는 중입니다.

같은 카테고리에서 이어서 읽기

지금 읽은 글과 가까운 흐름의 글 5개를 모아 두었습니다. 바로 앞뒤 문맥을 이어서 읽고 싶을 때 가장 편합니다.

데이터 분석 · 분석 기획 · Article 10

데이터 수집 전략과 표본 추출

좋은 분석은 좋은 데이터에서 시작한다. 어떤 데이터를, 어떤 방식으로, 얼마나 수집할지 정하는 일은 기획과 통계가 만나는 핵심 구간이다.

SamplingSurveyCollection

데이터 분석 · 통계와 검정 · Article 11

기술 통계의 핵심: 평균, 중앙값, 분산, 왜도

기술 통계는 데이터를 요약하는 가장 기본적인 언어다. ADsP에서는 수식 암기보다 각 지표가 언제 유용한지를 이해하는 문제가 더 중요하다.

MeanMedianVariance

데이터 분석 · 통계와 검정 · Article 12

확률분포와 중심극한정리 이해하기

정규분포, 이항분포, 포아송분포처럼 이름이 많은 파트지만, 핵심은 언제 어떤 분포를 쓰는지 구분하는 감각이다. 중심극한정리는 그 연결을 잡아 주는 핵심 개념이다.

NormalBinomialCLT

데이터 분석 · 통계와 검정 · Article 14

상관분석과 회귀분석의 차이

상관과 인과를 구분하지 못하면 분석 해석이 쉽게 흔들린다. ADsP에서는 상관계수와 회귀모형의 의미, 활용 목적 차이를 분명히 물어본다.

CorrelationRegressionR2

데이터 분석 · 통계와 검정 · Article 15

분류분석과 평가 지표: 정확도, 정밀도, 재현율

분류 모델은 맞혔는지 여부만 보는 것이 아니다. 어떤 오류를 더 줄여야 하는지에 따라 정밀도와 재현율 해석이 달라진다.

AccuracyPrecisionRecall

이 글의 흐름

빠른 메모

카테고리: 데이터 분석
모듈: 통계와 검정
읽기 시간: 10분
핵심 키워드: Hypothesis, p-value, Alpha

실습으로 이어가기

개념을 읽은 직후가 가장 좋습니다. asdp.sqld.kr에서 같은 주제를 바로 실습하거나 문제풀이로 이어 보세요.