이 글에서 꼭 잡아야 할 것
가설검정은 통계 파트에서 가장 많이 헷갈리는 주제다. 귀무가설과 대립가설, 유의수준과 p-value 관계를 문장으로 설명할 수 있을 정도로 정리해야 한다.
가설검정은 계산보다 해석에서 틀리는 경우가 더 많다. p-value가 작다는 의미, 유의수준 0.05가 뜻하는 바, 귀무가설을 기각하지 못했다는 말의 의미를 정확히 말할 수 있어야 한다. 특히 “귀무가설이 참임이 증명되었다” 식의 표현은 잘못된 해석이라는 점을 꼭 기억해야 한다.
개념 지도와 이해 포인트
대표 문법 패턴
from scipy import stats
sample = [74, 77, 79, 81, 76, 78, 80]
t_stat, p_value = stats.ttest_1samp(sample, popmean=75)
print("t-stat:", t_stat)
print("p-value:", p_value)
문법 읽는 포인트
- 가설검정은 가설 설정과 해석이 핵심이다.
- p-value는 귀무가설이 참일 때 현재 결과 이상이 나올 확률로 이해하는 편이 좋다.
- 기각하지 못함과 채택은 같은 말이 아니라는 점에 주의하자.
핵심 용어
- Hypothesis
- p-value
- Alpha
유의수준과 p-value 비교 문장 써 보기
이 단순 비교 로직이 시험 해석 문제의 핵심이다. 숫자를 비교하고 어떤 문장을 써야 하는지만 익혀도 상당수 문항을 안정적으로 풀 수 있다.
alpha = 0.05
p_value = 0.021
if p_value < alpha:
print("귀무가설 기각")
else:
print("귀무가설 기각 불가")
수험 체크포인트와 자주 하는 실수
시험 체크포인트
- 귀무가설과 대립가설을 직접 써 보는 연습이 가장 중요하다.
- p-value 해석 문장을 정확히 기억하자.
- 1종 오류와 2종 오류는 사례형으로 정리하면 잘 안 잊힌다.
자주 하는 실수
- p-value를 귀무가설이 참일 확률이라고 오해하는 실수
- 기각 불가를 곧 채택이라고 표현하는 실수
- 유의수준과 p-value 방향 비교를 반대로 하는 실수
연결 학습
가설검정 해석이 안정되면 회귀와 분류 성능 비교도 더 쉽게 읽힌다. 시험 직전에는 asdp.sqld.kr에서 검정 해석 문항을 짧게 반복하는 방식이 효과적이다.
댓글 0
작성자 이름과 댓글 내용을 입력하면 바로 등록됩니다. 답글은 한 단계까지 지원하고, 댓글은 최대 200자까지 작성할 수 있습니다.
같은 카테고리에서 이어서 읽기
지금 읽은 글과 가까운 흐름의 글 5개를 모아 두었습니다. 바로 앞뒤 문맥을 이어서 읽고 싶을 때 가장 편합니다.
데이터 수집 전략과 표본 추출
좋은 분석은 좋은 데이터에서 시작한다. 어떤 데이터를, 어떤 방식으로, 얼마나 수집할지 정하는 일은 기획과 통계가 만나는 핵심 구간이다.
기술 통계의 핵심: 평균, 중앙값, 분산, 왜도
기술 통계는 데이터를 요약하는 가장 기본적인 언어다. ADsP에서는 수식 암기보다 각 지표가 언제 유용한지를 이해하는 문제가 더 중요하다.
확률분포와 중심극한정리 이해하기
정규분포, 이항분포, 포아송분포처럼 이름이 많은 파트지만, 핵심은 언제 어떤 분포를 쓰는지 구분하는 감각이다. 중심극한정리는 그 연결을 잡아 주는 핵심 개념이다.
상관분석과 회귀분석의 차이
상관과 인과를 구분하지 못하면 분석 해석이 쉽게 흔들린다. ADsP에서는 상관계수와 회귀모형의 의미, 활용 목적 차이를 분명히 물어본다.
분류분석과 평가 지표: 정확도, 정밀도, 재현율
분류 모델은 맞혔는지 여부만 보는 것이 아니다. 어떤 오류를 더 줄여야 하는지에 따라 정밀도와 재현율 해석이 달라진다.
댓글을 불러오는 중입니다.