이 글에서 꼭 잡아야 할 것
시간 순서가 있는 데이터는 일반 표본과 다르게 읽어야 한다. 시계열 분석의 핵심은 추세와 계절성, 자기상관을 구분하는 데 있다.
시계열 분석은 시간 축을 무시하면 제대로 이해할 수 없다. 같은 평균과 분산을 가지는 데이터라도 시간 순서에 따라 전혀 다른 의미를 가질 수 있기 때문이다. ADsP에서는 추세와 계절성, 이동평균, 지수평활 같은 기초 개념을 중심으로 묻는 경우가 많다.
개념 지도와 이해 포인트
대표 문법 패턴
import pandas as pd
ts = pd.Series([120, 128, 132, 140, 155, 162, 170])
print("이동평균")
print(ts.rolling(window=3).mean())
문법 읽는 포인트
- 시계열은 시간 순서가 핵심이다.
- 추세와 계절성은 서로 다른 패턴이다.
- 이동평균은 가장 직관적인 시계열 요약 도구다.
핵심 용어
- Trend
- Seasonality
- Autocorrelation
월별 지표에서 추세와 계절성 나눠 보기
먼저 시간 순서대로 나열하고, 장기 상승/하락인지 반복 패턴인지 구분해 보는 습관이 중요하다. 시계열 파트는 그래프를 같이 떠올리면 더 잘 이해된다.
SELECT month_id, sales
FROM monthly_sales
ORDER BY month_id;
수험 체크포인트와 자주 하는 실수
시험 체크포인트
- 추세와 계절성을 구분하는 문제가 자주 나온다.
- 시계열은 독립 표본 가정이 깨질 수 있다는 점을 기억하자.
- 이동평균과 지수평활 차이를 가볍게 정리해 두자.
자주 하는 실수
- 시간 순서를 무시하고 일반 데이터처럼 보는 실수
- 계절성을 추세와 같은 의미로 이해하는 실수
- 시계열 지표를 단일 평균만으로 해석하는 실수
연결 학습
시계열 감각이 잡히면 예측과 운영 모니터링 문제도 훨씬 선명해진다. 필요하면 asdp.sqld.kr에서 그래프 해석형 문제를 같이 풀어 보면 좋다.
댓글 0
작성자 이름과 댓글 내용을 입력하면 바로 등록됩니다. 답글은 한 단계까지 지원하고, 댓글은 최대 200자까지 작성할 수 있습니다.
같은 카테고리에서 이어서 읽기
지금 읽은 글과 가까운 흐름의 글 5개를 모아 두었습니다. 바로 앞뒤 문맥을 이어서 읽고 싶을 때 가장 편합니다.
분류분석과 평가 지표: 정확도, 정밀도, 재현율
분류 모델은 맞혔는지 여부만 보는 것이 아니다. 어떤 오류를 더 줄여야 하는지에 따라 정밀도와 재현율 해석이 달라진다.
군집분석의 기본: K-means와 세그먼트 이해
군집분석은 답이 이미 있는 문제를 맞히는 것이 아니라, 닮은 대상을 묶어 구조를 찾는 과정이다. 세그먼트 분석의 기초 감각을 여기서 잡는다.
연관규칙 분석: 지지도, 신뢰도, 향상도
연관규칙은 함께 발생하는 패턴을 찾는 대표적인 데이터 마이닝 기법이다. 지지도, 신뢰도, 향상도 해석을 정확히 이해하는 것이 핵심이다.
데이터 시각화와 스토리텔링의 원칙
분석 결과는 잘 계산하는 것만큼 잘 전달하는 것도 중요하다. 좋은 시각화는 예쁜 차트가 아니라, 핵심 메시지를 빠르게 이해하게 만드는 차트다.
ADsP 합격 전략과 문제풀이 루틴
마지막 단계에서는 무엇을 더 외울지보다 무엇을 반복할지 정하는 편이 중요하다. ADsP 합격을 위한 영역별 복습 루틴과 문제풀이 전략을 정리한다.
댓글을 불러오는 중입니다.