이 글에서 꼭 잡아야 할 것
방법론은 형식이 아니라 팀의 사고 순서를 맞추는 도구다. ADsP에서 가장 자주 등장하는 CRISP-DM과 KDD 흐름을 비교하며 정리한다.
시험에서 방법론은 단순 순서 암기로 접근하기 쉽지만, 실제로는 각 단계가 무엇을 해결하기 위한 단계인지 이해해야 안정적으로 풀 수 있다. 특히 CRISP-DM의 업무 이해와 평가, 전개는 모델링보다 앞뒤 맥락을 붙이는 역할을 하므로, 모델만 중심에 두고 외우면 자주 틀리게 된다.
개념 지도와 이해 포인트
대표 문법 패턴
crisp_dm = [
"업무 이해",
"데이터 이해",
"데이터 준비",
"모델링",
"평가",
"전개"
]
for step, name in enumerate(crisp_dm, start=1):
print(step, name)
문법 읽는 포인트
- CRISP-DM은 순서와 단계 목적을 함께 외우는 것이 좋다.
- 반복 구조라는 점을 놓치지 말자.
- KDD와의 차이는 비즈니스 이해와 전개 포함 여부로 비교하면 쉽다.
핵심 용어
- CRISP-DM
- KDD
- Process
프로젝트 단계별 산출물 떠올리기
방법론은 산출물과 함께 연결해서 기억하면 더 오래 남는다. 단계 이름만 외우는 것보다 실제 팀 문서와 연결하는 방식이 좋다.
deliverables = {
"업무 이해": "문제 정의서",
"데이터 이해": "탐색 리포트",
"모델링": "모델 비교표",
"평가": "성과 검토안"
}
수험 체크포인트와 자주 하는 실수
시험 체크포인트
- CRISP-DM 단계 순서는 그대로 적어 볼 수 있을 정도로 익혀 두자.
- KDD와 CRISP-DM 차이는 출제 빈도가 높다.
- 평가 단계와 전개 단계를 헷갈리지 않도록 주의하자.
자주 하는 실수
- 방법론을 모델링 절차로만 좁게 이해하는 실수
- 평가와 전개 순서를 뒤섞는 실수
- 반복 구조를 무시하고 일방향 프로세스로 외우는 실수
연결 학습
방법론이 잡히면 실제 데이터 수집과 준비 과정도 더 체계적으로 볼 수 있다. 필요하면 asdp.sqld.kr에서 방법론 순서 문제를 짧게 반복해 보자.
댓글 0
작성자 이름과 댓글 내용을 입력하면 바로 등록됩니다. 답글은 한 단계까지 지원하고, 댓글은 최대 200자까지 작성할 수 있습니다.
같은 카테고리에서 이어서 읽기
지금 읽은 글과 가까운 흐름의 글 5개를 모아 두었습니다. 바로 앞뒤 문맥을 이어서 읽고 싶을 때 가장 편합니다.
분석 과제 정의와 문제 재구성
좋은 분석은 좋은 질문에서 시작한다. 문제를 그대로 받는 것이 아니라, 데이터로 검증 가능한 질문으로 다시 정의하는 과정이 분석 기획의 핵심이다.
KPI와 성공 기준 설정하기
분석 프로젝트는 결과가 아니라 변화로 평가된다. 무엇을 좋아졌다고 볼 것인지, 어떤 지표를 성공 기준으로 삼을 것인지 정하는 일이 매우 중요하다.
분석 과제 도출과 우선순위 평가
아이디어가 많다고 좋은 기획이 되는 것은 아니다. 효과와 난이도, 데이터 확보 가능성을 기준으로 과제를 고르고 우선순위를 정하는 과정이 필요하다.
데이터 수집 전략과 표본 추출
좋은 분석은 좋은 데이터에서 시작한다. 어떤 데이터를, 어떤 방식으로, 얼마나 수집할지 정하는 일은 기획과 통계가 만나는 핵심 구간이다.
기술 통계의 핵심: 평균, 중앙값, 분산, 왜도
기술 통계는 데이터를 요약하는 가장 기본적인 언어다. ADsP에서는 수식 암기보다 각 지표가 언제 유용한지를 이해하는 문제가 더 중요하다.
댓글을 불러오는 중입니다.