데이터 분석 | 데이터베이스의 모든것

데이터 분석 · 데이터 이해 · Article 01

ADsP와 데이터 분석의 전체 지도

데이터 분석을 처음 시작할 때는 개별 기법보다 전체 지도를 먼저 보는 편이 훨씬 효율적이다. ADsP가 어떤 영역을 다루고, 데이터 분석이 조직 안에서 어떤 문제를 해결하는지 큰 구조부터 정리한다.

ADsPAnalyticsBusiness

데이터 분석 · 데이터 이해 · Article 02

데이터, 정보, 지식의 차이와 데이터 가치

ADsP에서는 데이터와 정보, 지식, 지혜의 차이를 자주 묻는다. 단어 정의를 암기하는 데서 멈추지 않고, 데이터가 왜 가치가 되고 비즈니스 자산이 되는지 함께 정리한다.

DIKWValueInsight

데이터 분석 · 데이터 이해 · Article 03

데이터 산업과 데이터 기반 조직 이해

데이터 산업은 기술만으로 움직이지 않는다. 플랫폼, 서비스, 인프라, 인력, 거버넌스가 함께 맞물릴 때 조직이 데이터 기반으로 전환된다.

GovernancePlatformCulture

데이터 분석 · 데이터 이해 · Article 04

데이터베이스, 메타데이터, ETL의 기초

데이터 분석가에게도 데이터베이스 기초는 필요하다. ADsP에서는 메타데이터, ETL, 데이터 웨어하우스 같은 기반 개념을 가볍지 않게 묻는다.

ETLMetadataDW

데이터 분석 · 데이터 이해 · Article 05

표본과 모집단, 분석 단위의 감각 잡기

통계 파트로 넘어가기 전, 무엇을 전체로 보고 무엇을 일부로 보는지 감각을 먼저 잡아야 한다. 모집단과 표본, 분석 단위를 정확히 구분하는 것이 출발점이다.

PopulationSampleUnit

데이터 분석 · 분석 기획 · Article 06

분석 과제 정의와 문제 재구성

좋은 분석은 좋은 질문에서 시작한다. 문제를 그대로 받는 것이 아니라, 데이터로 검증 가능한 질문으로 다시 정의하는 과정이 분석 기획의 핵심이다.

ProblemKPIQuestion

데이터 분석 · 분석 기획 · Article 07

KPI와 성공 기준 설정하기

분석 프로젝트는 결과가 아니라 변화로 평가된다. 무엇을 좋아졌다고 볼 것인지, 어떤 지표를 성공 기준으로 삼을 것인지 정하는 일이 매우 중요하다.

KPIMetricGoal

데이터 분석 · 분석 기획 · Article 08

분석 과제 도출과 우선순위 평가

아이디어가 많다고 좋은 기획이 되는 것은 아니다. 효과와 난이도, 데이터 확보 가능성을 기준으로 과제를 고르고 우선순위를 정하는 과정이 필요하다.

PriorityImpactFeasibility

데이터 분석 · 분석 기획 · Article 09

CRISP-DM과 데이터 분석 방법론

방법론은 형식이 아니라 팀의 사고 순서를 맞추는 도구다. ADsP에서 가장 자주 등장하는 CRISP-DM과 KDD 흐름을 비교하며 정리한다.

CRISP-DMKDDProcess

데이터 분석 · 분석 기획 · Article 10

데이터 수집 전략과 표본 추출

좋은 분석은 좋은 데이터에서 시작한다. 어떤 데이터를, 어떤 방식으로, 얼마나 수집할지 정하는 일은 기획과 통계가 만나는 핵심 구간이다.

SamplingSurveyCollection

데이터 분석 · 통계와 검정 · Article 11

기술 통계의 핵심: 평균, 중앙값, 분산, 왜도

기술 통계는 데이터를 요약하는 가장 기본적인 언어다. ADsP에서는 수식 암기보다 각 지표가 언제 유용한지를 이해하는 문제가 더 중요하다.

MeanMedianVariance

데이터 분석 · 통계와 검정 · Article 12

확률분포와 중심극한정리 이해하기

정규분포, 이항분포, 포아송분포처럼 이름이 많은 파트지만, 핵심은 언제 어떤 분포를 쓰는지 구분하는 감각이다. 중심극한정리는 그 연결을 잡아 주는 핵심 개념이다.

NormalBinomialCLT

데이터 분석 · 통계와 검정 · Article 13

가설검정, 유의수준, p-value 한 번에 정리

가설검정은 통계 파트에서 가장 많이 헷갈리는 주제다. 귀무가설과 대립가설, 유의수준과 p-value 관계를 문장으로 설명할 수 있을 정도로 정리해야 한다.

Hypothesisp-valueAlpha

데이터 분석 · 통계와 검정 · Article 14

상관분석과 회귀분석의 차이

상관과 인과를 구분하지 못하면 분석 해석이 쉽게 흔들린다. ADsP에서는 상관계수와 회귀모형의 의미, 활용 목적 차이를 분명히 물어본다.

CorrelationRegressionR2

데이터 분석 · 통계와 검정 · Article 15

분류분석과 평가 지표: 정확도, 정밀도, 재현율

분류 모델은 맞혔는지 여부만 보는 것이 아니다. 어떤 오류를 더 줄여야 하는지에 따라 정밀도와 재현율 해석이 달라진다.

AccuracyPrecisionRecall

데이터 분석 · 모델링과 활용 · Article 16

군집분석의 기본: K-means와 세그먼트 이해

군집분석은 답이 이미 있는 문제를 맞히는 것이 아니라, 닮은 대상을 묶어 구조를 찾는 과정이다. 세그먼트 분석의 기초 감각을 여기서 잡는다.

ClusteringK-meansSegment

데이터 분석 · 모델링과 활용 · Article 17

연관규칙 분석: 지지도, 신뢰도, 향상도

연관규칙은 함께 발생하는 패턴을 찾는 대표적인 데이터 마이닝 기법이다. 지지도, 신뢰도, 향상도 해석을 정확히 이해하는 것이 핵심이다.

SupportConfidenceLift

데이터 분석 · 모델링과 활용 · Article 18

시계열 분석의 기초: 추세, 계절성, 자기상관

시간 순서가 있는 데이터는 일반 표본과 다르게 읽어야 한다. 시계열 분석의 핵심은 추세와 계절성, 자기상관을 구분하는 데 있다.

TrendSeasonalityAutocorrelation

데이터 분석 · 모델링과 활용 · Article 19

데이터 시각화와 스토리텔링의 원칙

분석 결과는 잘 계산하는 것만큼 잘 전달하는 것도 중요하다. 좋은 시각화는 예쁜 차트가 아니라, 핵심 메시지를 빠르게 이해하게 만드는 차트다.

VisualizationStorytellingDashboard

데이터 분석 · 모델링과 활용 · Article 20

ADsP 합격 전략과 문제풀이 루틴

마지막 단계에서는 무엇을 더 외울지보다 무엇을 반복할지 정하는 편이 중요하다. ADsP 합격을 위한 영역별 복습 루틴과 문제풀이 전략을 정리한다.

ReviewRoutineExam