ADsP 자격증 정리

ADsP 자격증 2과목 (데이터분석 기획) 정리

나는주민 2026. 1. 9. 19:11

[ 2과목 ]

1. 데이터분석 기획의 이해
 - 분석 기획 방향성 도출 

-> 분석 대상과 방법 

 - 4가지 유형을 넘나들며 분석을 수행 

 - 최적화 (optimaization)  [방법 , 대상 둘다 ok] ( 준비완료 , 제일 맛있게 먹고싶음)
 - 통찰 (insight)  [방법 ok , 대상 X ] (요리는 아는데 , 뭘 먹고싶은지 스스로모름)
 - 솔루션 (solution) [방법 X , 대상 ok] (라면은 있는데 어떻게 만드는지 모름)
 - 발전 (discovery)  [방법 , 대상 둘다 X]  (배고픈데 뭘 먹을지도 모르고 , 방법도 모름)

1. 분석기회 방안

  과제 중심적 접근 장기적 마스터 플랜
목적 빠르게 해결 지속적 분석 원인 해결
1차목표 Speed & Test Accuracy & Deploy
과제유형 Quick & Win Long Term View
접근방식 Problem Solving Problem Definition

 

1️⃣ 과제 중심적 접근 (단기·즉각 대응형)

  • 목적: 빠르게 해결
  • 1차 목표: Speed & Test
    → 빨리 만들고, 빨리 시험해본다
  • 과제 유형: Quick & Win
    → 단기간에 성과가 보이는 일
  • 접근 방식: Problem Solving
    → 이미 드러난 문제를 바로 고친다

👉 지금 당장 터진 불 끄는 방식
👉 과제, 숙제, 마감 임박한 일에 강함


2️⃣ 장기적 마스터 플랜 (근본·전략형)

  • 목적: 지속적으로 분석해서 원인 해결
  • 1차 목표: Accuracy & Deploy
    → 정확하게 만들고, 실제로 안정적으로 적용
  • 과제 유형: Long Term View
    → 장기 관점에서 의미 있는 일
  • 접근 방식: Problem Definition
    → “이 문제가 진짜 문제 맞아?”부터 다시 정의

👉 불이 왜 났는지 구조부터 뜯어보는 방식
👉 시스템 설계, 프로젝트, 서비스 개선에 강함


-분석 기획시 고려사항 

1) 가용 데이터 : 분석의 기본이 되는 데이터확보 및 파악 
2) 적절한 유스케이스 탐색 : 기존에 잘 구현 되어있는 유사 시나리오 활용
3) 장애요소에 대한 사전계획 수립 : 조직의 역량으로 내제화

-의사결정을 가로막는 요소

 * 고정 관념 , 편향된 생각 , 프레이밍 효과 

  ( 프레이밍 효과 ) : 컵에 물이 반밖에 , 반이나 있네 ( 동일 상황에서도 개인의 판단 결정이 달라짐)


- 분석 방법론 모델

(1) 계층적 프로세스 모델 : 단계 ( Baseline 으로 관리) -> 테스트 -> 스텝(단기간 수행 WorkPackage)
(2) 폭포수 모델 : 이전 단계 완료되어야 다음 단계 진행 ( Top - Down ) 
(3) 나선형 모델 : 여러 개발과정 거쳐 점진적으로 완성 , 위험요소 제거 초점
(4) 프로토타입 모델 : 일부분(프로토타입)을 우선 개발하고 보완
(5) 반복적 모델 

 - 증분형 모형 : 전체 시스템을 작은 기능 단위로 나누어 개발
-  진화형 모형 : 핵심 부분을 개발한 후 요구사항을 반영하여 진화 

(6) 에자일 : 짧은 개발 주기를 가지고 고객 피드백을 지속적으로 반영하여 반복적인 개발


- KDD 분석 방법론 (시험 자주나옴!)

-데이터선택 -> 전처리 -> 변환 -> 마이닝 -> 결과 평가
  (순서 시험에 잘나옴)

1) 데이터 선택 : 원시데이터 (Raw Data) 나 DB 에서 필요한 데이터 선택
2) 전처리 : 이상값 , 잡음 식별 및 데이터 가공
3) 변환 : 변수 선택 및 차원축소
4) 마이닝 : 알고리즘을 선택하여 분석 수행
5) 결과 평가 : 결과에 대한 해석 , 결과가 충족되지 않으면 절차를 반복 수행



 - Crisp-DM 분석 방법론 

- 업무 이해 -> 데이터 이해 -> 데이터 준비 -> 모델링 -> 평가 -> 전개 

->  업데데이트모델평가전

1) 업무 이해 :
업무 목적 파악 , 상황파악 , 목표 설정 , 프로젝트 계획 수립

2) 데이터 이해 : 초기 데이터 수집 , 기술 분석 , EDA , 데이터 품질 확인

3) 데이터 준비 : 데이터 셋 선택 및 정제 , 통합

4) 모델링 : 모델링 기법 선택 , 테스트 계획 설계 , 모델 작성 및 평가 (낚시 주의)
 
5) 평가 : 분석결과 평가 , 모델링 과정 평가 , 모델 적용성 평가

6) 전개 : 전개 계획 , 모니터링 및 유지보수 계획 수립 , 프로젝트 종료 보고서 작성 , 프로젝트 리뷰

* 평가 ---> 전개에서 위대한 실패 (업무 이해로 다시 돌아감) 발생 가능 



* SEMMA 분석 방법론 

- Sample -> Explore -> Modify -> Model -> Assess

1) Sample : 분석 대상 데이터 추출 
2) Explore : 탐색하고 오류 확인
3) Modify : 데이터의 변환
4) Model : 알고리즘 적용 
5) Assess : 모델의 평가 및 검증 


- 빅데이터 분석 방법론 


=> "PPADD"

1) 분석 기획

 - 비즈니스 범위 설정 : SOW (statemnet of Works) - 구조화된 프로젝트 정의서 
 - 프로젝트 위험계획 수립 : 회피 , 전이 , 완화 , 수용

=> "회전완수"

2) 데이터 준비 

- 데이터 스토어 설계 : 정형 , 비정형 , 반정형 데이터에 따른 효율적 저장소를 설계

3) 데이터 분석
 
- 분석용 데이터 준비 : 추가적인 데이터 확보 필요 시 , 데이터 준비 단계로 다시 진행
- 의사 코드 : 일반적인 언어로 프로그래밍 언어의 알고리즘을 유사한 형식으로 써 놓은 것 
- 모델링  : 알고리즘 설명서는 상세히 작성 
- 모델 평가 및 검증 : 성능이 저조한 모델은 튜닝 작업 수행 

- 분석 과제 발굴 

* 하향식 접근 방법
 
 - 문제가 주어지고 해답을 찾기 위해 진행
 - 문제 탐색 -> 문제 정의 -> 해결방안 -> 타당성 검토 

(1) 문제탐색
  1. 빠짐없이 문제를 도출하고 식별하며 , 솔루션 초점 보다는 가치에 초점
  2. 비즈니스 모델 캔버스 단순화 측면 : 업무 , 제품 , 고객 규제와 감사 , 지원인프라 
 
   ---->  "지원인프라 업무 중에 고객제품규제와 감사 했다"

  3. 관점 

  - 거시적 관점 : STEEP (사회 , 기술 , 경제 , 환경, 정치) 
  - 경쟁자 확대 관점 : 대체자 , 경쟁자 , 신규 전입자 
  - 시장의 니즈 탐색 관점 : 고객 , 채널 , 영향자 

 (2) 문제 정의

   - 비즈니스 문제를 데이터 문제로 변환하여 정의

 (3) 해결 방안

  - 기존 시트템 활용 , 시스템 고도화 , 인적 자원 확보 , 아웃소싱 등  

 (4) 타당성 검토
 
 - 경제적 타당성 : 비용대비 편익 분석관점 접근
 - 데이터 타당성 : 데이터 존재여부 , 분석역량이 필요 
 - 기술적 타당성 : 역량 확보 방안 사전에 수립

-# 상형식 접근 방법

 -> 문제 정의 자체가 어려울 떄 , 사물을 그대로 인식하는 What 관점 
      - 주로 비지도 학습 활용


-# 혼합 접근 방법

1) 발산 단계 : 상향식 접근 방법으로서 , 가능한 방안들을 도출
2) 수렴 단계 : 하향식 접근 방법으로서 , 도출된 방안들을 분석


- # 디자인 싱킹 
- 사용자에 공강으로 시작해서 아이디어 발산/수렴 과정을 통한 피드백으로 발전하는 과정
- 공감하기 -> 문제정의 -> 아이디어 도출 -> 프로토타입 -> 테스트

-지도학습 , 비지도학습 

(1) 지도 학습 : 정답이 있는 데이터를 학습 (하향식 접근법)
-  분류분석 , 회귀분석 , 의사결정트리 , KNN , SVM

 2) 비지도 학습 : 정답이 없는 데이터를 학습 (상향식 접근법)
 - 군집분석 , 차원축소 , 연관규칙분석

정리 :  강아지 , 고양이 데이터를 분류해서 알려주고 학습 시키는 것
            -> 지도 학습
 
           전부 섞인 (강아지+고양이) 데이터를 준다음에 알아서 특징을 구별하고 학습 시키는 것
           -> 비지도 학습 




- 분석 프로젝트 관리 방안

* 분석 과제에서 고려해야할 5가지 요소 
 - 데이터 크기 , 속도 , 데이터 복잡도 , 분석 복잡도 , 정확도/정밀도 
 * 정확도 (Accuracy) 와 정밀도(Precision) 는 Trade-Off 관계

 -> 여기에서의 정확도와 정밀도는 3과목의 오분류표에서의 평가지표와는 다른 개념

- 프로젝트 관리 지식 체계 10가지 영역

- 합 , 위 , 간(일정) , 가 , 질 , 인적자원 , 사소통 , 스크(위험) , 달(아웃소싱) , 해관계자

=> "이범룡의자에서 시원조리품을 먹었다.


 2. 분석 마스터플랜

 - 마스터 플랜 수립

* IT 프로젝트의 우선순위 선정 기준
 - 중장기 마스터 플랜을 수립 위하여 ISP를 활용 
 (1) 전략적 중요도 : 전략적 필요성 , 시급성
 (2) 실행 용이성 : 투자 용이성 , 기술 용이성


* 데이터 분석 프로젝트의 우선순위 선정 기준 
(1) 시급성 관점 : 비즈니스 효과 (Return) - Value
(2) 난이도 관점 : 투자비용 요소(Investment) - Volume , Variety , Velocity

 


- 분석 거버넌스 체계 수립 

* 분석 거버넌스 체계 구성요소 
  - 조직 , 프로세스 , 시스템 , 데이터 , 분석관련 교육 및 마인드 육성체계
=> "시조프로마인드데"

- 데이터 분석 수준 진단

1) 분석 준비도


=> "IT문데기인파"

(2) 분석 성숙도
 * CMMI 모델 기반 (1~5단계)

1) 입 : 환경 , 시스템 구축
2) 용 : 업무에 적용
3) 산 : 전사 차원 관리 , 공유
4) 적화 : 혁신 , 성과향상에 기여 

=> "도활확최"






1) 준비형 : 낮은 준비도 , 낮은 성숙도 
 - 데이터 , 인력 , 조직 , 분석업무 , 분석기법 적용 안되어 사전 준비 필요 

2) 정착형 : 낮은 준비도 , 높은 성숙도
- 인력 , 조직 , 분석업무 , 분석기법 등을 제한적으로 사용

3) 도입형 : 높은 준비도 , 낮은 성숙도 
- 조직 및 인력 등 준비도는 높으나 , 분석업무 및 기법 부족 

4) 확산형 : 높은 준비도 , 높은 성숙도 
- 6가지 분석 구성요소가 모두 갖추고 있으며 , 지속적 확신이 가능 

=> "도준정확" 4사분면부터 시계방향(역순)으로 암기 

* 분석 자원 인프라 방안 수립

- 확장성을 고려한 플랫폼 구조 적용 (중앙집중적 관리)

(1) 분석 플랫폼 구성요소
 1) 광의의 분석 플랫폼 : 분석 서비스 제공엔진 , 분석 , 어플리케이션 , 분석 서비스 , API , 하드웨어

 2) 협의외 분석 플랫폼 : 데이터 처리 프레임워크 , 분석엔진 , 분석 라이브러리 
=> 광의의 분석 플랫폼은 협의의 분석 플랫폼 요소들을 포함하는 개념 


협의 : Data + Tool
광의 : 매개체    (즉  , 광의는 협의보다 큰 범위 ) 

- 데이터 거버넌스 

(1) 데이터 거버넌스 
  1) 전사 차원에서 데이터 대해 표준화된 관리 체계 수립
  2) 구성요소 : 칙 , 직 , 로세스
=> "원조프"
  3) 중요 관리대상 : 마스터 데이터 , 메타데이터 , 데이터 사전 등 

    - 마스터 데이터 : 자료 처리에 기준이 되는 자료 
    - 메타데이터 : 다른 데이터를 설명해 주는 데이터
    - 데이터 사전 : DB에 저장된 정보를 요약 

 (2) 데이터 거버넌스 체게
   1) 데이터 표준화 : 메타데이터 및 사전 구축
   2) 데이터 관리 체계 : 효율성을 위함
   3) 데이터 저장소 관리 : 저장소 구성
   4) 표준화 활동 : 모니터링 , 표준 개선 활동


* 빅데이터 거버넌스 
- 데이터 거버넌스 체계 + 빅데이터 효율적 관리 , 데이터 최적화 , 정보보호 , 데이터 카테고리 별 관리책임자 지정 등을 포함 

* 조직 및 인력방안 수립 (DSCoE : 분석조직)
 - 중 구조 : 독립적인 전담 조직 구성 (중복 업무 가능성 존재)
 - 능 구조 : 해당 부서에서 직접 분석 (DSCoE가 없음)
 - 산 구조 : 분석 조직 인력을 현업 부서에 배치

==> "집기분"




   






'ADsP 자격증 정리' 카테고리의 다른 글

ADsP 자격증 ) 1과목 (데이터 이해) 정리  (0) 2026.01.03