[ 2과목 ]
1. 데이터분석 기획의 이해
- 분석 기획 방향성 도출
-> 분석 대상과 방법
- 4가지 유형을 넘나들며 분석을 수행
- 최적화 (optimaization) [방법 , 대상 둘다 ok] ( 준비완료 , 제일 맛있게 먹고싶음)
- 통찰 (insight) [방법 ok , 대상 X ] (요리는 아는데 , 뭘 먹고싶은지 스스로모름)
- 솔루션 (solution) [방법 X , 대상 ok] (라면은 있는데 어떻게 만드는지 모름)
- 발전 (discovery) [방법 , 대상 둘다 X] (배고픈데 뭘 먹을지도 모르고 , 방법도 모름)
1. 분석기회 방안
| 과제 중심적 접근 | 장기적 마스터 플랜 | |
| 목적 | 빠르게 해결 | 지속적 분석 원인 해결 |
| 1차목표 | Speed & Test | Accuracy & Deploy |
| 과제유형 | Quick & Win | Long Term View |
| 접근방식 | Problem Solving | Problem Definition |
1️⃣ 과제 중심적 접근 (단기·즉각 대응형)
- 목적: 빠르게 해결
- 1차 목표: Speed & Test
→ 빨리 만들고, 빨리 시험해본다 - 과제 유형: Quick & Win
→ 단기간에 성과가 보이는 일 - 접근 방식: Problem Solving
→ 이미 드러난 문제를 바로 고친다
👉 지금 당장 터진 불 끄는 방식
👉 과제, 숙제, 마감 임박한 일에 강함
2️⃣ 장기적 마스터 플랜 (근본·전략형)
- 목적: 지속적으로 분석해서 원인 해결
- 1차 목표: Accuracy & Deploy
→ 정확하게 만들고, 실제로 안정적으로 적용 - 과제 유형: Long Term View
→ 장기 관점에서 의미 있는 일 - 접근 방식: Problem Definition
→ “이 문제가 진짜 문제 맞아?”부터 다시 정의
👉 불이 왜 났는지 구조부터 뜯어보는 방식
👉 시스템 설계, 프로젝트, 서비스 개선에 강함
-분석 기획시 고려사항
1) 가용 데이터 : 분석의 기본이 되는 데이터확보 및 파악
2) 적절한 유스케이스 탐색 : 기존에 잘 구현 되어있는 유사 시나리오 활용
3) 장애요소에 대한 사전계획 수립 : 조직의 역량으로 내제화
-의사결정을 가로막는 요소
* 고정 관념 , 편향된 생각 , 프레이밍 효과
( 프레이밍 효과 ) : 컵에 물이 반밖에 , 반이나 있네 ( 동일 상황에서도 개인의 판단 결정이 달라짐)
- 분석 방법론 모델
(1) 계층적 프로세스 모델 : 단계 ( Baseline 으로 관리) -> 테스트 -> 스텝(단기간 수행 WorkPackage)
(2) 폭포수 모델 : 이전 단계 완료되어야 다음 단계 진행 ( Top - Down )
(3) 나선형 모델 : 여러 개발과정 거쳐 점진적으로 완성 , 위험요소 제거 초점
(4) 프로토타입 모델 : 일부분(프로토타입)을 우선 개발하고 보완
(5) 반복적 모델
- 증분형 모형 : 전체 시스템을 작은 기능 단위로 나누어 개발
- 진화형 모형 : 핵심 부분을 개발한 후 요구사항을 반영하여 진화
(6) 에자일 : 짧은 개발 주기를 가지고 고객 피드백을 지속적으로 반영하여 반복적인 개발
- KDD 분석 방법론 (시험 자주나옴!)
-데이터선택 -> 전처리 -> 변환 -> 마이닝 -> 결과 평가 (순서 시험에 잘나옴)
1) 데이터 선택 : 원시데이터 (Raw Data) 나 DB 에서 필요한 데이터 선택
2) 전처리 : 이상값 , 잡음 식별 및 데이터 가공
3) 변환 : 변수 선택 및 차원축소
4) 마이닝 : 알고리즘을 선택하여 분석 수행
5) 결과 평가 : 결과에 대한 해석 , 결과가 충족되지 않으면 절차를 반복 수행
- Crisp-DM 분석 방법론
- 업무 이해 -> 데이터 이해 -> 데이터 준비 -> 모델링 -> 평가 -> 전개
-> 업데데이트모델평가전
1) 업무 이해 : 업무 목적 파악 , 상황파악 , 목표 설정 , 프로젝트 계획 수립
2) 데이터 이해 : 초기 데이터 수집 , 기술 분석 , EDA , 데이터 품질 확인
3) 데이터 준비 : 데이터 셋 선택 및 정제 , 통합
4) 모델링 : 모델링 기법 선택 , 테스트 계획 설계 , 모델 작성 및 평가 (낚시 주의)
5) 평가 : 분석결과 평가 , 모델링 과정 평가 , 모델 적용성 평가
6) 전개 : 전개 계획 , 모니터링 및 유지보수 계획 수립 , 프로젝트 종료 보고서 작성 , 프로젝트 리뷰
* 평가 ---> 전개에서 위대한 실패 (업무 이해로 다시 돌아감) 발생 가능
* SEMMA 분석 방법론
- Sample -> Explore -> Modify -> Model -> Assess
1) Sample : 분석 대상 데이터 추출
2) Explore : 탐색하고 오류 확인
3) Modify : 데이터의 변환
4) Model : 알고리즘 적용
5) Assess : 모델의 평가 및 검증
- 빅데이터 분석 방법론

=> "PPADD"
1) 분석 기획
- 비즈니스 범위 설정 : SOW (statemnet of Works) - 구조화된 프로젝트 정의서
- 프로젝트 위험계획 수립 : 회피 , 전이 , 완화 , 수용
=> "회전완수"
2) 데이터 준비
- 데이터 스토어 설계 : 정형 , 비정형 , 반정형 데이터에 따른 효율적 저장소를 설계
3) 데이터 분석
- 분석용 데이터 준비 : 추가적인 데이터 확보 필요 시 , 데이터 준비 단계로 다시 진행
- 의사 코드 : 일반적인 언어로 프로그래밍 언어의 알고리즘을 유사한 형식으로 써 놓은 것
- 모델링 : 알고리즘 설명서는 상세히 작성
- 모델 평가 및 검증 : 성능이 저조한 모델은 튜닝 작업 수행
- 분석 과제 발굴
* 하향식 접근 방법
- 문제가 주어지고 해답을 찾기 위해 진행
- 문제 탐색 -> 문제 정의 -> 해결방안 -> 타당성 검토
(1) 문제탐색
1. 빠짐없이 문제를 도출하고 식별하며 , 솔루션 초점 보다는 가치에 초점
2. 비즈니스 모델 캔버스 단순화 측면 : 업무 , 제품 , 고객 규제와 감사 , 지원인프라
----> "지원인프라 업무 중에 고객이 제품을 규제와 감사 했다"
3. 관점
- 거시적 관점 : STEEP (사회 , 기술 , 경제 , 환경, 정치)
- 경쟁자 확대 관점 : 대체자 , 경쟁자 , 신규 전입자
- 시장의 니즈 탐색 관점 : 고객 , 채널 , 영향자
(2) 문제 정의
- 비즈니스 문제를 데이터 문제로 변환하여 정의
(3) 해결 방안
- 기존 시트템 활용 , 시스템 고도화 , 인적 자원 확보 , 아웃소싱 등
(4) 타당성 검토
- 경제적 타당성 : 비용대비 편익 분석관점 접근
- 데이터 타당성 : 데이터 존재여부 , 분석역량이 필요
- 기술적 타당성 : 역량 확보 방안 사전에 수립
-# 상형식 접근 방법
-> 문제 정의 자체가 어려울 떄 , 사물을 그대로 인식하는 What 관점
- 주로 비지도 학습 활용
-# 혼합 접근 방법
1) 발산 단계 : 상향식 접근 방법으로서 , 가능한 방안들을 도출
2) 수렴 단계 : 하향식 접근 방법으로서 , 도출된 방안들을 분석
- # 디자인 싱킹
- 사용자에 공강으로 시작해서 아이디어 발산/수렴 과정을 통한 피드백으로 발전하는 과정
- 공감하기 -> 문제정의 -> 아이디어 도출 -> 프로토타입 -> 테스트
-지도학습 , 비지도학습
(1) 지도 학습 : 정답이 있는 데이터를 학습 (하향식 접근법)
- 분류분석 , 회귀분석 , 의사결정트리 , KNN , SVM
2) 비지도 학습 : 정답이 없는 데이터를 학습 (상향식 접근법)
- 군집분석 , 차원축소 , 연관규칙분석
정리 : 강아지 , 고양이 데이터를 분류해서 알려주고 학습 시키는 것
-> 지도 학습
전부 섞인 (강아지+고양이) 데이터를 준다음에 알아서 특징을 구별하고 학습 시키는 것
-> 비지도 학습
- 분석 프로젝트 관리 방안
* 분석 과제에서 고려해야할 5가지 요소
- 데이터 크기 , 속도 , 데이터 복잡도 , 분석 복잡도 , 정확도/정밀도
* 정확도 (Accuracy) 와 정밀도(Precision) 는 Trade-Off 관계
-> 여기에서의 정확도와 정밀도는 3과목의 오분류표에서의 평가지표와는 다른 개념
- 프로젝트 관리 지식 체계 10가지 영역
- 통합 , 범위 , 시간(일정) , 원가 , 품질 , 인적자원 , 의사소통 , 리스크(위험) , 조달(아웃소싱) , 이해관계자
=> "이범룡이 의자에서 시원한 조리품을 먹었다."
2. 분석 마스터플랜
- 마스터 플랜 수립
* IT 프로젝트의 우선순위 선정 기준
- 중장기 마스터 플랜을 수립 위하여 ISP를 활용
(1) 전략적 중요도 : 전략적 필요성 , 시급성
(2) 실행 용이성 : 투자 용이성 , 기술 용이성
* 데이터 분석 프로젝트의 우선순위 선정 기준
(1) 시급성 관점 : 비즈니스 효과 (Return) - Value
(2) 난이도 관점 : 투자비용 요소(Investment) - Volume , Variety , Velocity

- 분석 거버넌스 체계 수립
* 분석 거버넌스 체계 구성요소
- 조직 , 프로세스 , 시스템 , 데이터 , 분석관련 교육 및 마인드 육성체계
=> "시조프로마인드데"
- 데이터 분석 수준 진단
1) 분석 준비도

=> "IT문데기인파"
(2) 분석 성숙도
* CMMI 모델 기반 (1~5단계)
1) 도입 : 환경 , 시스템 구축
2) 활용 : 업무에 적용
3) 확산 : 전사 차원 관리 , 공유
4) 최적화 : 혁신 , 성과향상에 기여
=> "도활확최"


1) 준비형 : 낮은 준비도 , 낮은 성숙도
- 데이터 , 인력 , 조직 , 분석업무 , 분석기법 적용 안되어 사전 준비 필요
2) 정착형 : 낮은 준비도 , 높은 성숙도
- 인력 , 조직 , 분석업무 , 분석기법 등을 제한적으로 사용
3) 도입형 : 높은 준비도 , 낮은 성숙도
- 조직 및 인력 등 준비도는 높으나 , 분석업무 및 기법 부족
4) 확산형 : 높은 준비도 , 높은 성숙도
- 6가지 분석 구성요소가 모두 갖추고 있으며 , 지속적 확신이 가능
=> "도준정확" 4사분면부터 시계방향(역순)으로 암기
* 분석 자원 인프라 방안 수립
- 확장성을 고려한 플랫폼 구조 적용 (중앙집중적 관리)
(1) 분석 플랫폼 구성요소
1) 광의의 분석 플랫폼 : 분석 서비스 제공엔진 , 분석 , 어플리케이션 , 분석 서비스 , API , 하드웨어
2) 협의외 분석 플랫폼 : 데이터 처리 프레임워크 , 분석엔진 , 분석 라이브러리
=> 광의의 분석 플랫폼은 협의의 분석 플랫폼 요소들을 포함하는 개념
협의 : Data + Tool
광의 : 매개체 (즉 , 광의는 협의보다 큰 범위 )
- 데이터 거버넌스
(1) 데이터 거버넌스
1) 전사 차원에서 데이터 대해 표준화된 관리 체계 수립
2) 구성요소 : 원칙 , 조직 , 프로세스
=> "원조프"
3) 중요 관리대상 : 마스터 데이터 , 메타데이터 , 데이터 사전 등
- 마스터 데이터 : 자료 처리에 기준이 되는 자료
- 메타데이터 : 다른 데이터를 설명해 주는 데이터
- 데이터 사전 : DB에 저장된 정보를 요약
(2) 데이터 거버넌스 체게
1) 데이터 표준화 : 메타데이터 및 사전 구축
2) 데이터 관리 체계 : 효율성을 위함
3) 데이터 저장소 관리 : 저장소 구성
4) 표준화 활동 : 모니터링 , 표준 개선 활동
* 빅데이터 거버넌스
- 데이터 거버넌스 체계 + 빅데이터 효율적 관리 , 데이터 최적화 , 정보보호 , 데이터 카테고리 별 관리책임자 지정 등을 포함
* 조직 및 인력방안 수립 (DSCoE : 분석조직)
- 집중 구조 : 독립적인 전담 조직 구성 (중복 업무 가능성 존재)
- 기능 구조 : 해당 부서에서 직접 분석 (DSCoE가 없음)
- 분산 구조 : 분석 조직 인력을 현업 부서에 배치
==> "집기분"
'ADsP 자격증 정리' 카테고리의 다른 글
| ADsP 자격증 ) 1과목 (데이터 이해) 정리 (0) | 2026.01.03 |
|---|