AYSTORY
[필기] 분석 방안 수립 본문
PART 01 · Ch2 데이터 분석 계획
분석 기획
로드맵
하향식/상향식
프로토타이핑
SDLC
KDD
CRISP-DM
SEMMA
01. 데이터 분석
- 데이터 분석의 지향점
- 전략적 통찰이 없는 데이터 분석 배제
- 일차원적 데이터 분석 지양
- 전략 도출을 위한 가치 기반 데이터 분석 지향
- 데이터 분석은 규모가 아니라 어떤 시각과 통찰을 얻을 수 있는가의 문제
- 빅데이터를 활용하기 위한 장애물은 비용보다 데이터 분석을 수행하기 위한 분석적 방법과 성과에 대한 이해의 부족
02. 데이터 분석 기획
- 실제 분석을 수행하기에 앞서 분석을 수행할 과제의 정의 및 의도했던 결과를 도출할 수 있도록 이를 적절히 관리할 수 있는 방안을 사전에 계획하는 작업
- 어떠한 목표(WHAT)를 달성하기 위해(WHY) 어떠한 데이터를 가지고 어떤 식으로(HOW) 수행할 것인가에 대한 일련의 계획 수립
- 분석 기획의 특징
- 분석 대상과 방법에 따른 분류
- Optimization / Insight / Solution / Discovery
- 목표 시점에 따른 분류
- 단기적 접근 방식 (과제 중심적 접근)
- 중장기적 접근 방식 (마스터 플랜 접근)
- 혼합 방식 (분석 기획 시 적합)
- → 지속적인 분석 문화를 내재화하기 위해서는 중장기적 접근 방식인 마스터 플랜 접근 방식을 사용해야 함.
- 분석 대상과 방법에 따른 분류

- 데이터 분석 유형
- 설명 분석: 주어진 데이터 요약 또는 집계하여 결과를 도출. 과거 또는 현재 발생한 사실 그 자체를 설명
- 예측 분석
- 진단 분석: 데이터 간의 인과 관계 또는 상관 관계를 파악하여 특정 결과가 발생한 원인을 밝히기 위해 분석 수행
- 처방 분석: 예측되는 상황을 위해 무엇을 하면 좋을지 대안 제시
03. 분석 마스터 플랜과 로드맵 설정
- 분석 마스터 플랜
- 분석과제를 수행함에 있어 그 과제의 목적이나 목표에 따라 전체적인 방향성을 제시하는 기본계획
- 분석 마스터 플랜 수립 절차
- 일반적인 정보전략계획 방법론을 활용할 수 있다. 다만 데이터 분석 기획 특성을 고려하여 수행하여야 함.
- 정보전략계획 (ISP; Information Strategy Planning)
- 정보기술 및 시스템을 전략적으로 활용하기 위한 중장기 마스터 플랜을 수립하는 절차
- 조직 내, 외부의 환경을 충분히 분석하여 새로운 기회나 문제점을 도출
- 사용자의 요구사항을 확인하여 시스템 구축 우선순위 결정
- 분석 과제 우선순위 평가기준
- IT 프로젝트의 과제 우선순위 평가기준
- 전략적 중요도 (전략적 필요성, 시급성)
- 실행 용이성 (투자 용이성, 기술 용이성)
- 데이터 분석 프로젝트의 우선순위 평가기준
- ROI 요소 (Return Of Investment; 투자 수익률)
- 투자비용 요소 (데이터 크기, 형태, 속도)
- 비즈니스 효과 (새로운 가치)
- ROI 요소 (Return Of Investment; 투자 수익률)
- 분석 ROI 요소를 고려한 과제 우선순위 평가기준
- 시급성 (전략적 중요도, KPI; 목표가치)
- 난이도 (데이터 획득 비용, 가공 비용, 저장 비용, 분석 적용 비용, 분석 수준)
- IT 프로젝트의 과제 우선순위 평가기준
1) 투자비용 요소로서 데이터 크기, 형태, 속도가 있으며, 비즈니스 효과로 새로운 가치를 얻을 수 있다.
2)시급성을 충족시키기 위해 데이터 가공 비용과 분석 수준 등을 낮출 수 있다.
3) 난이도를 조절하기 위하여 데이터 획득 비용과 분석 수준 등을 낮출 수 있다.
- 분석 과제 우선순위 선정 및 조정
- 포트폴리오 사분면 분석 기법 활용
- 난이도와 시급성 기준으로 분석 과제 유형을 분류하여 4분면에 배치
- 매트릭스 내 분석 과제 우선순위 선정
- 가장 우선적으로 분석 과제 적용이 필요한 영역: 3사분면
- 우선순위가 가장 낮은 영역: 2사분면
- 적용 우선순위 기준을 시급성에 둘 경우: 3 → 4 → 1 → 2
- 적용 우선순위 기준을 난이도에 둘 경우: 3 → 1 → 4 → 2
- 매트릭스 내 분석 과제 우선순위 조정
- 시급성이 높고 난이도가 높은 1사분면은 의사결정을 통해 적용 우선순위 조정 가능
- 분석 과제 우선순위 조정 시 고려사항
- 기술적 요소에 따른 적용 우선순위 조정
- 분석 범위에 따른 우선순위 조정
- 포트폴리오 사분면 분석 기법 활용
1) 매트릭스 기반 분석 과제 우선순위 선정 시, 분석이 쉽지 않지만 시급하게 진행되어야 하는 경우 1사분면에 위치시킨다.
2) 데이터 양과 특성, 분석 범위 등에 따라 난이도를 조율하여 적용 우선순위를 1사분면에서 3사분면으로 이동할 수 있다.
3) 분석 과제의 전체 범위를 한 번에 일괄적으로 적용하여 추진할 수도 있고, 분석 과제 중 일부만 PoC로 진행하고 평가 후에 범위를 확대할 수 있다.
- 분석 로드맵 설정
- 마스터 플랜에서 정의한 목표를 기반으로 분석 과제를 수행하기 위해 필요한 기준을담아 만든 종합적 계획
- 분석 로드맵 수립 절차
- 최종적 실행 우선순위 결정 → 단계적 구현 로드맵 수립
- 단계별로 추진하고자 하는 목표 명확히 정의
- 추진 과제별 선행 관계를 고려 → 단계별 추진 내용 정렬
- 데이터 분석체계 도입
- 데이터 분석 유효성 검증
- 데이터 분석 확산 및 고도화
- 세부적 일정계획 수립
- 반복적 정련과정을 통해 프로젝트의 완성도 높여 나감.
- 데이터 수집 및 확보와 분석 데이터 준비 단계는 순차적으로 진행하고 모델링 단계는 반복적으로 수행
- 주로 순차형, 반복형 혼합하여 사용
04. 분석 문제 정의
- 분석 문제 정의 개요
- 분석 과제 도출
- 대표적 분석 과제 도출 방법
- 문제가 먼저 주어지고 이에 대한 해법을 찾아가는 하향식 접근 방식
- 데이터 기반으로 문제의 재정의 및 해결방안을 탐색하는 상향식 접근 방식
- 최적 의사결정을 위한 혼합 방식
- 동적 환경에서 발산과 수렴 단계를 반복적으로 수해아며 상호 보완을 통해 분석 가치를 극대화할 수 있음.
- 상향식 접근 방식의 발산 단계: 가능한 옵션 도출
- 하향식 접근 방식의 수렴 단계: 도출된 옵션을 분석하고 검증
- 분석 과제 정의
- 하향식 접근 방식 (Top Down Approach)
- 문제가 주어지고 이에 대한 해법을 찾기 위해 각 과정이 체계적으로 단계화되어 수행하는 방식
- 구성
- 문제 탐색 단계
- 비즈니스 모델 기반 문제 탐색
- 외부 참조 모델 기반 문제 탐색
- 분석 유스케이스 정의
- 문제 정의 단계
- 식별된 비즈니스 문제 → 데이터적 문제로 변환하여 정의
- 해결방안 탐색 단계
- (How: 기존 시스템 / Who: 확보) 기존 시스템 개선 활용
- (How: 기존 시스템 / Who: 미확보) 교육 및 채용을 통한 역량 확보
- (How: 신규 도입 / Who: 확보) 시스템 고도화
- (How: 신규 도입 / Who: 미확보) 전문 업체 Sourcing
- 타당성 평가 단계
- 경제적 타당성
- 데이터 및 기술적 타당성
- 문제 탐색 단계
- 문제 탐색 방법
- 비즈니스 모델 캔버스를 활용한 과제 발굴
- 업무 / 제품 / 고객 단위
- 규제와 감사 / 지원 인프라 영역
- 분석 기회 발굴의 범위 확장
- 거시적 관점: 사회 / 기술 / 경제 / 환경 / 정치 영역
- 경쟁자 확대 관점: 대체재 / 경쟁자 / 신규 진입자 영역
- 시장의 니즈 탐색 관점: 고객 / 채널 / 영향자들 영역
- 역량의 재해석 관점: 내부 역량 / 파트너와 네트워크 영역
- 비즈니스 모델 캔버스를 활용한 과제 발굴
- 상향식 접근 방식 (Bottom Up Approach)
- 문제의 정의 자체가 어려운 경우 데이터 기반으로 문제 재정의 및 해결방안을 탐색하고 지속적으로 개선하는 방식
- 특징
- 다량의 데이터 분석을 통해 왜(WHY) 그러한 일이 발생하는지 역으로 추적하면서 문제를 도출하거나 재정의할 수 있는 방식
- 등장 배경
- 기존 하향식 접근 방식의 한계 극복하고자
- 전통적 분석 사고 극복방안
- 디자인 사고 접근법
- 비지도학습 방법에 의한 수행
- 빅데이터 환경에서의 분석
- 인과관계 → 상관관계 분석으로 이동
- 문제 해결 방법
- 프로토타이핑 접근법: 먼저 분석을 시도해 보고 그 결과를 확인하면서 반복적으로 개선해 나가는 방식
- 프로토타이핑 접근법의 필요성
- 문제에 대한 인식 수준
- 필요 데이터 존재 여부의 불확실성
- 데이터 사용 목적의 가변성
- 프로토타이핑 접근법의 프로세스
- 특징
- 잘 설계된 프로토타이핑을 지속한느 경우 실험이 가지고 있는 불명확성은 감소하고 의도했던 결과를 도출할 가능성이 높아짐.
- 빅데이터 분석환경에서는 최대한 빨리 분석 결과를 보여주고 이를 가지고 지속적으로 반복하는 방법이 효과적
- 구성
- 가설의 생성
- 디자인에 대한 실험
- 실제 환경에서의 테스트
- 테스트 결과에서의 통찰 도출 및 가설 확인
- 특징
Q. 하향식 접근 방식에 대한 설명
1) 문제 탐색 단계, 문제 정의 단계, 해결방안 탐색 단계, 타당성 평가 단계로 구성
2) 문제가 주어지고 이에 대한 해법을 찾기 위하여 각 과정이 체계적으로 단계화되어 수행하는 전통적 분석 과제 발굴 방식으로 근래의 문제들은 변화가 심하여 문제를 사전에 정확하게 정의하기 어렵다.
3) 문제 탐색 기법으로 비즈니스 모델 기반 탐색, 외부 참조 모델 기반 문제 탐색, 분석 유즈케이스 정의 방법이 있다.
4) 타당성 평가 단계에선느 경제적 타당성과 데이터 및 기술적 타당성을 검증하여야 한다.
Q. 상향식 접근 방식에 대한 설명
1) 문제의 정의 자체가 어려운 경우 데이터 기반으로 문제 재정의 및 해결방안을 탐색하고 이를 지속적으로 개선하는 방식
2) 다량의 데이터 분석을 통해 왜 그러한 일이 발생하는지 역으로 추적하면서 문제를 도출하거나 재정의할 수 있는 방식
3)디자인 사고 접근법은 사물을 있는 그대로 인식하는 WHAT 관점을 강조하지만, 분석적으로 사물을 인식하려는 wHY 관점으로 접근→ 통상적으로는 분석적으로 사물을 인식하려는 WHY를 강조하나, 답을 미리 내는 것이 아니라 사물을 있는 그대로 인식하려는 WHAT 관점으로 접근
4) 프로토타이핑 접근법은 일단 먼저 분석을 시도해보고 그 결과를 확인하면서 반복적으로 개선해나가는 방식
05. 데이터 분석 방안
- 분석 방법론
- 구성요건
- 상세한 절차
- 방법
- 도구와 기법
- 템플릿과 산출물
- 어느 정도의 지식만 있으면 활용 가능한 수준의 난이도
- 생성과정 (선순환 과정)
- 형식화: 분석가의 경험을 바탕으로 정리하여 문서화 (암묵지 → 형식지)
- 체계화: 문서에는 절차나 활동 및 작업, 산출물, 도구 등을 정의 (형식지 → 방법론)
- 내재화: 전파된 방법론을 학습하고 활용하여 내재화 (방법론 → 암묵지)
- 구성요건
- 계층적 프로세스 모델 구성
- 최상위 계층 - 단계 (Phase)
- 프로세스 그룹을 통하여 완성된 단계별 산출물 생성
- 각 단계는 기준선으로 설정되어 관리되어야 하며 버전관리 등을 통해 통제
- 중간 계층 - 태스크 (Task)
- 각 태스크는 단계를 구성하는 단위 활동
- 물리적 또는 논리적 단위로 품질검토 간으
- 최하위 계층 - 스텝 (Step)
- WBS(Work Breakdown Structure)의 워크패키지(Work Package)
- 입력자료, 처리 및 도구, 출력자료로 구성된 단위 프로세스
- 최상위 계층 - 단계 (Phase)
- 소프트웨어개발생명주기 활용
- 소프트웨어개발생명주기(SDLC; Software Development Life Cycle)는 소프트웨어에 대해 요구분석과 설계, 구현과정을 거쳐 설치, 운영과 유지보수, 그리고 폐기할 때까지의 전 과정을 가시적으로 표현한 것
- 구성요소
- 계획(요구명세): 고객 요구사항 명세화
- 요구분석
- 설계
- 구현
- 시험: 발생 가능한 실행 프로그램의 오류 발견, 수정
- 유지보수: 인수가 완료된 후 일어나는 모든 개발 활동
- 구성요소
- 폭포수 모형(Waterfall Model)
- 고전적 Life Cycle Paradigm으로 분석, 설계, 개발, 구현, 시험 및 유지보수 과정을 순차적으로 접근
- 결과물이 후반부에 가서야 구체화 → 문제점 뒤늦게 발견
- 프로토타입 모형(Prototype Model)
- 사용자의 요구사항을 충분히 분석할 목적으로 시스템의 일부분을 일시적으로 간략히 구현한 다음 다시 요구사항을 반영하는 과정 반복
- 실험적 프로토타입: 요구분석의 어려움을 해결하고자 실제 개발될 소프트웨어의 일부분 직접 개발 → 의사소통 도구로 활용
- 진화적 프로토타입: 요구분석 도구로만 활용하는 것이 아니라, 이미 개발된 프로토타입을 지속적으로 발전시켜 최종 소프트웨어로 발전시킴.
- 폭포수 모형의 단점 보완
- 사용자의 요구사항을 충분히 분석할 목적으로 시스템의 일부분을 일시적으로 간략히 구현한 다음 다시 요구사항을 반영하는 과정 반복
- 나선형 모형(Spiral Model)
- 시스템을 개발하면서 생기는 위험 최소화하기 위해 나선을 돌면서 점진적으로 완벽한 시스템으로 개발하는 모형
- 프로젝트의 완전성 및 위험 감소와 유지보수가 용이
- 관리가 중요하나 매우 어렵고 개발시간이 장기화될 가능성
- 반복적 모형(Iterative Development Model)
- 사용자의 요구사항 일부 혹은 제품의 일부를 반복적으로 개발하여 최종 시스템으로 완성하는 모형
- 증분형 모형(Incremental Model): 사용자 요구사항과 제품 일부분을 반복적으로 개발 → 대상범위를 확대해 나아가서 최종제품을 완성
- 진화적 모형(Evolution Model): 시스템이 갖는 여러 구성요소의 핵심부분을 개발한 후 각 구성요솔르 지속적으로 발전시켜 나가는 방법
- 사용자의 요구사항 일부 혹은 제품의 일부를 반복적으로 개발하여 최종 시스템으로 완성하는 모형
- 소프트웨어개발생명주기(SDLC; Software Development Life Cycle)는 소프트웨어에 대해 요구분석과 설계, 구현과정을 거쳐 설치, 운영과 유지보수, 그리고 폐기할 때까지의 전 과정을 가시적으로 표현한 것
| 폭포수 모형 | 검토 및 승인을 거쳐 순차적, 하향식으로 개발 진행 | ||
| 장점 | 이해하기 쉽고 관리 용이 | ||
| 다음 단계 진행 전에 결과 검증 | |||
| 단점 | 요구사항 도출 어려움 | ||
| 설계 및 코딩과 테스트 지연 | |||
| 문제점 발견이 늦어짐 | |||
| 프로토타입 모형 | 시스템의 핵심적 기능을 먼저 만들어 평가 후 구현 | ||
| 장점 | 요구사항 도출과 시스템 이해 용이 | ||
| 의사소통 향상 | |||
| 단점 | 사용자 오해(완제품) 발생하기 쉬움 | ||
| 폐기되는 프로토타입이 존재 | |||
| 나선형 모형 | 폭포수 모형과 프로토타입 모형의 장점에 위험분석 추가 | ||
| 구현 단계 | 계획수립 | 목표, 기능 선택, 제약조건 설정 | |
| 위험분석 | 기능 선택의 우선순위 및 위험요소 분석, 제거 | ||
| 개발 | 선택 기능 개발 | ||
| 고객평가 | 개발 결과 평가 | ||
| 장점 | 점증적 개발 시 실패 위험 감소시킬 수 있음. | ||
| 테스트 용이하고 피드백이 있음. | |||
| 단점 | 관리 복잡 | ||
| 반복적 모형 | 시스템을 여러 번 나누어 릴리즈하는 방법 | ||
| Incremental | 기능 분해 후 릴리즈별 기능 추가 개발 | ||
| Evolution | 전체 기능을 대상으로 하되 릴리즈 진행하면서 기능이 완벽 | ||
- 소프트웨어개발생명주기 모형 선정 기준
- 프로젝트 규모와 성격
- 개발에 사용되는 방법과 도구
- 개발에 소요되는 시간과 비용
- 개발과정에서의 통제수단과 소프트웨어 산출물 인도 방식
1) 분석 방법론은 상세한 절차, 방법, 도구와 기법, 템플릿과 산출물, 어느 정도의 지식만 있으면 활용 가능한 수준의 난이도를 구성요건으로 갖추어야 함.
2) 분석 방법론은 형식화, 체계화, 내재화의 선순환 과정을 통해 생성
3) 분석 방법론은 일반적으로 계층적 프로세스 모델 형태로 구성 가능하며, 단계, 태스크, 스텝 3계층으로 구성됨. 태스크는 각 단계를 구성하는 단위 활동이며, 스텝은 태스크의 하위층으로 WBS의 워크패키지를 말함.
1) 증분형 모형과 진화형 모형은 서로 필요성이 다를 뿐. 증분형 ㅁ형은 폭포수 모형의 변형으로 각 증분을 따로 개발 및 통합하여 개발 기간을 단축시키고, 진화형 모형은 시스템의 요구사항을 사전에 정의하기 어려운 경우 사용하여 개발의 어려움을 최소화
2) 원형 모형은 사용자로 하여금 완제품으로 오해 받기 쉽고 폐기되는 프로토타입이 존재하며, 폭포수 모형이 이해하기 쉽고 관리가 용이
3) 폭포수 모형은 요구사항 도출이 어려우며, 원형 모형이 의사소통을 향상시킴.
4) 나선형 모형은 계획수립, 위험분석, 개발, 고객평가 단계로 구성
KDD 분석 방법론
KDD(Knowledge Discovery in Database)
- 9가지 프로세스
- 분석 대상 비즈니스 도메인 이해
- 분석 대상 데이터셋 선택과 생성
- 데이터에 포함되어 있는 잡음과 이상값(Outlier) 등을 제거하는 정제작업이나 선처리
- 분석 목적에 맞는 변수를 찾고 필요시 데이터 차원 축소하는 데이터 변경
- 분석 목적에 맞는 데이터 마이닝 기법 선택
- 분석 목적에 맞는 데이터 마이닝 알고리즘 선택
- 데이터 마이닝 시행
- 데이터 마이닝 결과에 대한 해석
- 데이터 마이닝에서 발견된 지식 활용
- 분석절차
- 데이터셋 선택
- 데이터 전처리
- 데이터 변환
- 데이터 마이닝: 분석 목적에 맞는 데이터 마이닝 기법 및 알고리즘 선택하여 분석 수행
- 데이터 마이닝 결과 평가
CRISP-DM 분석 방법론
Cross Industry Standard Process for Data Mining
계층적 프로세스 모델로써 4계층으로 구성된 데이터 마이닝 프로세스
- 4계층
- 최상위 레벨: 여러 개의 단계로 구성
- 일반화 태스크(Generic Tasks): 데이터 마이닝의 단일 프로세스를 완전하게 수행하는 단위
- 세분화 태스크(Specialized Tasks): 일반화 태스크를 구체적으로 수행
- 프로세스 실행(Process Instances): 데이터 마이닝을 구체적으로 실행
- 분석절차
- 업무 이해
- 데이터 이해
- 데이터 준비
- 모델링
- 평가
- 전개: 완성된 분석 모형을 업무에 적용하기 위한 계획 수립
| CRISP-DM 분석 방법론 | KDD 분석 방법론 |
| 업무 이해 | |
| 데이터 이해 | 데이터셋 선택 |
| 데이터 전처리 | |
| 데이터 준비 | 데이터 변환 |
| 모델링 | 데이터 마이닝 |
| 평가 | 데이터 마이닝 결과 평가 |
| 전개 |
SEMMA 분석 방법론
Sample, Explore, Modify, Model and Assess
기술과 통계 중심의 데이터 마이닝 프로세스
- 특징
- SAS Institute의 데이터 마이닝 도구와 손쉽게 접목하여 활용
- 주로 데이터 마이닝 프로젝트의 모델링 작업에 중점
- 분석절차
- 추출
- 탐색
- 수정
- 분석용 데이터 변환
- 데이터 표현 극대화(시각화)
- 파생 변수 생성, 선택, 변형
- 모델링
- 평가
Q. KDD 분석 방법론에 대한 설명
1) 데이터에서 패턴을 찾는 과정을 9개의 프로세스로 제시
2) 데이터셋 선택, 데이터 전처리, 데이터 변환, 데이터 마이닝, 데이터 마이닝 결과 평가 총 5단계에 걸쳐 진행
3) 체계적으로 정리한 프로파일링 기술 기반의 데이터 마이닝 프로세스
Q. CRISP-DM 분석 방법론에 대한 설명
1) 데이터 탐색과 이해 및 데이터를 통한 문제 인식과 해결이 가능
2) 비즈니스 요구사항에 맞게 데이터 마이닝 반복적으로 수행
3)계층적 프로세스 모델로써 3계층으로 구성된 데이터 마이닝 프로세스→ 최상위 레벨, 일반화 태스크, 세분화 태스크, 프로세스 실행 4계층으로 구성된 데이터 마이닝 프로세스
4) 업무 이해, 데이터 이해, 데이터 준비, 모델링, 평가, 전개 총 6단계 진행
Q. SEMMA 분석 방법론에 대한 설명
1) SAS Institute의 데이터 마이닝 도구와 손쉽게 접목하여 활용
2) 주로 데이터 마이닝 프로젝트의 모델링 작업에 중점
3) 추출, 탐색, 수정, 모델링, 평가 총 5단계에 걸쳐 진행
06. 빅데이터 분석 방법론
- 개요 (3계층)
- 단계: 데이터 분석 수행하기 위한 절차
- 태스크: 각 단계별로 수행되어야 하는 세부 업무
- 스텝: 단기간 내에 수행 가능한 워크 패키지 (입력자료, 처리 및 도구, 출력자료로 구성된 단위 프로세스)
- 개발절차
- 분석 기획(Planning)
- 비즈니스 이해 및 범위 설정
- 프로젝트 정의 및 계획 수립
- 프로젝트 위험 계획 수립
- 데이터 준비(Preparing)
- 필요 데이터 정의
- 데이터 스토어 설계
- 데이터 수집 및 정합성 점검
- 데이터 분석(Analyzing)
- 분석용 데이터 준비
- 텍스트 분석
- 탐색적 분석
- 모델링
- 모델 평가 및 검증
- 시스템 구현(Developing)
- 설계 및 구현
- 시스템 테스트 및 운영
- 평가 및 전개(Deploying)
- 모델 발전계획 수립
- 프로젝트 평가 및 보고
- 분석 기획(Planning)
Q. 빅데이터 분석 방법론에 대한 설명
1) 응용 서비스 개발을 위한 3계층으로 구성
2) 각 단계별로 세부 태스크와 스텝이 정의
3) 분석 기획, 데이터 준비, 데이터 분석, 시스템 구현, 평가 및 전개 총 5단계로 걸쳐 진행
4) 데이터 분석 단계에서 텍스트 분석을 위해 용어사전이 필요하며 업무 도메인에 맞도록 작성
07. 데이터 분석 거버넌스
- 필요성
- 데이터 분석 업무를 하나의 기업 문화로 정착하고 이를 지속적으로 고도화해나가기 위해 필요
- 구성요소
- 데이터 분석 기획과 관리를 수행하는 조직
- 데이터 분석 과제 기획과 운영 프로세스
- 데이터 분석 지원 인프라
- 데이터 거버넌스
- 데이터 분석 교육 및 마인드 육성 체계
- 데이터 분석 기획과 관리를 수행하는 조직
- 분석 조직구조
- 집중형
- 기능형
- 분산형
- 분석 조직구조
- 데이터 분석 과제 기획과 운영 프로세스
- 데이터 분석 과제 관리 프로세스 구성
- 과제 발굴 단계
- 과제 수행 및 모니터링 단계
- 데이터 분석 과제 관리 프로세스 구성
- 데이터 분석 지원 인프라
- 데이터 분석 플랫폼 구축
- 데이터 분석 마스터 플랜을 기획하는 단계에서부터 장기적, 지속적, 안정적으로 활용할 수 있도록 고려
- 단기적으로 구축이 쉬운 개별 시스템보다는, 확장성을 고려한 플랫폼 구조 도입이 적절
- 데이터 분석 플랫폼 정의
- 데이터 분석 서비슬르 위한 응용프로그램이 실행될 수 있는 환경과 기초를 이루는 컴퓨터 시스템
- 데이터 분석 플랫폼 특징
- 데이터 분석 플랫폼 구성요소
- 데이터 분석 플랫폼 구축
- 데이터 거버넌스
- 정의
- 전사 차원의 모든 데이터에 대하여 정책 및 지침, 표준화, 운영조직과 책임 등의 표준화된 관리 체계를 수립하고 운영하기 위한 프레임워크와 저장소 구축하는 것
- 주요 관리 대상
- 마스터 데이터: 마스터 파일을 형성하는 데이터, 데이터 처리 및 조작하기 위해 사용되는 기본 데이터
- 메타 데이터: 데이터에 대한 구조화된 데이터, 다른 데이터 설명하기 위해 사용되는 데이터
- 데이터 사전
- 특징
- 독자적 구축도 가능하지만 전사 차원의 IT 거버넌스나 EA의 구성요소가 될 수도 있음.
- 구성요소
- 원칙
- 조직: 데이터를 관리할 조직의 역할과 책임
- 프로세스: 데이터 관리를 위한 활동과 체계
- 체계
- 데이터 표준화 (데이터 표준 용어 설정, 명명 규칙 수립, 메타 데이터 및 데이터 사전 구축)
- 데이터 관리 체계
- 데이터 저장소 관리
- 표준화 활동
- 정의
Q. 협의의 분석 플랫폼의 구성요소
1) 데이터 처리 프레임워크
2) 분석 엔진
3) 분석 라이브러리
* 광의의 분석 플랫폼
협의의 분석 플랫폼을 포함하여 분석 서비스 제공 엔진, 분석 애플리케이션, 분석 서비스 제공 API, 운영체제로 구성
08. 데이터 분석 수준진단
- 분석 수준진단 프레임워크
- 분석 준비도(Readiness)
- 분석 업무 파악
- 분석 인력 및 조직
- 분석 기법
- 분석 데이터
- 분석 문화
- IT 인프라
- 분석 성숙도(Maturity) 모델
- 정의: 데이터 분석 능력 및 데이터 분석 결과 활용에 대한 조직의 성숙도 수준 평가하여 현재 상태 점검하는 방법
- 특징: 비즈니스 부문, 조직 및 역량 부문, IT 부문 총 3개 부문 대상으로 실시
- 상세화
- 도입 단계: 분석을 시작하여 환경과 시스템 구축
- 활용 단계: 분석 결과를 실제 업무에 적용
- 확산 단계: 전사 차원에서 분석을 관리하고 공유
- 최적화 단계: 분석을 진화시켜서 혁신 및 성과 향상에 기여
- 분석 준비도(Readiness)
- 분석 수준진단 결과
- 사분면 분석(Analytics Quadrant)
- 정착형: 준비도는 낮으나 조직, 인력, 분석업무, 분석기법 등을 기업 내부에서 제한적으로 사용하고 있어 1차적으로 정착이 필요한 기업
- 확산형: 기업에 필요한 6가지 분석 구성요소를 갖추고 있고, 현재 부분적으로 도입되어 지속적 확산이 필요한 기업
- 준비형: 기업에 필요한 데이터, 인력, 조직, 분석업무, 분석기법 등이 적용되어 있지않아 사전준비가 필요한 기업
- 도입형: 기업에서 활용하는 분석 업무, 기법 등은 부족하지만 적용조직 등 준비도가 높아 바로 도입할 수 있는 기업
- 사분면 분석(Analytics Quadrant)

'빅데이터분석기사' 카테고리의 다른 글
| [필기] 데이터 적재 및 저장 (0) | 2026.03.08 |
|---|---|
| [필기] 데이터 수집 및 전환 (0) | 2026.03.07 |
| [필기] 분석 작업 계획 (0) | 2026.03.07 |
| [필기] 빅데이터 기술 및 제도 (0) | 2026.02.12 |
| [필기] 빅데이터의 개요 및 활용 (0) | 2026.02.12 |
