AYSTORY
[필기] 분석결과 해석 본문
Chapter 02. 분석결과 해석 및 활용
모델별 해석
기여도 평가
모델별 시각화
01. 분석 모델별 결과 해석
- 분석모형 해석
- 회귀 모델
- 평가를 위한 지표는 일반적으로 잔차, 결정계수 등이 있음.
- 잔차: 회귀모형으로 실제 값과 예측 값의 차이, 패턴이나 추세 X
- 결정계수: 추정된 회귀식이 변동을 얼마나 잘 설명했는가에 대한 지표, 1에 가까울수록 good
- [잔차] MAE
- 예측값과 실제값 차이를 절대값으로 변환 → 더한 뒤의 평균
- [잔차] MSE
- 예측값과 실제값 차이를 제곱 → 더한 뒤의 평균
- [잔차] MAPE
- MAE를 퍼센트로 변환
- [잔차] RMSE
- MSE에 Root를 씌운 값
- [잔차] RMSLE
- RMSE에 로그를 적용한 값
- [결정계수] R²
- 총제곱합(SST)에 대한 회귀제곱합(SSR)
- [결정계수] 수정된 R²
- 표본크기(n)와 독립변수 개수(p) 추가 고려(학습 데이터 또는 독립변수가 많아질수록 모형 예측능력과 상관없이 결정계수가 커지는 경향 방지)
- 평가를 위한 지표는 일반적으로 잔차, 결정계수 등이 있음.
- 분류 모델
- 정확도
- 예측 값이 실제 값과 동일, 정답인 비율
- 정밀도
- 예측 값이 Positive(True)로 분류한 것 중 실제 값이 Positive(True)인 비율
- 재현율
- 실제 값이 Positive(True)인 것 중 Positive(True)로 예측 분류한 비율
- F1-score
- 정밀도와 재현도의 조화평균
- ROC(Receiver Operating Characteristics) & AUC(Area Under Curve)
- ROC는 FPR(False Positive Rate)이 변할 때 TPR(True Positive Rate, Sensitivity)이 어떻게 변하는지 보여주는 곡선
- AUC는 ROC 곡선 밑의 면적
- 정확도
- 군집분석 모델
- 외부평가
- 얼마나 유사하게 군집화되었는지 확인
- 자카드지수(집합 간 유사도 측정)
- 내부평가
- 적절한 군집(클러스터링) 개수 결정
- Dunn Index(군집 간 거리 멀수록 군집 내부 분산값 작을수록 좋은 군집화 결과 반영)
- 팔꿈치 기법(Elbow Method)
- 팔꿈치 모습을 나타내는 곳 값을 적절한 군집(클러스터링 개수) K값으로 지정
- 실루엣 기법(Silhouette Method)
- 다른 군집과의 거리는 떨어져 있고 동일 군집끼리의 데이터는 서로 가깝게 잘 뭉쳐 있다는 의미
- -1~1의 값을 가지며 1에 가까울수록 최적화가 잘 되어 있음으로 해석
- 외부평가
- 연관분석 모델
- 지지도
- 전체 거래에서 품목 A와 B가 동시에 포함된 거래의 수
- 신뢰도
- 품목 A가 구매되었을 때 품목 B가 추가로 구매될 확률(조건부 확률)
- 향상도
- 품목 A를 구매할 때 B도 추가로 구매하는 지의 연관성을 파악하는 비율
- 지지도
- 회귀 모델
- 비즈니스 기여도 평가
- 빅데이터 분석 목적
- 의사결정을 위한 분석기획 발굴
- 분석 결과의 기여도 평가
- ROI(투자수익률): 투자한 자본에 대한 수익/손실 비율
- 업무 효율성 향상에 대한 비율
- 빅데이터 분석 목적
02. 분석 모델별 시각화
- 회귀 모델
- 변수들 간 관계 분석을 위해 Heat Map과 Scatter Plot을 활용함.
- 여러가지 변수들을 동시에 비교, 전체에서 식별이 되는 부분에 대한 수치, 정도를 표현하는 비교 시각화 기법으로 표현함.
- 분류 모델
- SVM
- 산점도와 구분선을 통한 비교시각화 기법
- 활용 범위와 영역을 구분함.
- KNN
- 비교시각화의 평행좌표계로써 변수들과의 연관성 및 그룹데이터의 경향성 파악
- 의사결정나무
- 관계시각화 기법의 Tree Diagram으로 시각화함.
- SVM
- 딥러닝모델
- Node-link Diagrams for Network Architectures(네트워크 구조를 위한 노드-링크 다이어그램)
- 뉴런과 연결 가중치 표현하는 Node로 시각화
- Dimensional Reduction & Scatter Plots(차원축소, 산점도)
- t-SNE 또는 PCA 이용 → 차원을 축소해 데이터를 2차원으로 표현
- Line Charts for Temporal Metrics(측정을 위한 선도표)
- 진행상황에 따른 결과를 선도표로 나타냄.
- Instance-based Analysis & Exploration(객체 기반 분석 및 탐색)
- 객체 그룹을 분석하고 분류 정확도 확인
- Node-link Diagrams for Network Architectures(네트워크 구조를 위한 노드-링크 다이어그램)
- 군집분석 모델
- 다수의 객체를 군집으로 나누는 군집분석 → 그룹 크러스터별 단위로 산점도로 시각화
- 연관분석 모델
- 각 연관규칙별로 연관성 있는 항목끼리 묶여서 관계시각화 기법인 네트워크 그래프를 활용해 시각화
'빅데이터분석기사' 카테고리의 다른 글
| [필기] 분석모형 개선 (0) | 2026.03.21 |
|---|---|
| [필기] 분석모형 평가 (0) | 2026.03.21 |
| [필기] 고급 분석기법 (0) | 2026.03.20 |
| [필기] 분석기법 (1) | 2026.03.20 |
| [필기] 분석 환경 구축 (0) | 2026.03.17 |
