목록전체 글 (133)
AYSTORY
Chapter 02. 분석결과 해석 및 활용모델별 해석기여도 평가모델별 시각화01. 분석 모델별 결과 해석분석모형 해석회귀 모델평가를 위한 지표는 일반적으로 잔차, 결정계수 등이 있음.잔차: 회귀모형으로 실제 값과 예측 값의 차이, 패턴이나 추세 X결정계수: 추정된 회귀식이 변동을 얼마나 잘 설명했는가에 대한 지표, 1에 가까울수록 good[잔차] MAE예측값과 실제값 차이를 절대값으로 변환 → 더한 뒤의 평균[잔차] MSE예측값과 실제값 차이를 제곱 → 더한 뒤의 평균[잔차] MAPEMAE를 퍼센트로 변환[잔차] RMSEMSE에 Root를 씌운 값[잔차] RMSLERMSE에 로그를 적용한 값[결정계수] R²총제곱합(SST)에 대한 회귀제곱합(SSR)[결정계수] 수정된 R² 표본크기(n)와 독립변수 개수..
과적합 방지매개변수 최적화초매개변수성능평가지표01. 과대적합 방지훈련 시에는 높은 성능을 보이지만, 테스트 데이터에 대해서는 낮은 성능을 보여주는 과대적합을 방지하고, 일반화된 모델을 생성하기 위해 다음과 같은 방향을 제시함. 모델의 낮은 복잡도훈련데이터를 더 많이 획득할 수 없다면 정규화, 드롭아웃 등을 활용해 적절한 복잡도를 가진 모델을 자동으로 탐색함.학습을 하면서 지속적으로 바뀌는 가중치 매개변수가 아닌, 상수값인 하이퍼파라미터(학습률, 각 층의 뉴런수 등)는 과대적합의 위험을 줄이기 위해 제약을 가하는 규제의 양을 결정하는 인수로, 큰 값을 지정할수록 복잡도가 낮은 모델을 얻게 됨.드롭아웃(Dropout)신경망 모델에서 은닉층의 뉴런을 임의로 삭제하면서 학습하는 방법훈련 시에는 삭제할 뉴런을 선..
Part 04. 빅데이터 결과 해석Ch 01. 분석모형 평가 및 개선오차행렬평가 지표검증과 검정정확도정밀도재현율F1-scoreROCK-fold01. 평가 지표지도학습 - 분류모델 평가 지표분석모형의 답과 실제 답과의 관계 오차행렬을 통해 모델 평가TP: 실제 True → True 라고 예측FP: 실제 False → True라고 예측FN: 실제 True → False라고 예측TN: 실제 False → False라고 예측오차행렬(Confusion Matrix)훈련을 통한 예측 성능을 측정하기 위해 예측 값과 실제 값을 비교하기 위한 표정확도(Accuracy)Accuracy = (TP + TN) / (TP + FP + TN + FN)정밀도(Precision): Positive로 예측한 대상 중 실제로 Posi..
범주형 자료분석다변량 분석시계열 분석베이즈 기법딥러닝 분석비정형 데이터 분석앙상블 분석01. 범주형 자료분석범주형 자료분석의 통계적 정의범주형 자료분석은 변수들이 이산형 변수일 때 주로 사용하는 분석예; 두 제품 간 선호도가 성별에 따라 연관이 있는지 여부를 판단하고자 하는 경우, 각 집단 간의 비율차이가 있는지 확인하기 위한 경우 등에 주로 사용자료의 분석자료의 형태에 따른 범주형 자료 분석 방법(독립변수) - (종속변수) - (분석방법) - (예제) 범주형 - 범주형 - 빈도분석, 카이제곱 검정, 로그선형모형 - 지역별 선호정당연속형 - 범주형 - 로지스틱 회귀분석 - 소득에 따른 결혼의 선호도범주형 - 연속형 - T검정(2그룹), 분반분석(2그룹 이상) - 지역별 가계수입의 차이연속형 - 연속형 -..
Chapter 02. 분석기법 적용회귀분석로지스틱 회귀분석의사결정나무인공신경망딥러닝SVM연관성 분석 군집 분석01. 분석기법 개요학습 유형에 따른 데이터 분석 모델학습 유형에 따라 데이터 분석 모델은 지도 / 비지도 / 준지도 / 강화학습으로 분류지도학습입력값이 주어질 때 정답이 무엇인지 알려주면서 컴퓨터 학습대표적으로 분류(Classification)와 회귀(Regression)로 구분분류 → 이진분류 / 다중분류의사결정트리(분류), 랜덤 포레스트, 인공신경망(지도학습), 서포트벡터머신(SVM), 로지스틱 회귀분석회귀의사결정트리(회귀), 선형회귀분석, 다중회귀분석예; 손글씨로 작성된 숫자 이미지 데이터 분류비지도학습정답이 없는 데이터를 컴퓨터 스스로 학습하여 숨겨진 의미, 패턴을 찾아내고 구조화예; U..
생산능력(Capacity)이란 무엇인가?Transformation Process가 output을 생산할 수 있는 (또는 input을 처리할 수 있는) 최대 용량Input → Transformation Process → Output단위 시간동안 최대 몇 개의 Output을 만들어낼 수 있을까?생산능력(Capacity)의 예 Output 관점에서의 CapacityInputs 관점에서의 Capacity항공사일일 수송 승객 일일 항공권 예약 전화 처리 건수병원일일 수술 건수일일 입원 환자 수속 건수대학교연간 졸업생 수연간 입학생 수자동차 공장일일 자동차 생산 대수일일 자동차 부품 인수 건수용어 정의Design capacity (설계 생산능력)Maximum output rate or service capacity..
