컴퓨터/금융 데이터 분석 (1) 썸네일형 리스트형 지도 학습: 분류 분류 기반 알고리즘은 사기 감지, 기본 예측, 신용 점수, 자산 가격 움직임 방향성 예측, 매매 권장 사항등 정성적 반응을 예측하는 금융 영역에서 사용되었다. 이러한 문제의 경우 범주 클래스 레이블을 예측하는 것이기 때문에 분류 기반 머신러닝을 사용하는 것이 적합하다. 사기 감지(불균형한 데이터셋) 일반적으로 금융 부분에서 사기의 경우 당하는 사람이 매우 적기 때문에 사기 감지의 경우 불균형 데이터셋을 다루는 문제이다. 불균형 데이터셋을 처리하는 방법은 데이터를 다운/업 샘플링을 통해서 데이터간의 균형을 맞춰 예측을 향상시킬 수 있다. 업샘플링 업샘플링은 소수 클래스의 관측치를 증가시켜 데이터 간의 균형을 맞추는 방법이다. 업샘플링을 할 때는 단순히 기존 데이터를 복제하는 방법을 사용할 수 있다. 다만 .. 이전 1 다음