머신러닝(기계학습)은 ?
컴퓨터를 인간처럼 학습 시킴으로써 인간의 도움없이 컴퓨터가 스스로 새로운 규칙을 생성할 수 있지 않을까 하는 발상으로 부터 시작
인공 지능의 한 분야로, 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야
Y = f(X)
Y = 종속변수, 반응변수
f = 모형(머신러닝알고리즘)
X = 독립변수, 입력변수
주어진 데이터속에서 데이터의 특징을 찾아내는 함수 f 를 만드는것
예)
X = 고객들의 개인정보 및 금융 관련 정보, Y = 대출 연체 여부 ->대출 연체자 예측 탐지 모델, 대출 연체 관련
[동작 방식]
일정량 이상 샘플 데이터를 입력
입력 받은 데이터를 분석하여 일정한 패턴과 규칙을 추출
찾아낸 패턴과 규칙을 가지고 의사결정 및 예측 등을 수행
[종류]
지도학습( supervised learning)
입력변수(X)와 출력변수 (Y)의 관계에 대하여 모델링 하는 것 (Y에 대하여 예측 또는 분류하는 문제)
회귀(regression)모형 : 입력변수 x에 대해서 연속형 출력변수 y를 예측
분류(classification)모형 : 입력변수 x에 대해서 이산형 출력변수 y(class)를 예측
예) 주식 가격 예측, 공정 불량 여부 탐지
비지도 학습 (unsupervised learning)
출력변수(Y)가 존재하지 않고, 입력 변수 (X)간의 관계에 대해 모델링 하는 것
군집 분석 : 유사한 데이터 끼리 그룹화
PCA : 독립변수들의 차원을 축소화
예) 고객 segmentation
강화학습 (reinforcement learning)
수 많은 시뮬레이션을 통해 현재의 선택이 먼 미래에 최대의 보상이 되도록 학습
Agent가 action을 취하고 환경에서 보상을 받고 이 보상이 최대가 되도록 최적의 action을 취하는 방법을 학습
예) 알파고