(SM) 머신러닝(Machine Learning) - 지도학습, 비지도학습, 강화학습

참고 1 패스트캠퍼스 온라인강의 머신러닝과 데이터분석 A-Z

참고 2 https://blog.naver.com/handuelly/221823696658

참고 3 https://wendys.tistory.com/169

머신 러닝(Machine Learning)은 데이터를 이용해서 컴퓨터를 학습 시키는 것으로,

구현하는 알고리즘(방법)은 3가지로 구분된다.

1 - 지도학습, 2 - 비지도학습, 3- 강화학습

1. 지도학습(supervised learning)

Y = F(X)에 대하여 입력 변수(X)와 출력 변수(Y)의 관계에 대하여 모델링하는 것

데이터(x, input)에 대한 명시적 정답인 레이블(y, output)이 주어진 상태에서 컴퓨터를 학습시키는 방법

예를 들어 3x5 = 15, 6x4 =24등을 학습시킨 후 9x3=?? 등의 문제를 해결하는 학습 방법이다.

회귀 또는 분류하는 문제에 많이 쓰임

1- 1 회귀(regression)

- 입력 변수 X에 대해서 연속형 출력 변수 Y를 예측

데이터들의 특징을 기준으로 연속된 값(그래프,class)을 예측하는 문제

ex) 트렌드, 패턴, 경향을 예측 -> 주식가격, 부동산 매매가격 예측

ex) 강남에 30평대 아파트면 집값이 어느 정도야? -> 강남에 30평대 아파트면 OO억 정도 입니다.

딥러닝의 주요 지도 학습 방법론은 CNN과 RNN이 있다.

1-2 분류(classification)

입력 변수 x에 대해서 이산형 출력 변수 Y(class)를 예측, 주어진 데이터를 정해진 카테고리에 따라 분류하는 문제

Binary Classification - 예, 아니오로 구분되는 분류

Multi-label Classification - 여러 개의 카테고리로 분류

ex) 개vs고양이 분류 or 손글씨 분류 or 스팸메일 예측 분류

ex) 최근 이미지 분류로 darknet YOLO가 많이 쓰임

2. 비지도 학습(unsupervised learning)

출력 변수(Y)가 존재하지 않고, 입력 변수(X)간의 관계에 대해 모델링 하는 것

데이터(x, input)에 대한 레이블(y, output)이 주어지지 않은 상태에서 컴퓨터를 학습시키는 방법

정답을 알려주지 않고, 데이터 자체만으로 학습

좌측 (군집 분석 - 유사한 데이터끼리 그룹화), 우측 (PCA - 독립변수들의 차원을 축소화)

데이터의 정답(레이블)이 주어지지 않았기 때문에 데이터로부터 패턴이나 특정 형태를 찾아내기 어려움.

하지만 데이터의 숨겨진 특징이나 구조를 결과물로 얻을 수 있다는 점에서, 데이터 전처리 방법으로 비지도 학습을 사용하기도 함.

즉, 비지도 학습은 예측의 목적이 아니라 데이터의 구성 또는 특징을 밝히는 목적으로 사용되는 Grouping 알고리즘

대표적인 알고리즘 - Clustering, K Means, Density Estimation 등

ex) 구글 뉴스의 기사들을 분석하여 비슷한 주제끼리 그룹화, 페이스북에서 특정 집단 그룹화, 천문학에서 은하의 탄생을 분석하기 위해 별들을 모으는 데 사용

3. 강화학습(reinforcement learning)

강화 학습(Reinforcement Learning)은 지도 학습, 비지도 학습과는 조금 다른 종류의 학습 알고리즘이다.

이는 행동 심리학에서 시작한 이론으로 데이터는 항상 분류할 수 있다는 보장이 없고, 데이터가 있다고 해도 정답이 따로 정해진 것이 아니고, 행동(action)에 대한 보상(reward)를 받으며 학습하는 것

즉, 수 많은 시뮬레이션을 통해, 현재의 선택으로 미래의 보상이 최대가 되도록 학습

"Agent가 주어진 환경(State)에 대해 어떤 행동(Action)을 취하고, 이로부터 어떤 보상(Reward)을 얻으면서 학습"을 진행한다. 또한, "Agent는 리워드를 최대화 하도록 학습"을 진행한다.

ex) 딥러닝 등장 이후 강화 학습에 신경망을 적용 -> 바둑, 자율주행차량 등에 복잡한 문제에 사용

	지도학습	비지도학습
데이터와 레이블(결과)의 유무	데이터 O, 레이블(결과) O	데이터 O, 레이블(결과) X
분류 방법	분류, 회귀	군집, PCA(차원 축소)
대표적인 알고리즘	kNN, Native Bayes, SVM, Decision Tree, Random Forests, Linear Regression,	K-평균, 계층 군집 분석, 기댓값 최대화, 주성분 분석, T-SNE, LLE, 커널 PCA

728x90

Machine Learning - Kaggle Titanic(3) (0)	2020.05.19
Machine Learning - Kaggle Titanic(2) (0)	2020.05.13
(SM) Machine Learning - Logistic Regression(로지스틱 회귀) (0)	2020.05.12
Machine Learning - Kaggle Titanic(1) (0)	2020.05.08
(SM) Machine Learning - Linear Regression(선형 회귀) (0)	2020.05.05