지도학습, 비지도학습, 강화학습

2022. 1. 7. 01:19공부한 내용/머신러닝 이론

1. 지도학습(Supervised Learning)

1) Regression Models(회귀 모델)

-continuous value 예측

 

2) Classification Models(분류 모델)

-categorical value 예측 (분류)

 

 

2. 비지도학습(Unsupervised Learning)

1) Clustering(클러스터링)

-데이터 특성들에 따라 어떤 데이터들이 유사한 데이터로써 이해될 수 있는지 군집화

 

2) 이상치 감지(Outer Detection)

-주어진 데이터에서 이상치 찾기

 

3) Dimensionality Reduction(차원 축소)

-고차원 데이터를 의미있는 저차원 공간으로 축소

 

4) Density Estimation

-주어진 표본 데이터에 대해, 해당 데이터의 모분포를 추론하는 문제

 

 

3. 강화학습(Reinforcement Learning)

1) 강화학습 정의

-주어진 환경 하에서, 매 상태마다, 최적의 액션을 선택하게 끔 즉 리워드를 최대화하는 방향으로 선택하게 끔 학습하는 것

-가장 최적의 액션을 찾는 데 있어 가이드라인으로써 리워드 함수가 주어짐

-리워드(피드백)은 매 상태마다 환경과의 교류를 통해 결정되며, 매 상태마다 취한 액션은 추후 리워드에 영향을 줌

∴매 상태마다 주어진 에이전트가 상태와 액션을 인풋으로 주었을 때, 환경과의 교류를 통해 환경은 그 다음 상태와 리워드를 함께 반환. 이와 같은 정보를 바탕으로 추측하여, 다음 상태에서 더 나은 액션을 취하는 방향으로 학습함

 

2) 강화학습 문제점

-환경이 어떤 결과값을 반환하는지를 알면 매번 최적의 액션을 선택할 수 있으나, 환경은 불확실함

따라서 이 부분은 많은 상태를 통해 학습함으로써 주어진 환경이 어떻게 동작하는지를 이해해야 함