2022. 1. 7. 01:19ㆍ공부한 내용/머신러닝 이론
1. 지도학습(Supervised Learning)
1) Regression Models(회귀 모델)
-continuous value 예측
2) Classification Models(분류 모델)
-categorical value 예측 (분류)
2. 비지도학습(Unsupervised Learning)
1) Clustering(클러스터링)
-데이터 특성들에 따라 어떤 데이터들이 유사한 데이터로써 이해될 수 있는지 군집화
2) 이상치 감지(Outer Detection)
-주어진 데이터에서 이상치 찾기
3) Dimensionality Reduction(차원 축소)
-고차원 데이터를 의미있는 저차원 공간으로 축소
4) Density Estimation
-주어진 표본 데이터에 대해, 해당 데이터의 모분포를 추론하는 문제
3. 강화학습(Reinforcement Learning)
1) 강화학습 정의
-주어진 환경 하에서, 매 상태마다, 최적의 액션을 선택하게 끔 즉 리워드를 최대화하는 방향으로 선택하게 끔 학습하는 것
-가장 최적의 액션을 찾는 데 있어 가이드라인으로써 리워드 함수가 주어짐
-리워드(피드백)은 매 상태마다 환경과의 교류를 통해 결정되며, 매 상태마다 취한 액션은 추후 리워드에 영향을 줌
∴매 상태마다 주어진 에이전트가 상태와 액션을 인풋으로 주었을 때, 환경과의 교류를 통해 환경은 그 다음 상태와 리워드를 함께 반환. 이와 같은 정보를 바탕으로 추측하여, 다음 상태에서 더 나은 액션을 취하는 방향으로 학습함
2) 강화학습 문제점
-환경이 어떤 결과값을 반환하는지를 알면 매번 최적의 액션을 선택할 수 있으나, 환경은 불확실함
따라서 이 부분은 많은 상태를 통해 학습함으로써 주어진 환경이 어떻게 동작하는지를 이해해야 함
'공부한 내용 > 머신러닝 이론' 카테고리의 다른 글
Evaluation Metrics (0) | 2022.01.08 |
---|---|
과적합 문제 해결, Generalize our Models (0) | 2022.01.08 |
회귀 모델(Regression Models) (0) | 2022.01.07 |
경사하강법(Gradient Descent Method) (0) | 2022.01.07 |
머신러닝 Optimization Problem 해결법 2가지 (0) | 2022.01.07 |