1.Supervised/Unsupervised learning
Supervised learning : labeled examples를 가지고 기계가 학습하도록 하는방식
ex - 개 사진들과 고양이 사진들을 준 뒤 이를 통해 학습하여 개와 고양이를 구별 할 수 있게 만드는 방식
—> ML의 일반적인 방식
Unsupervised learning : label 되지 않은 examples를 주고 기계가 스스로 유사한 것을 판단하여 grouping할 수 있도록 하는 방식
ex - Google news grouping, 비슷한 단어를 모으는 word clustering
2.Training data set
X값에 연관된 Y값(label 값)쌍이 여러개 존재하는 데이터셋.
이를 통하여 기계가 Y가 없는 X를 받았을 때 Y를 추측할 수 있게 해준다.
3.Supervised learning의 종류
regression : 들인 시간에 기반하여 시험점수 예측하기
binary classification : 들인 시간에 기반하여 합/불 여부 예측하기
multi-label classifciation : 들인 시간에 기반하여 성적대 예측하기 (A,B,C,D, F)
4.Regression
Regression toward the mean : 전체의 평균으로 되돌아간다 - 프랜시스 골턴
각 데이터들이 다르더라도, 굉장히 큰 데이터셋이 모일 경우, 전체적으로 봤을때 평균으로 되돌아가려는 속성이 있다.
Linear Regression
데이터들의 점을 대변하는 하나의 직선의 방정식(기울기와 y절편)을 찾는것.
H(x) = Wx + b
예측값 Hypothesis(x) 와 실제값 y의 차이가 오차이다.
각 데이터마다 오차를 계산해 제곱의 총합이 가장 작을 때 cost가 최소가 된다.
비용함수 cost(W,b)는 오차 제곱의 평균으로 정의된다.
따라서 cost(W,b)를 minimize하는 W와 b를 찾는것이 M/D learning의 목적이다.
'Always Awake > 모두를 위한 딥러닝 시즌2 정리 (20.03.15~)' 카테고리의 다른 글
모두를 위한 딥러닝 시즌 2 / 3강 정리 (0) | 2020.04.06 |
---|---|
모두를 위한 딥러닝 시즌2 / Lab 2강 정리 (0) | 2020.03.24 |
댓글