본문 바로가기
Always Awake/모두를 위한 딥러닝 시즌2 정리 (20.03.15~)

모두를 위한 딥러닝 시즌2 / 1~2강 정리

by 욕심많은알파카 2020. 3. 16.

1.Supervised/Unsupervised learning

Supervised learning : labeled examples를 가지고 기계가 학습하도록 하는방식

ex - 개 사진들과 고양이 사진들을 준 뒤 이를 통해 학습하여 개와 고양이를 구별 할 수 있게 만드는 방식

—> ML의 일반적인 방식

 

Unsupervised learning : label 되지 않은 examples를 주고 기계가 스스로 유사한 것을 판단하여 grouping할 수 있도록 하는 방식

ex - Google news grouping, 비슷한 단어를 모으는 word clustering

 

 

2.Training data set

X값에 연관된 Y값(label 값)쌍이 여러개 존재하는 데이터셋.

이를 통하여 기계가 Y가 없는 X를 받았을 때 Y를 추측할 수 있게 해준다.

 

 

 

3.Supervised learning의 종류

regression : 들인 시간에 기반하여 시험점수 예측하기

binary classification : 들인 시간에 기반하여 합/불 여부 예측하기

multi-label classifciation : 들인 시간에 기반하여 성적대 예측하기 (A,B,C,D, F)

 

4.Regression

Regression toward the mean : 전체의 평균으로 되돌아간다 - 프랜시스 골턴

각 데이터들이 다르더라도, 굉장히 큰 데이터셋이 모일 경우, 전체적으로 봤을때 평균으로 되돌아가려는 속성이 있다.

 

Linear Regression

데이터들의 점을 대변하는 하나의 직선의 방정식(기울기와 y절편)을 찾는것.

H(x) =  Wx + b

예측값 Hypothesis(x) 와 실제값 y의 차이가 오차이다.

각 데이터마다 오차를 계산해 제곱의 총합이 가장 작을 때 cost가 최소가 된다.

비용함수 cost(W,b)는 오차 제곱의 평균으로 정의된다.

 

따라서 cost(W,b)를 minimize하는 W와 b를 찾는것 M/D learning 목적이다.

댓글