본문 바로가기
개발/파이썬, 머신 러닝

3.1 선형 회귀

by 카펀 2020. 10. 7.

*본 글은 "Do It! 정직하게 코딩하며 배우는 딥러닝 입문", 박해선 저, 이지스 퍼블리싱을 참고하여 작성하였습니다.

GitHub Link: 링크

 

선형 회귀 (linear regression)은 머신러닝 알고리즘 중 가장 간단하면서도 딥러닝의 기초가 됩니다.

선형 회귀의 주요 관심사는 y = ax + b와 같은 일차식이 있을 때, x값과 y값을 가지고 기울기 (a)와 절편 (b)값을 찾는 것입니다.

주어진 좌표들이 있고, 일차식 y가 초기값 a와 b를 가진다고 합시다. 이 때, 일차식 y가 주어진 좌표들을 모두 지나려면, a값과 b값을 몇 차레 조정해 줄 필요가 있을 것입니다.
이 때 만드는 일차식 y들을 '선형 회귀로 만든 모델' 이라고 하며, 그 중 맨 마지막에, 주어진 좌표들을 모두 지나게 되는 y를 '최적 선형 회귀 모델' 이라고 합니다.
최적 선형 회귀 모델을 이용하면, 새로운 x값이 주어졌을 때 이에 대응하는 y값을 찾을 수 있고, 그 반대 역시 가능합니다.

선형 회귀 과정

최적 선형 회귀 모델을 찾는 과정을 그래프로 나타내 보았습니다.

주어진 좌표가 각각 (-1,-2), (0,2), (1,6), (2,10), (3,14) 이며, 그래프 상에 점으로 나타내어져 있습니다.

 

맨 처음에 사용한 모델은 y = 2x 입니다. 보시다시피 기울기와 절편 둘 다 맞지 않는 것을 확인할 수 있습니다.

두 번째로 사용한 모델은 y = 4x 입니다. 기울기는 맞는 것 같지만 절편이 맞지 않습니다.

세 번째로 사용한 모델은 y = 4x + 2 입니다. 기울기와 절편이 둘 다 들어맞으며, 따라서 해당 모델은 최적 선형 회귀 모델입니다.

 

이후 실제로 사용할 자료를 가져오는 코드는 위의 GitHub 링크를 참고하여 주시기 바랍니다.

 

'개발 > 파이썬, 머신 러닝' 카테고리의 다른 글

3.2 경사 하강법  (0) 2020.10.08
MatPlotLib 라이브러리 소개  (0) 2020.10.05
Pandas 라이브러리 소개  (0) 2020.10.04
NumPy 라이브러리 소개  (0) 2020.10.03

댓글