10장: 선형 회귀

1. 선형 회귀는 주로 독립 변수와 종속 변수 간에 선형적인 관계가 성립할 때 많이 사용된다. 다음 중에서 선형 회귀로 예측하기 어려운 문제는 어떤 문제인가?

(a) 온도와 출생률

(b) 공부 시간과 성적

(c) 체중과 달리기 기록

정답: (a) 온도와 출생률

해설:

온도–출생률은 계절성, 사회적 요인 등 비선형적·주기적 패턴이 강해 단일 직선으로 설명하기 어렵다.

반면 공부시간–성적, 체중–달리기 기록은 대체로 선형 경향을 보이는 관계라 단순 선형 회귀를 적용할 수 있다.


2. 다음의 두 데이터 중 MSE(평균 제곱 오차)가 더 높은 것은 무엇인가?

(문제 그림 제공)

정답: 오른쪽 데이터셋

해설:

오른쪽 그래프는 데이터 점들이 직선에서 더 멀리 분포해 있어 잔차가 크며, 따라서 MSE 값도 더 높다.


3. 대량의 데이터 세트에서 경사하강법을 수행할 때 배치 크기는 어느 정도로 해야 하는가?

정답: 수십~수백 개 규모의 미니배치(mini-batch)