데이터 입력

결과

회귀식
-
데이터를 입력하세요
기울기 a
-
절편 b
-
결정계수 R²
-
표본 수 n
-
x̄ / ȳ
-
x 분산 / y 분산
-

어떻게 계산하나요

단순 선형 회귀는 (x, y) 데이터 점들에 가장 잘 맞는 직선을 찾는 방법입니다. 잔차(yᵢ − ŷᵢ) 제곱의 합을 최소화하는 a, b 를 구합니다 — 최소자승법(OLS).

x̄ = Σxᵢ ÷ n, ȳ = Σyᵢ ÷ n
a = Σ(xᵢ − x̄)(yᵢ − ȳ) ÷ Σ(xᵢ − x̄)²
b = ȳ − a × x̄
R² = 1 − Σ(yᵢ − ŷᵢ)² ÷ Σ(yᵢ − ȳ)²

예: (1,2),(2,4),(3,6) → x̄=2, ȳ=4, a = ((1−2)(2−4)+(2−2)(4−4)+(3−2)(6−4)) ÷ ((1−2)²+0+(3−2)²) = 4÷2 = 2, b = 4 − 2×2 = 0 → y = 2x. 모든 점이 직선 위에 있어 R² = 1.

결정계수 R² 해석

R² 범위해석
0.9 ~ 1.0매우 강한 선형물리 법칙 검증
0.7 ~ 0.9강한 선형경제 지표 회귀
0.3 ~ 0.7중간사회과학 연구
0.0 ~ 0.3약함잡음 많은 관측

가정 — OLS 는 오차의 정규성·독립성·등분산성을 가정합니다. 잔차에 패턴이 보이면 모델이 부적합하다는 신호.

한계와 주의

회귀선은 강력하지만 가정 위반과 외삽 에 취약합니다.

  • 상관 ≠ 인과 — 회귀가 잘 맞아도 인과관계 의미하지 않음
  • 아웃라이어 1~2개로 a·b 가 크게 흔들림 — 잔차 시각화·로버스트 회귀 검토
  • 데이터 범위 밖 외삽(extrapolation)은 위험 — 학습 범위 안에서만 신뢰
  • n=1 이거나 모든 x 가 같은 값이면 분모 0 으로 회귀 불가
  • 비선형 추세는 변수 변환(로그·제곱) 후 적용 또는 다항 회귀 활용