# 多元线性回归

与简单线性回归的区别为:存在多个自变量x

# 模型

当存在多个自变量时,可以表示为

y=β0+β1x1+β2x2+...+βpxp+εy = \beta_0 + \beta_1x_1+ \beta_2x_2 + ... + \beta_px_p + \varepsilon

其中:β0β1β2\beta_0\beta_1\beta_2等时参数,ε\varepsilon是误差。

多元回归方程是对两边取期望值

E(y)=β0+β1x1+β1x2+...+βpxpE(y) = \beta_{0} + \beta_{1}x_1+ \beta_{1}x_2+...+\beta_{p}x_p

估计多元回归方程可以表示为

y=b0+b1x1+b2x2+...+bpxpy = b_0+b_1x_1+b_2x_2+...+b_px_p

一个样本被用来计算β0β1β2...βp\beta_0\beta_1\beta_2...\beta_p的点估计b0b1b2...bpb_0b_1b_2...b_p

# 目标函数

目标函数仍然使得sumofsquaressum \: of \: squares最小。

min(yiy^i)2min\sum(y_i-\hat{y}_i)^2

例子:

运输车运输的时间与英里数、次数和车型都有关,此时可以根据三种变量(英里数、次数和车型)来建立线性模型来表征总运输时间。

英里数 次数 车型 时间
100 4 1 9.3
50 3 0 4.8
100 4 1 8.9
100 2 2 6.5