从线性回归谈机器学习的几个重要问题

线性回归问题描述

对于这个问题,举个实际例子更好理解:你想购买一套房子,现知道这套房子的面积和一些数据,这些数据包括一些房子的面积大小和售价,假如房子的面积 $x$ 和售价 $y$ 存在线性关系 $y = ax + b$,那么根据历史数据求出这个线性关系中的 $a$ 和 $b$ 就是一个最简单一维的线性回归问题。求出这个 $y = ax + b$后,代入当前房子的面积即可估算出当前房子的售价。

当然,影响房子价格的因素还有很多,如:房子的地段,盖了多少年等等。如果这些因素有 $n$ 个,并假设这 $n$ 个因素与房子价格之间是线性关系,那么这个问题即是一个多维线性回归问题,其线性关系表示为:

x^{\prime} = \frac{x - min}{max - min} \tag{4}

x^{\prime} = \frac{x - \mu}{\sigma} \tag{5}

$$