当前位置:蜗牛素材网>综合资讯>图文>正文

最简单的线性回归:用人话讲明白线性回归LinearRegression

人气:247 ℃/2023-12-22 03:31:20

特别说明:文中含有大量公式,只能转化为图片后才能正常显示,造成阅读不畅请谅解。

本文由【化简可得】原创,转载请联系本人,谢谢!

目录

1. 什么是回归

2. 一元线性回归

3. 损失函数

4. 最小二乘估计

5. 小结

1. 什么是回归

当我们学习一门新课程、接触一个新专业时,总会对该领域的专有名词感到困惑,甚至看完解释仍难以理解其含义。在我们一起学习machine learning的过程中,我会尽量对相关名词用"人话"做一遍解释,以减少学习的"痛苦感"。

譬如今天要学的线性"回归",这个回归(regression)和我们平时说的"回归祖国"的回归(return)是两个含义完全不同的词,它有"倒推"的含义在里面。我们学习的时候一定要抛开现有的认知,这样才能对新知识有更高的接受度。

那么,这个回归究竟是什么意思呢?其实回归算法是相对分类算法而言的,与我们想要预测的目标变量y的值类型有关。如果目标变量y是分类型变量,如预测用户的性别(男、女),预测月季花的颜色(红、白、黄……),预测是否患有肺癌(是、否),那我们就需要用分类算法去拟合训练数据并做出预测;如果y是连续型变量,如预测用户的收入(4千,2万,10万……),预测员工的通勤距离(500m,1km,2万里……),预测患肺癌的概率(1%,50%,99%……),我们则需要用回归模型。

聪明的你一定会发现,有时分类问题也可以转化为回归问题,例如刚刚举例的肺癌预测,我们可以用回归模型先预测出患肺癌的概率,然后再给定一个阈值,例如50%,概率值在50%以下的人划为没有肺癌,50%以上则认为患有肺癌。

这种分类型问题的回归算法预测,最常用的就是逻辑回归,后面我们会讲到。

2.一元线性回归

线性回归可以说是用法非常简单、用处非常广泛、含义也非常容易理解的一类算法,作为机器学习的入门算法非常合适。我们上中学的时候,都学过二元一次方程,我们将y作为因变量,x作为自变量,得到方程:

当我们只用一个x来预测y,就是一元线性回归,也就是在找一个直线来拟合数据。比如,我有一组数据画出来的散点图,横坐标代表广告投入金额,纵坐标代表销售量,线性回归就是要找一条直线,并且让这条直线尽可能地拟合图中的数据点。

这里我们得到的拟合方程是y = 0.0512x 7.1884,此时当我们获得一个新的广告投入金额后,我们就可以用这个方程预测出大概的销售量。

3.损失函数

那既然是用直线拟合散点,为什么最终得到的直线是y = 0.0512x 7.1884,而不是下图中的y = 0.0624x 5呢?这两条线看起来都可以拟合这些数据啊?毕竟数据不是真的落在一条直线上,而是分布在直线周围,所以我们要找到一个评判标准,用于评价哪条直线才是最"合适"的。

我们先从残差说起。残差说白了就是真实值和预测值间的差值(也可以理解为差距、距离),用公式表示是:

用公式表示就是:

这个公式是残差平方和,也叫均方误差(MSE),还叫欧氏距离(用于计算点间的距离,记住这个名称,以后我们会经常提到),在机器学习中它是回归问题中最常用的损失函数。一个公式好多个名称,刚接触都会觉得晕,但慢慢熟悉之后就好了。

所以,现在我们知道了损失函数是衡量回归模型误差的函数,也就是我们要的"直线"的评价标准。这个函数的值越小,说明直线越能拟合我们的数据。

4.最小二乘估计

当给出两条确定的线,如y = 0.0512x 7.1884,y = 0.0624x 5时,我们知道怎么评价这两个中哪一个更好,即用损失函数评价。那么我们试试倒推一下?

------------------------我是头疼的分割线-----------------------------

以下是我们最头疼的数据公式推导,我尽量对每个公式作解释说明。

我们再来看一下残差平方和的公式:

这类函数在数学中叫做凸函数,意思就是处处连续可导且有最小值。

5.小结

线性回归的定义,是利用最小二乘函数对一个或多个自变量之间关系进行建模的方法。现在我们看这个定义,是不是觉得不难理解了呢?

以上举的例子是一维的例子(x只有一个),如果有两个特征,就是二元线性回归,要拟合的就是二维空间中的一个平面。如果有多个特征,那就是多元线性回归

最后再提醒一点,做线性回归,不要忘了前提假设是y和x呈线性关系,如果两者不是线性关系,就要选用其他的模型啦。

搜索更多有关“最简单的线性回归:用人话讲明白线性回归LinearRegression”的信息 [百度搜索] [SoGou搜索] [头条搜索] [360搜索]
本网站部分内容、图文来自于网络,如有侵犯您的合法权益,请及时与我们联系,我们将第一时间安排核实及删除!
CopyRight © 2008-2024 蜗牛素材网 All Rights Reserved. 手机版