哪个才是解决回归问题的最好算法?线性回归 神经网络或随机森林

现在,不管想解决什么类型的机器学习(ML)问题,都会有各种不同的算法可以供你选择。尽管在一定程度上,一种算法并不能总是优于另外一种算法,但是可以将每种算法的一些特性作为快速选择最佳算法和调整超参数的准则。
 
本文,我们将展示几个著名的用于解决回归问题的机器学习算法,并根据它们的优缺点设定何时使用这一准则。尤其在为回归问题选择最佳机器学习算法上,本文将会为你提供一个重要的引导!
 
线性回归和多项式回归
线性回归
 
从简单的情况开始,单变量线性回归使用线性模型为单个输入自变量(特征变量)和输出因变量创建关系模型。更为一般的情况是多变量线性回归,它为多个独立的输入自变量(特征变量)与输出因变量之间创建关系模型,该模型始终为线性,这是因为输出变量是输入变量的线性组合。
 
第三种最常见的情况是多项式回归,该模型是特征变量的非线性组合,例如:指数变量,正弦和余弦等。然而,这需要了解数据是如何与输出相关的。我们可以使用随机梯度下降(SGD)对回归模型进行训练。
 
优点
 
可以快速建模,特别适用于所要建模的关系不是特别复杂并且数据量不大。
 
线性回归简单且易于理解,有利于商业决策。
 
缺点
 
对于非线性数据进行多项式回归设计可能比较困难,因为必须具有特征变量之间关系和数据结构的一些信息。
 
由于上述原因,当涉及到数据复杂度较高时,这些模型的性能不如其他模型。

dawei

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注