热点

从创意到市场：创业项目精准评估与实战指南

Unix系统数据科学环境优化配置指南

绿色环保：可持续发展创业之路与实践策略

第四次工业革命下智能制造创业模式崛起与发展

用户至上：创业与设计思维的金钥匙与实践路径

MS SQL在Windows与Linux系统安装全步骤指南

云端服务器系统架构深度解析与解读

云端服务器系统架构：全面技术解析

MySQL高可用架构设计与优化策略探究

Linux服务器环境搭建基础指南

16 8 月 2025, 周六

百科

遇事不决，XGBoost，梯度提高比深度学习更容易赢得Kaggle竞赛

由 dawei 10 月 27, 2021 没有评论 #XGBoost #不决 #学习 #提高 #更容易 #梯度 #深度 #遇事

在Kaggle上参加机器学习比赛，用什么算法最容易拿奖金？

你可能会说：当然是深度学习。

还真不是，据统计获胜最多的是像XGBoost这种梯度提升算法。

这就奇了怪了，深度学习在图像、语言等领域大放异彩，怎么在机器学习比赛里还不如老前辈了。

一位Reddit网友把这个问题发在机器学习板块(r/MachineLearning)，并给出了一个直觉上的结论：

提升算法在比赛中提供的表格类数据中表现最好，而深度学习适合非常大的非表格数据集(例如张量、图片、音频、文本)。

但这背后的原理能不能用数学原理来解释？

更进一步，能不能仅通过数据集的类型和规模来判断哪种算法更适用于手头的任务。

这能节省很多时间啊，举个极端点的例子，如果尝试用AlphaGo做Logistic回归，你就走远了。

问题吸引了很多人参与讨论，有人回复到：

这是一个十分活跃的研究领域，完全可以就这个主题做一篇博士论文了。

由 dawei

百科

站长百科：常用网站管理工具与资源速查手册

dawei 8 月 16, 2025

百科

网站安全性深度解析与高效防护策略

dawei 8 月 16, 2025

百科

站长百科：解锁网站品牌价值提升的策略

dawei 8 月 16, 2025

发表回复取消回复

点评

从创意到市场：创业项目精准评估与实战指南

Unix

Unix系统数据科学环境优化配置指南

模式

绿色环保：可持续发展创业之路与实践策略

模式

第四次工业革命下智能制造创业模式崛起与发展