多年来,数据科学领域的许多趋势已经发生了改变。Kaggle,作为全球最大、最受欢迎的数据科学社区,记录着这些变化的演进状态。本文将使用 Kaggle Data 逐一分析,看看这些年来,我们的数据科学究竟发生了什么变化?

线性回归与逻辑回归

线性回归与逻辑回归是机器学习中比较基础又很常用的内容,其中前者可以进行连续值预测,后者能被用于解决分类问题。所以我们先从它们开始,根据 Kaggle 论坛的帖子数对比这两种算法的热度趋势。

598e2320157df36b25a7aa4614d7d2f5b8debce3

蓝:线性回归;橙:逻辑回归

如上图所示,橙线大多数时间都在蓝线之上,用户这些年来似乎一直都更喜欢聊 logistic 回归。而宏观来看,两种算法的变化趋势几乎吻合,峰值重合度较高,虽然起伏明显,但这 8 年来,它们总体是呈上升趋势的。

那么 logistic 回归受欢迎的原因是什么?一个迹象表明,Kaggle

收藏 打印