使用sklearn工具可以方便地进行特征工程和模型训练工作,在《使用sklearn做单机特征工程》中,我们最后留下了一些疑问:特征处理类都有三个方法fit、transform和fit_transform,fit方法居然和模型训练方法fit同名(不光同名,参数列表都一样),这难道都是巧合?
一、使用sklearn数据挖掘
1.数据挖掘的步骤
数据挖掘通常包括数据采集,数据分析,特征工程,训练模型,模型评估等步骤。
显然,这不是巧合,这正是sklearn的设计风格。我们能够更加优雅地使用sklearn进行特征工程和模型训练工作。此时,不妨从一个基本的数据挖掘场景入手:

我们使用sklearn进行虚线框内的工作(sklearn也可以进行文本特征提取)。通过分析sklearn源码,我们可以看到除训练,预测和评估以外,处理其他工作的类都实现了3个方
继续阅读与本文标签相同的文章
-
【Python数据科学手册】专题:支持向量机
2026-05-21栏目: 教程
-
Python+OpenCV教程基础篇:图像混合
2026-05-21栏目: 教程
-
怎样用PCA技术简化数据,你造吗?
2026-05-21栏目: 教程
-
应用|如何用Python+OpenCV画动态时钟?
2026-05-21栏目: 教程
-
如何使用PyTorch实现面向NLP的深度学习?
2026-05-21栏目: 教程
