探索性数据分析是数据科学模型开发和数据集研究的重要组成部分之一。在拿到一个新数据集时首先就需要花费大量时间进行EDA来研究数据集中内在的信息。自动化的EDA Python包可以用几行Python代码执行EDA。
在本文中整理了10个可以自动执行EDA并生成有关数据的见解的Python包,看看他们都有什么功能,能在多大程度上帮我们自动化解决EDA的需求。
DTale Pandas-profiling sweetviz autoviz dataprep KLib dabl speedML datatile edaviz
1、D-Tale

importdtale
importpandasaspd
dtale.show(pd.read_csv("titanic.csv"))


#Install the below libaries before importing
importpandasaspd
frompandas_profilingimportProfileReport
#EDA using pandas-profiling
profile = ProfileReport(pd.read_csv('titanic.csv'), explorative=True)
#Saving results to a HTML file
profile.to_file("output.html")


importpandasaspd
importsweetvizassv
#EDA using Autoviz
sweet_report = sv.analyze(pd.read_csv("titanic.csv"))
#Saving results to HTML file
sweet_report.show_html('sweet_report.html')


importpandasaspd
fromautoviz.AutoViz_ClassimportAutoViz_Class
#EDA using Autoviz
autoviz = AutoViz_Class().AutoViz('train.csv')


fromdataprep.datasetsimportload_dataset
fromdataprep.edaimportcreate_report
df = load_dataset("titanic.csv")
create_report(df).show_browser()


importklib
importpandasaspd
df = pd.read_csv('DATASET.csv')
klib.missingval_plot(df)

klib.corr_plot(df_cleaned, annot=False)

klib.dist_plot(df_cleaned['Win_Prob'])

klib.cat_plot(df, figsize=(50,15))


7、Dabl

目标分布图 散点图 线性判别分析
importpandasaspd
importdabl
df = pd.read_csv("titanic.csv")
dabl.plot(df, target_col="Survived")

8、Speedml
fromspeedmlimportSpeedml
sml = Speedml('../input/train.csv','../input/test.csv',
target ='Survived', uid ='PassengerId')
sml.train.head()

sml.plot.correlate()

sml.plot.distribute()

sml.plot.ordinal('Parch')

sml.plot.ordinal('SibSp')

sml.plot.continuous('Age')

9、DataTile
importpandasaspd
fromdatatile.summary.dfimportData Summary
df = pd.read_csv('titanic.csv')
dfs = Data Summary(df)
dfs.summary()

10、edaviz

继续阅读与本文标签相同的文章
上一篇 :
几个被淘汰的Python库,请不要再用!
下一篇 :
9条SEO黄金法则,助你提升排名
-
Windows10应用商店分类、布局改变:更方便查看打折商品
2026-05-15栏目: 教程
-
超实用技巧:液压泵流量自己调,挖掘机动作瞬间变快!
2026-05-15栏目: 教程
-
VLOOKUP函数常用套路大全
2026-05-15栏目: 教程
-
微信群聊上线表格接龙功能 v7.0.8版本及以上用户可使用
2026-05-15栏目: 教程
-
Facebook跌出全球品牌10强榜单,隐私和安全问题拖累
2026-05-15栏目: 教程
