1.5 小结
使用Hadoop和Spark的大数据分析大致分为两大类:数据分析和数据科学。数据分析侧重于过去和现在的统计,而数据科学侧重于未来的统计。数据科学项目本质上是迭代的,而数据分析项目则不是迭代的。
Apache Hadoop为你提供了分布式存储和资源管理,Spark为你提供了大数据分析的内存级性能。在大数据分析中,需要根据用例的类型及其可行性来使用各种工具和技术。
下一章将帮助你开始学习Hadoop和Spark。
继续阅读与本文标签相同的文章
下一篇 :
《计算机视觉:模型、学习和推理》一第1章 绪 论
-
学宏程序编程,这些知识必不可少!
2026-05-14栏目: 教程
-
华为准备卖出“落后”的5G,多家美企极力竞争!任正非格局太大!
2026-05-14栏目: 教程
-
百度:飞桨深度学习平台已累计服务150多万开发者
2026-05-14栏目: 教程
-
滴滴公布安全功能数据:近2亿用户添加紧急联系人
2026-05-14栏目: 教程
-
滴滴自动驾驶或将于年底落地上海
2026-05-14栏目: 教程
