第二篇,Google MapReduce架构启示(上)。
很多时候,定义清楚问题比解决问题更难。
什么是MapReduce?
它不是一个产品,而是一种解决问题的思路,它有多个工程实现,Google在论文中也给出了它自己的工程架构实现。
MapReduce这个编程模型解决什么问题?
能够用分治法解决的问题,例如:
- 网页抓取
- 日志处理
- 索引倒排
- 查询请求汇总
- …
画外音:能够发现,现实中有许多基于分治的应用需求。
为什么是Google,发明了这个模型?
Google网页抓取,分析,倒排的多个应用场景,当时的技术体系,解决不了Google大数据量高并发量的需求,Google被迫进行技术创新,思考出了这个模型。
画外音:谁痛谁想办法。
为什么MapReduce对“能够用分治法解决的问题”特别有效?
分治法,是将一个大规模的问题,分解成多个小规模的问题(分),多个小规模问
继续阅读与本文标签相同的文章
下一篇 :
“反向代理层”绝不能替代“DNS轮询”!
-
消息顺序性为何这么难?
2026-05-21栏目: 教程
-
rm -rf 了咋办,跑路吗?
2026-05-21栏目: 教程
-
谁说php不能搞长连接?
2026-05-21栏目: 教程
-
讲透Netty底层通讯原理
2026-05-21栏目: 教程
-
Google BigTable到底解决什么问题?
2026-05-21栏目: 教程
