平台现状
下面是目前饿了么平台现状架构图:

来源于多个数据源的数据写到kafka里,计算引擎主要是Storm,Spark和F ,计算引擎出来的结果数据再落地到各种存储上。
目前Storm任务大概有100多个,Spark任务有50个左右,F 暂时还比较少。
目前我们集群规模每天数据量有60TB,计算次数有1000000000,节点有400个。这里要提一下,Spark和F 都是on yarn的,其中F onyarn主要是用作任务间jobmanager隔离, Storm是standalone模式。
应用场景
1.一致性语义
在讲述我们应用场景之前,先强调实时计算一个重要概念, 一致性语义:
1) at-most-once:即fire and forget,我们通常写一个java的应用,不去考虑源头的offset管理,也不去考虑
继续阅读与本文标签相同的文章
下一篇 :
干货 | 6 种激活函数核心知识点,请务必掌握!
-
Ubuntu 与CentOS 忘记root密码!!!
2026-05-25栏目: 教程
-
hadoop2.5.2 启动成功后,用jps查看节点:发现少了DataNode
2026-05-25栏目: 教程
-
Hadoop 集群启动后,从节点的NodeManager没有启动解决
2026-05-25栏目: 教程
-
Cent OS /usr/libexec/gconf-sanity-check-2退出状态256的解决
2026-05-25栏目: 教程
-
linux 基本命令01
2026-05-25栏目: 教程
