1.归纳法:        对标与参考        适配与裁剪2..术法道,深入源码体系
  1. 先分析该系统是数据存储还是计算系统。

    如果是数据存储系统,从数据分布和副本策略开始入手
    哈希:ElasticSearch
    范围:H
    数据量:HDFS
    一致性:Cassan
    副本读取
    副本更新
    副本切换
    如果是数据处理问题,从数据投递策略入手。
    离线
    实时
    微批
    at most once
    at least once
    exactly once

    2 .读对应系统架构图,对应着常用的架构模型,每个组件和已有的系统进行类比,想一下这个组件类似于hdfs的namenode等等,最后在脑海里梳理下数据流的整个流程。

    3.在了解了系统的大概,着重看下文档中fault tolerence章节,看系统如何容错,或者自己可以预先问些问题,比如如果一个节点挂了、一个任务挂了系统是如何处理这些异常的,带着问题看文档。

    4.文档详细读了一遍,就可以按照官方文档写些hello world的例子了,详细查看下系统配置项,随着工作的深入就可以看些系统的细节和关键源码了。

转自:https://blog.csdn.net/tg229dvt5i93mxaq5a6u/article/details/78266424

收藏 打印