中国HBase技术社区第二届MeetUp -笔记摘要

kylin：通过预计算（已知要查询的维度），通过spark，mr遍历计算这些指标，然后将结果存储到h 中，最后直接查询h 表即可。

h rowkey定义不宜过长，否则存储压力会很大。这里通过使用字典编码。

h 优化经验：

火焰图分析：从下往上分析，峰值的分布（满载还是正常）

h 内存消耗主因（memstore（写文件）， blockcache（读取））

两种不同的gc算法：
h gc 参数配置：

使用G1算法，效果显著。

h WAL 和核心业务配置为ALL_SSD（所有副本使用SSD）

指定队列

分别使用HDD， ONE_SSD, ALL_SSD ，和使用读写分离。性能的变化。。

设置zone_reclaim。。可以避免本地内存不够导致OOM。（numa的问题）

h （高一致性，一行数据一般都是通过一个regionserver来处理，通过单机来保证一致性，所以发生故障，恢复可能会较慢）和
Cassandra（HA要求高，一致性较低（一半副本写完既可以，所以读取时可能读取不到最新数据，然后通过异步刷新，知道最终写完副本），
redis（集群方式不完善）的区别

why？region crash 为true，就无法恢复上不了线。

不做compaction（合并），flush。

怎么把磁盘打满（利用起来）？

限流不要太狠，需因地制宜

避免小文件生成，和compaction合并。是否配置自动（1h)flush，和多少changes（3千万）flush。

到底写多少hlog根据盘数目：（怎么把磁盘用起来）

远程读和hybrid 都需要注意网络问题

使用jsata去查看handler wait在哪里？

继续阅读与本文标签相同的文章

None

Structed Streaming 小案例

分布式系统学习共性总结：

收藏打印

中国HBase技术社区第二届MeetUp -笔记摘要

浏览：970 2026-05-25

继续阅读与本文标签相同的文章

Structed Streaming 小案例

分布式系统学习共性总结：

特别推荐 2026年05月26日星期二

精彩发现

热门标签

中国HBase技术社区第二届MeetUp -笔记摘要

浏览：970 2026-05-25

继续阅读与本文标签相同的文章

2026-05-26栏目： 教程

2026-05-26栏目： 教程

2026-05-26栏目： 教程

2026-05-26栏目： 教程

2026-05-26栏目： 教程

2026-04-23栏目： 教程

2026-04-23栏目： 教程

2026-04-23栏目： 教程

2026-04-23栏目： 教程

2026-04-24栏目： 教程

特别推荐 2026年05月26日 星期二

精彩发现

热门标签

相关文章

1956人阅读

672人阅读

462人阅读

2026-05-26栏目：教程

2026-05-26栏目：教程

2026-05-26栏目：教程

2026-05-26栏目：教程

2026-05-26栏目：教程

2026-04-23栏目：教程

2026-04-23栏目：教程

2026-04-23栏目：教程

2026-04-23栏目：教程

2026-04-24栏目：教程

特别推荐 2026年05月26日星期二