Druid架构设计 Zookeeper


Druid使用Apache ZooKeeper来管理整个集群状态。

通过ZooKeeper来进行的操作有:

  1. Coordinator Leader选举
  2. Historical 段发布协议
  3. Coordinator 和 Historical 之间的段加载/删除
  4. Overlord Leader选举
  5. Overlord和MiddleManager任务管理

1 ZooKeeper—Coordinator Leader选举

我们使用Curator LeadershipLatch进行Leader选举:

${druid.zk.paths.coordinatorPath}/_COORDINATOR

2 ZooKeeper—Historical和Realtime之间的段发布

announcementsPathservedSegmentsPath这两个参数用于这个功能。

所有的Historical进程都将它们自身发布到announcementsPath,具体来说它们将在以下路径创建一个临时的ZNODE:

${druid.zk.paths.announcementsPath}/${druid.host}

这意味着Historical节点可用。它们也将随后创建一个ZNODE:

${druid.zk.paths.servedSegmentsPath}/${druid.host}

当它们加载段时,它们将在以下路径附着的一个临时的ZNODE:

${druid.zk.paths.servedSegmentsPath}/${druid.host}/_segment_identifier_

然后,Coordinator和Broker之类的进程可以监视这些路径,以查看哪些进程当前正在为哪些段提供服务。

3 ZooKeeper—Coordinator和Historical之间的段加载/删除

loadQueuePath参数用于这个功能。

当Coordiantor决定一个Historical进程应该加载或删除一个段时,它会将一个临时znode写到:

${druid.zk.paths.loadQueuePath}/_host_of_historical_process/_segment_identifier

这个znode将包含一个payload,它向Historical进程指示它应该如何处理给定的段。当Historical进程完成任务时,它将删除znode,以便向Coordinator表示它已经完成处理。