每个Znode都包含了一系列的属性,对于Zookeeper来说,Znode状态改变的每一个操作都将使节点接收到唯一的zxid(Zookeeper Transaction ID)格式的时间戳,并且这个时间戳是全局有序的,通常被称为事物ID...查看全文>>
Zookeeper为了保证各节点的协同工作,在工作时需要一个Leader角色,而Zookeeper默认采用FastLeaderElection算法,且投票数大于半数则胜出的机制,再介绍选举机制前,首先了解选举涉及的相关概念。查看全文>>
HBase中存储在HDFS中的数据是通过Zookeeper协调处理的。由于HBase存在单点故障的问题,因此,可以通过Zookeeper部署一个高可用的HBase集群解决。下面,以三台服务器为例(hadoop01、hadoop02和hadoop03),讲解如何安装部署HBase集群。查看全文>>
Spark的任务调度流程分为RDD Objects、DAGScheduler、TaskScheduler以及Worker四个部分。关于这四个部分的相关介绍具体如下:查看全文>>
被多个线程同时访问,使用线程同步技术,可以确保数据在任何时刻最多只有一个线程访问。查看全文>>
程序开发中不仅需要使用大量的标准模块,而且还会根据业务需求使用第三方模块。在使用第三方模块之前,需要使用包管理工具——pip下载和安装第三方模块。查看全文>>