只读节点在线 Promote

棠羽

2022/12/25

15 min

PolarDB for PostgreSQL 是一款存储与计算分离的云原生数据库,所有计算节点共享一份存储,并且对存储的访问具有 一写多读 的限制:所有计算节点可以对存储进行读取,但只有一个计算节点可以对存储进行写入。这种限制会带来一个问题:当读写节点因为宕机或网络故障而不可用时,集群中将没有能够可以写入存储的计算节点,应用业务中的增、删、改,以及 DDL 都将无法运行。

本文将指导您在 PolarDB for PostgreSQL 计算集群中的读写节点停止服务时,将任意一个只读节点在线提升为读写节点,从而使集群恢复对于共享存储的写入能力。

前置准备

为方便起见,本示例使用基于本地磁盘的实例来进行演示。拉取如下镜像并启动容器,可以得到一个基于本地磁盘的 HTAP 实例:

docker pull polardb/polardb_pg_local_instance
docker run -it \
    --cap-add=SYS_PTRACE \
    --privileged=true \
    --name polardb_pg_htap \
    --shm-size=512m \
    polardb/polardb_pg_local_instance \
    bash

容器内的 54325434 端口分别运行着一个读写节点和两个只读节点。两个只读节点与读写节点共享同一份数据,并通过物理复制保持与读写节点的内存状态同步。

验证只读节点不可写

首先,连接到读写节点,创建一张表并插入一些数据:

psql -p5432
postgres=# CREATE TABLE t (id int);
CREATE TABLE
postgres=# INSERT INTO t SELECT generate_series(1,10);
INSERT 0 10

然后连接到只读节点,并同样试图对表插入数据,将会发现无法进行插入操作:

psql -p5433
postgres=# INSERT INTO t SELECT generate_series(1,10);
ERROR:  cannot execute INSERT in a read-only transaction

读写节点停止写入

此时,关闭读写节点,模拟出读写节点不可用的行为:

$ pg_ctl -D ~/tmp_master_dir_polardb_pg_1100_bld/ stop
waiting for server to shut down.... done
server stopped

此时,集群中没有任何节点可以写入存储了。这时,我们需要将一个只读节点提升为读写节点,恢复对存储的写入。

只读节点 Promote

只有当读写节点停止写入后,才可以将只读节点提升为读写节点,否则将会出现集群内两个节点同时写入的情况。当数据库检测到出现多节点写入时,将会导致运行异常。

将运行在 5433 端口的只读节点提升为读写节点:

$ pg_ctl -D ~/tmp_replica_dir_polardb_pg_1100_bld1/ promote
waiting for server to promote.... done
server promoted

计算集群恢复写入

连接到已经完成 promote 的新读写节点上,再次尝试之前的 INSERT 操作:

postgres=# INSERT INTO t SELECT generate_series(1,10);
INSERT 0 10

从上述结果中可以看到,新的读写节点能够成功对存储进行写入。这说明原先的只读节点已经被成功提升为读写节点了。