OrioleDB:新一代PostgreSQL存储引擎

PostgreSQL 12 引入了可插拔式的表存储方法接口,允许为不同的表选择不同的存储机制,例如用于 OLTP 操作的堆表(HEAP、默认)、用于 OLAP 操作的列式表(Citus),以及用于超快速搜索处理的内存表。

PostgreSQL 这一特性类似于 MySQL 的插件式存储引擎,例如 InnoDB、MyISAM。

今天给大家介绍一个云原生的 PostgreSQL 存储引擎:OrioleDB。

功能特性

OrioleDB 旨在解决 PostgreSQL 默认 HEAP 表在 OLTP(在线事务处理)场景中的一些性能瓶颈,并引入现代数据库存储技术的设计理念,提供更高的并发性能、更低的延迟,并减少存储开销。

OrioleDB 以扩展插件形式提供,基于 PostgreSQL 协议发布,提供的核心特性包括:

基于现代存储技术(SSD、NVRAM)设计,优化多核 CPU 和 NUMA 架构下的资源分配,提升吞吐量。基于 Undo Log 的 MVCC,将旧版本数据存储在独立的 Undo Log 而不是主表中。事务回滚或旧版本清理时直接操作 Undo Log,避免主表数据膨胀。同时还支持 64 位事务 ID,避免了回卷问题。聚簇索引,默认使用聚簇索引(类似 MySQL/InnoDB),数据按主键顺序存储,减少随机 I/O,提升范围查询性能。压缩存储,支持页级数据压缩,降低存储成本。分布式支持,Copy-on-Write 检查点提供结构一致的数据快照,兼容 SSD 特性,并支持紧凑的行级 WAL 记录。基于行级 WAL 日志和 Raft 共识算法,支持并行回放和 Active-Active 多主架构,适合分布式部署。使用示例

目前,OrioleDB 还处于 Beta 阶段,最简单的使用方法就是利用 Docker:

复制
docker run -d --name orioledb -p 5432:5432 orioledb/orioledb1.

然后安装扩展插件并创建数据表:

复制
-- 创建扩展插件 CREATE EXTENSION orioledb; -- 创建表 CREATETABLE blog_post ( id int8 NOTNULL, title textNOTNULL, body textNOTNULL, author textNOTNULL, published_at timestamptz NOTNULLDEFAULTCURRENT_TIMESTAMP, views bigintNOTNULL, PRIMARYKEY(id) )USING orioledb;-- 使用OrioleDB存储引擎 -- 创建索引 CREATEINDEX blog_post_published_at ON blog_post(published_at);1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.

OrioleDB 使用聚簇索引,因此主键的选择对于性能至关重要;如果没有指定主键字段,数据库会基于 ctid 字段创建一个隐藏的替代主键。

接下来就可以执行一些 DML 操作:

复制
INSERT INTO blog_post (id, title, body, author, views) VALUES (1, Hello, World!, This is my first blog post., John Doe, 1000); SELECT * FROM blog_post ORDER BY published_at DESC LIMIT 10;1.2.3.4.

更详细的使用介绍和注意事项可以参考以下官方文档:

https://www.orioledb.com/docs

性能比较

以下是一些 OrioleDB 和默认 HEAP 存储引擎的性能比较。

测试一:只读测试显示 OrioleDB 存储引擎的性能是 PostgreSQL 默认引擎的 4 倍。

测试二:读写测试显示 OrioleDB 存储引擎的性能是 PostgreSQL 默认引擎的 4.5 倍。

测试三:OrioleDB 存储引擎的磁盘读取(IOPS)是 PostgreSQL 默认引擎的 1/6。

测试四:OrioleDB 存储引擎的磁盘写入比 PostgreSQL 默认引擎大幅减少。

阅读剩余
THE END