写点什么

【YashanDB 知识库】关于表空间压缩

作者:YashanDB
  • 2025-01-20
    广东
  • 本文字数:694 字

    阅读完需:约 2 分钟

本文内容来自 YashanDB 官网,原文内容请见https://www.yashandb.com/newsinfo/7106886.html?templateId=1718516


实现方法

1、YashanDB 的表空间压缩通过文件打洞(Hole Punching)实现。

2、“文件打洞”简单地说,如果文件中有连续字节 0x00 出现,只需要记录 0 字节数据块开始出现位置和块长度,而不需要实际保存原数据块。

3、表空间压缩支持 LZ4(默认),ZSTD 两种压缩算法。

4、数据库首先对 BLOCK 内容进行压缩,然后根据压缩结果做如下操作:

●  压缩失败或压缩之后的大小大于等于 BLOCK 大小,则不压缩,写入原始的 BLOCK

●  压缩释放的空间不足一个文件系统的页大小,则不压缩,写入原始的 BLOCK

●  压缩释放的空间大于等于一个文件系统的页大小,将释放的空间按照文件系统的页向下取整,写入压缩后的 BLOCK,并将释放的空间进行打洞

5、DBWR 写入时进行压缩;读取到 DATA BUFFER 过程解压。

 

环境要求

不是所有的文件系统都支持文件打洞功能,目前支持的文件系统有:xfs,ext4, btrfs, tmpfs, gfs2。此外,YashanDB 还要求文件系统的的页大小为 512、1024、2048 或 4096。

 

使用方法

创建表空间时指定压缩属性及压缩算法,示例如下:

CREATE TABLESPACE tbs_data COMPRESS lz4;
复制代码


如何查看压缩率

在视图 v$datafile 中字段 disk_bytes 表示 datafile 在文件系统中实际大小

SELECT id, name, bytes, disk_bytes, bytes/disk_bytes as compression_ratio FROM v$datafile;
复制代码


压缩率与哪些因素有关

1、首先是数据本身

2、与数据库 BLOCK 大小,及文件系统的页大小有关,如果 BLOCK 大小为 8K,文件系统页为 4K,每个 BLOCK 最多只能节省一个文件系统页(4K),因此理论上压缩率不超过 50%,建库时选取更大的 BLOCK 大小有可能提升压缩率

 

发布于: 刚刚阅读数: 5
用户头像

YashanDB

关注

全自研国产新型大数据管理系统 2022-02-15 加入

还未添加个人简介

评论

发布
暂无评论
【YashanDB知识库】关于表空间压缩_数据库_YashanDB_InfoQ写作社区