写点什么

YashanDB 访问约束

作者:YashanDB
  • 2025-02-20
    广东
  • 本文字数:809 字

    阅读完需:约 3 分钟

本文内容来自 YashanDB 官网,原文内容请见 https://doc.yashandb.com/yashandb/23.3/zh/%E6%A6%82%E5%BF%B5%E6%89%8B%E5%86%8C/%E5%85%B3%E7%B3%BB%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84/%E6%A8%A1%E5%BC%8F%E5%AF%B9%E8%B1%A1/%E8%AE%BF%E9%97%AE%E7%BA%A6%E6%9D%9F.html

访问约束是 YashanDB 特有的一种关系数据结构,基于有界计算理论的访问约束模型(AC,Access Constraint)实现:通过在数据源上建立 AC,实现大数据变小的模型变换。在查询时,通过访问 AC 数据,缩小查询代价和提升查询速度。

有界计算理论的基本思想是给定一个函数 f(x),参数 x 表示大数据集,多数计算不需要访问全部的 x、只需要取 x 的一小部分就能得到函数 f(x)的精确解。有界计算理论的研究目标是如何根据不同的函数 f(x),根据语义找到所需的 x 的那一小部分。

YashanDB 的访问约束结构是按照用户创建访问约束时指定的函数 f(x),从大数据集中提取与 f(x)结果相关的数据,将其存储在存储空间中。用户对于 f(x)的请求,从原来的遍历数据集并经过大量计算得到 f(x)转变为查询访问约束后通过少量计算得到 f(x)。

例如航空公司的数据集中有所有航空公司的所有航班历史飞行数据,如果现在用户需要查询航班延误次数最多的航空公司,则需要对大量的数据进行聚合。针对这一场景,可以建访问约束,只提取其中航班延误的数据,同时将数据中的重复项做聚合,例如城市、航班号等数据可能存在大量重复,可以通过合并重复值,再加一个引用计数来进行数据压缩,最终将一个海量的数据集大幅度缩小,从而达到查询加速的目的。

访问约束的作用包括:

* 数据存储变小:通过数据语义变换,实现数据的去重或聚合。

* 数据计算变小:基于有界计算、预计算将计算的范围变小。

* 代价有界确定:对于有明确的数据约束关系,可以基于有界算法确定计算的边界,对于计算所需的资源进行估算。

* 访问约束以对用户透明的方式实现查询加速。

* 源数据发生变化时,会动态刷新 AC 数据,保持数据一致性。

发布于: 刚刚阅读数: 4
用户头像

YashanDB

关注

全自研国产新型大数据管理系统 2022-02-15 加入

还未添加个人简介

评论

发布
暂无评论
YashanDB访问约束_数据库_YashanDB_InfoQ写作社区