低代码平台探讨 -MetaStore 元数据缓存 | 京东云技术团队
背景及需求
之前提到我们模型驱动的实现选择的是解释型,需要模型的元数据信息,在接到请求后动态处理逻辑.
此外,应用的通用能力中还包括:页面 dsl 查询,菜单查询等.
而且后期加入触发器,用户自定义 api 后,这些元数据也需要提供查询服务.
所以我们需要一个元数据模块,需要提供两个基础功能:加载元数据和提供元数据查询服务.
特殊说明:最开始的时候我们支持两种源:本地和远程,后期防止单独部署网络隔离问题把远程逻辑去掉了.
第一版迭代处理的元数据有:模型,页面 dsl 及菜单,后期加入触发器,用户自定义 api,拦截器等,我们今天按照第一版迭代来讨论设计及实现.
模型元数据的需求是缓存一批模型元数据,可以根据模型 name 获取模型的具体信息.
页面 dsl 的需求是缓存一批页面 dsl,根据 dslId 获取页面 dsl 信息.
菜单的需求比较简单,缓存菜单列表和获取菜单列表.
上边说的是功能性需求,接着说下非功能性需求:
性能,元数据的查询特别频繁,必须保证高性能,通常会使用缓存,这也是我们这个模块的核心价值之一.
数据要准确,从 MetaStore 获取的数据不能有问题和差异.
易于扩展,首先元数据不仅仅有根据 id 获取的需求,可能还有其他查询需求;其次后期加入其他元数据存储的时候要改动小.
初版设计
设计思路
上边说了需求,下边我们开始正式的设计,先选一个具体场景来说:模型元数据.
为了高性能肯定要使用缓存,开发中常用缓存方式有两种:远程和本地.
远程通常使用 NoSql 的中间件,如 Redis 和 MemCache,在这种场景下肯定不适合.
该场景最适合的方式是使用内存缓存,查询逻辑简单:根据 name 或者 id 获取,所以直接使用 map 的数据结构即可.
元数据是在应用启动时加载,不会再有变动(后期热部署此处需要重构),利用 spring 的启动机制,也不用考虑线程安全问题,直接使用 HashMap 就可以,这里应该是利用的 jvm 的 Happens-before 原则.
到此,我们确定了缓存的数据结构及接口:
包含一个内部变量 cache 是 HashMAP 类型,一个内部方法去加载数据,对外一个接口方法 getByKey,功能比较内聚,类设计是没问题的,下边我们看下具体的逻辑.
详细逻辑
getByKey 的逻辑是从缓存变量 cache 中获取,直接使用 map 的 get 方法,不用赘述(此处有坑,下文会有说明),主要看下 load 加载数据的方法
主要逻辑:
读取指定的目录,可以从配置中获取,获取不到使用默认值:models,读取出目录下所有文件.
开始循环处理每个文件,详细步骤:
读取出文件内容:json 格式.
json 数据转换成 Model 对象.
把 Model 对象放入到 cache 中,key 是 modelName,value 是 Model 对象.
抽象
当具体方案确定后,如上边所述的逻辑实现起来并不复杂,甚至可以说是简单.
但我们在整体看下会发现:模型和页面 dsl 的元数据缓存逻辑相似度特别高!
再回头看下上边的逻辑流程图,紫色的部分都是完全相同的,差异只存在与红色的两块逻辑:"读取指定目录"和"解析成对象",我们可以把公共的逻辑抽象出去,做成抽象的父类让子类去继承,利用了继承的代码复用的场景,这是一个典型的模板模式的应用场景.
简单说下模板模式的定义:在一个方法中定义一个算法骨架,并将某些步骤推迟到子类中实现,让子类在不改变算法整体结构的情况下,重新定义算法中的某些步骤.
结合我们的场景来说下:算法骨架就是整体的加载数据流程和获取元数据方法,子类(ModelMetaStore 和 PageMetaModel)需要实现骨架中的两个扩展方法:"读取指定目录"和"解析成对象".
第一版设计重构后,类图如下
说明:
模型数据文件和页面 dsl 文件都放到各自的目录:models 和 dsls 下,上边两个目录是默认的,但可自定义配置.
模型数据目录下的文件类型都是 json,文件名是模型名称.
页面 dsl 目录下的文件类型也都是 json,文件名是 page 的 id.
抽象出一个父类 AbstractDataStore<R>,泛型是子类的对象类型,包含核心逻辑和骨架.内部有一个 map 类型的 cache 变量和一个 load 私有函数用于加载数据,此外提供了两个抽象方法,一个是 directoryName:获取文件所在目录,另一个方式是 parse:根据文件内容解析成单个对象,这两个抽象方法需要子类实现,最后还有一个根据 key 获取元数据的公共方法.
ModelMetaStore 和 PageDataStore 继承了父类 AbstractDataStore,泛型分别是 ModelEntity 和 PageEntity,实现上述的两个抽象方法:directoryName 和 parse,两个方法的逻辑都特别简单,第一个直接返回自己的目录,第二个利用 fastjson 把字符串解析成指定对象.
组合
上面把模型和页面的元数据缓存设计完成了,还有一个菜单的元数据缓存.
菜单的元数据结构与上边的两个差异很大,每个应用中只会有一个菜单的元数据文件,所以无法使用上边的模板模式,我们需要单独去处理它的逻辑.
实际上菜单的元数据加载逻辑和其他两个(更准确的说应该是抽象类)有一部分重叠:读取文件的内容,这里面需要判断文件是否为空,读取内容字符串及 io 读取报错等.
这部分逻辑可以复制出来放到菜单的元数据缓存类中,但实际违背了 DRY 原则:不要写重复的代码.
那么该如何解决这块重复代码的问题呢?有两个方案:
第一个方案:使用继承.
在 AbstractDataStore<R>上再加一层抽象类,里面只包括一个方法:读取文件内容,新的菜单元数据缓存也继承这个抽象类,把读取文件内容的方法移到最上层,类结构图如下:
这个方案有两个问题:
继承层次太深,逻辑有点乱
最上层的抽象类很难起名
AbstractDataStore 和 MenuDataCache 继承 LoadFileData 从代码上是可行的,但逻辑上不太合理,抽象继承是 is-a 的关系,这里需要给 LoadFileData 一个合适的名字才满足设计规范,而这个名字并不太好起.
第一个方案:使用组合.
这个方案实际上更合理一些,面向对象设计有一个原则:组合优于继承.
可以把读取文件内容的逻辑独立出去作为一个新的帮助类 DataLoadSupport,AbstractDataStore 和 MenuDataCache 引入它就可以解决代码重复问题.
初始化加载
上一步几乎完成了所有逻辑,但是少了数据加载的触发,这个需要放到服务启动的时候触发.
我们利用了 spring 的 ApplicationListener,有一个细节问题要确定:如何实现 ApplicationListener,是每一个类中单独实现,还是统一实现.
为了逻辑的统一,还有后期其他服务需要启动时加载的考虑,我选择了统一实现,具体逻辑和类图如下:
具体逻辑:
新增一个接口 StartLoadListener:启动加载监听,启动时需要被触发的操作类实现该接口.
AbstractDataStore 和 MenuDataCache 实现 StartLoadListener 接口,标记需要在应用启动时触发,应用启动后触发自己的 load 方法.
新增 StartLoadListenerManager 类,里面会自动注入所有实现 StartLoadListener 接口的对象,该类同时实现了 spring 的 ApplicationListener 接口,在 spring 启动后被触发,触发后调用所有的 StartLoadListener 的 startLoad 方法,完成所有需要启动时触发的操作.
类图:
第二版设计
如文章开头所说,从元数据缓存中使用 key 从 map 中获取信息后直接返回是有问题的,开发完的时候也意识到了一些,但没有去处理,直到某天雷真的炸了.
先说下问题出现的过程,初期功能简单,低代码平台生成的应用都跑的好好的,迭代数次版本后,新增了权限能力:支持简单的数据权限和菜单权限.
菜单权限的处理逻辑大体如下:
从菜单缓存中直接获取缓存的数据.
如果菜单列表为空,直接返回给客户端空的列表,结束菜单查询.
查询用户有权限的菜单编码列表(set),数据源头是科技权限系统,初期比较粗暴代码耦合到菜单权限代码中,但这不是今天讨论的重点,后边的文章会讲到权限模块的重构.
如果用户有权限的菜单编码列表(set)为空,直接返回给客户端空的列表,结束菜单查询.
递归处理获取的缓存菜单,如果编码在权限系统返回的编码列表(set)中,递归处理子节点列表(菜单是树形的),否则直接删除该节点,返回到上级递归.
循环上步操作,直到所有菜单节点校验完成.
逻辑并不太复杂,开发的时候特意重点关注了递归和权限系统查询,本地测试没什么问题,部署到测试环境也没发现什么问题.
但最后要上线前测试发现了一个问题:切换账号后,菜单不对,有权限的菜单变少了!!!
定位问题的时候,先排查权限系统的返回,结果没问题;在把数据拿到本地走 mock 测试也没有问题;在最后 debug 的时候发现了真正的问题,也就是之前意识到但没有解决的问题:在菜单权限逻辑中操作的菜单列表和菜单元数据缓存的菜单列表是同一个对象!
在某个用户处理完自己的权限菜单逻辑后,可能会移除一些节点,下一个用户在获取菜单的时候他的菜单元数据可能就是被处理过(在权限处理中被移除)的了.
元数据存储实际上类似原型模型,原型模式的定义:如果对象的创建成本比较大,而同一个类的不同对象之间差别不大(大部分字段都相同),在这种情况下,我们可以利用对已有对象进行复制(或者叫拷贝)的方式来创建新对象,以达到节省创建时间的目的.
我的实现只做了缓存,但没有实现复制,使得同一对象被多个场景操作.最后导致数据的错误及混乱.
而复制一般也叫拷贝,分为两类:
浅拷贝:只会拷贝对象中的基本数据类型的数据(比如,int、long),以及引用对象的内存地址,不会递归地拷贝引用对象本身.
深拷贝:不仅仅会复制索引,还会复制数据本身
我们肯定要选择深拷贝,但出现问题的时候已经有几个元数据存储了,特别是菜单数据的结构复杂(树形),短时间没法完成深度复制,市面上的工具类通常只能复制一层,无法自动完成深层次的复制.
当时的解决方案比较粗暴:问题出现在菜单,那只在菜单权限处理的时候做手脚:定义一个新的菜单列表,有权限的菜单深度复制当前对象后加入到 list;递归处理子节点.继续重新定义一个 list 设置为上层节点的子节点,有权限的子节点放入到新的 list,递归循环上述步骤.
表象的 bug 解决了,但实际问题还没有解决,只是被遮盖了,就拿菜单来说,我是在权限服务那处理了,但如果在其他地方使用呢,一样会出现数据缺失的错误.
更严重的是在触发器中提供了获取模型元数据的接口,开发者获取模型元数据后如果进行了修改,导致的错误会更加严重,也更加的难已排查,因为模型元数据的变更会导致模型通用接口逻辑的缺失或混乱,所以深度复制的功能一定要实现.
深度复制的实现一般有两种:
第一种序列化后反序列化,比如把数据序列化成 json,在反序列化回来.该方案有两个问题:(1)继承的子类多态容易出问题(2)序列化和反序列化是有性能消耗的,在此处方案并不适合.
第二种是递归处理:遇到 Collection 和 Map 及 javabean 类型,进行递归的深度拷贝.该方案开发成本稍高,大量的递归需要特殊注意,此外一些特殊的 bean 也无法复制:如内部变量是 final 类型,或者只支持构造函数传入.
我们使用的是第二种,这种方法纯粹是算法类,不再细说,在中间碰到了一个坑:我有一个习惯遇到一些没有数据需要返回空的 list 的时候我会直接使用 Collections.emptyList(),在深度复制的时候根据构造函数新建对象会直接报错,修复方案是:如果是 list 或者 map 不是常见的对象类型直接使用常见的对象 ArrayList 和 HashMap.
实际上还有一种方案能解决数据修改问题,使用不变对象,不变对象就是对象在创建后,不可以被修改:没有 set 方法,且内部变量不会暴露,需要注意的是,内部变量也要进行保护:不变或者深拷贝.
作者:京东科技 吴籽良
来源:京东云开发者社区 转载请注明来源
版权声明: 本文为 InfoQ 作者【京东科技开发者】的原创文章。
原文链接:【http://xie.infoq.cn/article/f954fb5f359ff82f5be26f5de】。文章转载请联系作者。
评论