OpenMLDB 社区月报 | 2022 年 11 月
十一月,OpenMLDB 进行了高频的小版本迭代,共发布四个版本,平均每周一次。v0.6.5、v0.6.6、v0.6.7 和 v0.6.8 陆续与广大开发者见面,在增强功能的同时,也提高了运维效率,对易用性、可观测性、自动化等方面进行了改进。
技术动态
十一月 v0.6.5 - v0.6.8 新特性
优化表分区的分布(Optimize the distribution of table partitions)
添加一个新的工作流来自动生成内置函数的文档(Add a new workflow to generate the documents of built-in functions automatically)
支持新的 SQL 语句
show joblog
(Support the new SQL statement show joblog )添加显示表状态的警告消息(Add a warning message for show table status )
添加用于数据恢复和横向扩展/纵向扩展的新工具(Add a new tool for data recovery and scale-out/scale-in )
支持新的内置函数
hash64
(Support the new build-in function hash64)支持从/向配置单元导入和导出数据 (Support importing and exporting data from/to Hive)
改进了
autof
的模块 (Improve the module of autofe)改进了
TaskManager
客户端的错误消息 (Improve error messages of the TaskManager client)支持 SQL 批处理引擎中的
where
子句 (Support the where clause in the SQL batch engine)在 APIServer 中支持 JSON 格式的输入和输出 (Support input and output with the JSON format in APIServer)
十一月主要 Bug 修复
当模式与 parquet 文件不匹配时会在脱机模式下加载错误数据 (Incorrect data will be loaded in offline mode if the schema mismatches with parquet files. )
如果在 SQL 语句中指定数据库,则创建索引失败(Creating index fails if specifying a database in SQL statement)
提交作业后,start_time 不可读(
start_time
is not human-readable after submitting a job)MemTable
中产生了错误的GetRecordIdxCnt
结果(Incorrect result of GetRecordIdxCnt is produced in MemTable )在 MacOS 虚拟机中找不到
pytest
命令。(pytest command is not found in the MacOS virtual machine.)错误的输出架构传递到
WindowAggRunner
。 (Wrong output schema passes to the WindowAggRunner.)如果未指定数据库,则执行
showopstatus
命令时没有输出 (There are no outputs when executing showopstatus command if no database is specified)数据恢复工具在某些情况下会失败 (The data recovery tool fails in some cases )
Python SDK 工作流在 MacOS 上可能会失败。 (Python SDK workflow may fail on MacOS.)
某些日志消息中存在语法错误。(There are syntax errors in some log messages. )
安装 Python SDK 需要冗余的安装包。 (Installing Python SDK requires unnessary packages.)
社区动态
社区活动
分享活动
11 月 16 日 19:30-21:00OpenMLDB 项目发起人、第四范式技术副总裁 郑曌 受邀主持 DataFunSummit 2022 AI 基础软件架构峰会圆桌会,与一流科技创始人 袁进辉、百度飞桨总架构师 于佃海等资深专家在线上做深度的交流分享。
11 月 19 日 13:30-17:30OpenMLDB 项目发起人、第四范式技术副总裁 郑曌 作为出品人发起 DataFunSummit 2022 MLOps 及 AI 工程化落地论坛,与阿里云高级技术专家 林东、微软首席数据科学家 朱晓勇等业界专家共话 AI 应用落地。其中 OpenMLDB PMC 卢冕 在论坛中为大家带来议题为《开源机器学习数据库 OpenMLDB:线上线下一致的生产级特征平台》的内容分享。
11 月 19 日 14:30-15:30OpenMLDB PMC 祁利国在 GIAC 全球互联网架构大会人工智能基础设施专题 中为大家带来议题为《开源数据库 OpenMLDB:线上线下一致的实时特征平台》的内容分享。
贡献活动
OpenMLDB Bug 悬赏令仍在进行中。
开源摘星活动活动也在持续进行。
OpenMLDB 贡献者任务第五期、开发者嘉年华在十一月落下帷幕。
OpenMLDB 参与的高校开源活动——2022 开源之夏和 GLCC 编程夏令营于十一月圆满结束并完成公示。
希望各位开发者在开源活动中获得技术上成长进步,也在测试使用中加深对 OpenMLDB 的了解掌握,与 OpenMLDB 共建包容有活力的开源生态。
后续,OpenMLDB 也会积极合作或组织开展开源活动,为各位提供更丰富的开源实践机会、更广阔的开源参与平台。
Meet us
OpenMLDB 官网
OpenMLDBgithub 主页(更多动态请关注这里!)
https://github.com/4paradigm/OpenMLDB
OpenMLDB 微信交流群
评论