写点什么

2023 开源之夏|来自 MatrixOne 社区的邀请函

作者:MatrixOrigin
  • 2023-05-12
    上海
  • 本文字数:1806 字

    阅读完需:约 6 分钟

2023开源之夏|来自MatrixOne社区的邀请函

滴滴滴~ MatrixOne 今年再次参与由中科院软件所“开源软件供应链点亮计划”发起的开源之夏啦!

希望这个夏天,MatrixOne 能陪伴同学们一起参与开源软件的开发维护,培养和发掘出更多的优秀在校开发者,也希望能吸引更多同学陪伴我们一同成长~

加入MatrixOne开源项目,您可以深入了解数据库产品架构知识,近距离学习如何从零打造数据库软件,更有机会与 MO 技术大牛一起并肩作战,共同开发一个数据库模块,成为社区的核心贡献者!


MatrixOne 项目介绍

在 2023 开源之夏活动中,我们准备了 3 个项目。成功通关结项的同学可以获得奖金与荣誉证书,同时也有可能掉落工作机会哦~

项目 01 数据库机器学习及 AI 的 Python 嵌入

将 Python 嵌入到 MatrixOne 数据库中,使 Python 能够与数据库执行引擎通信,从而实现在数据库中使用 ML/AI。Python 将在容器/沙箱中运行,以实现安全性和资源管理。

Python 工作负载将成为 MatrixOne 数据库的一等公民,这意味着查询优化器/执行器将像关系型数据库操作符一样优化/调度 Python,在并行/分布式环境中运行。

*Bonus:如果能够创建开发环境,使开发人员能够在 VSCode 中编码/调试,并且一键部署在 TB 级数据的数据库中,则会获得额外加分。

项目难度:进阶

产出要求:

  1. 实现定义和管理 Python UDF 的 SQL 语法;

  2. 实现在沙箱中安全地执行 Python UDF;

  3. (Bonus) 支持在 IDE 中调试和部署 Python UDF。

技术要求:

  1. 熟悉 Golang 和 Python;

  2. 了解容器技术。

导师信息:

吴叶磊 :wuyelei@matrixorigin.cn

申请链接:https://summer-ospp.ac.cn/org/prodetail/23b4d0427


项目 02 为 MatrixOne 混沌自动化测试工程注入故障工具及模块

基于当前业界混沌测试相关的理论以及相关开源工具,实现基于分布式系统的混沌测试自动化能力,主要包括如下核心模块和能力:

  • 故障注入模块,基于开源或定制开发的故障注入工具,可实现基于配置策略,自动向被测系统进行故障/错误注入,故障/错误恢复以及详细的持久化日志记录。

  • 执行器模块,提供一些列标准的接口或配置等,实现一个统一的执行器可执行、监控各种异构的测试工具和测试场景。

  • 结果分析模块,对故障注入/恢复数据、测试场景执行过程和结果数据进行分析并进行可视化展示。

项目难度:基础

产出要求:

  1. 项目成果至少满足可执行分布式 MO 的混沌测试,其他分布式系统可暂不做强要求;

  2. 详细的使用/实施文档,包括环境配置要求、详细安装/部署/配置手册等。

技术要求:

  1. 编程能力不限制,熟悉 go/java/python 任意即可,最好熟悉 go 编程;

  2. 了解容器云相关技术栈,如 k8s、docker 等。

导师信息:

苏动 :sudong@matrixorigin.cn

申请链接:https://summer-ospp.ac.cn/org/prodetail/23b4d0428


项目 03 物联网和流媒体数据的高级数据类型和功能

设计并实现 GIS、时间序列的数据存储格式及核心函数(这些功能后续将被集成到一个流式数据框架中)。要求存储格式能支持非常高的流量;能够加载数千条(或更多)的输入数据流;支持高效的查询技术(例如 GIS 中的距离和交集,以及时间序列数据的流算法);能基于流数据开发高级在线草图算法。

项目难度:进阶

产出要求:

  1. 研究和学习:鼓励参与学生研究和学习现有的 GIS 和时间序列数据格式、存储系统和查询技术。这将帮助他们了解当前的技术水平,并找到可以改进的领域。

  2. 设计存储格式:一同设计一个可以高效处理大量 GIS 和时间序列数据的存储格式。该格式应在存储空间和查询性能方面进行优化。

  3. 实现查询技术(取决于进度):帮助参与学生开发 GIS 和时间序列数据的高效查询技术。这可能涉及实现距离和交集计算的算法,以及时间序列数据的流式算法。

  4. 测试和评估:协助参与学生测试和评估存储格式和查询技术的性能。这可能涉及与现有解决方案进行基准测试,并找到改进的领域。

  5. 文档编写:鼓励参与学生记录他们的工作,包括存储格式的设计、实现的查询技术和开发的草图算法。这将使其他人更容易理解和基于他们的工作进行构建。

技术要求:

  1. 熟悉 Golang;

  2. 最好熟悉流计算和 time-series data。

导师信息:

岳远源 :gyue@outlook.com

申请链接:https://summer-ospp.ac.cn/org/prodetail/23b4d0456


MatrixOne 社区介绍

MatrixOne 是一款面向未来的超融合异构云原生数据库管理系统。通过全新设计和研发的统一分布式数据库引擎,能够同时灵活支持 OLTP、OLAP、 Streaming 等不同工作负载的数据管理和应用,用户可以在公有云、自建数据中心和边缘节点上无缝部署和运行。

MatrixOrigin 官网:新一代超融合异构开源数据库-矩阵起源(深圳)信息科技有限公司 MatrixOne

发布于: 刚刚阅读数: 6
用户头像

MatrixOrigin

关注

还未添加个人签名 2021-12-06 加入

一个以技术创新和用户价值为核心的基础软件技术公司。

评论

发布
暂无评论
2023开源之夏|来自MatrixOne社区的邀请函_MatrixOrigin_MatrixOrigin_InfoQ写作社区