工业物联网中的时序数据
CnosDB 的研发工程师们正在如火如荼的推进着 Rust 版本的研发工作,在此 Jesse 感谢各位小伙伴一直以来对社区的理解与支持,本期我们就想来聊聊工业物联网中的时序数据。
本文仅代表个人观点,如有偏颇之处,还请海涵~
🤠🤠🤠
工业物联网中的时序数据
工业革命是人类历史的分水岭。人类的工作方式发生了极大的转变——从零碎的家庭作业转向机械化制造。自 18 世纪以来,流水线和计算机等一系列创新浪潮不断改变着制造业的性质。今天,我们正处于另一场创新浪潮的工业转型之中——工业 4.0,其涉及将原始数据与经过训练的机器学习模型提供给工业生产自主系统以加快生产流程。
具体来说,生产制造商希望得到较为准确以及可预测的产出。为此,他们采用了物理设备,比如,各类安装在机器上设备上监控数据的传感器。这些传感器是工业物联网(IIoT)的基础,并记录着大量有关工业机械性能和功能的关键数据。
数据关键特征:时间
我们发现,无论工业运营商的传感器收集什么类型的读数,它总是包含一个时间戳,这为工业读数提供了一个共有的特征。带时间戳的时序数据也成为了我们处理和理解工业 4.0 物联网数据的关键支点。
值得庆幸是,支撑工业 4.0 的基本原则与时间序列数据的特征相吻合。工业 4.0 致力于:
(1)互连:使设备、传感器和人员相互连接和通信的能力。
(2)信息透明:互连允许从制造过程的所有点收集大量数据,这些数据提供给工业运营商可以为他们提供有效的理解,有助于确定创新和改进的领域。
(3)技术援助:使用集中式仪表板汇总和可视化收集的数据的能力,使工业运营商能够做出明智的决策并即时解决紧急问题。
(4)分散决策:系统将具有根据收集的数据自主执行任务的能力。我们只需要人工向系统中输入例外情况。将这些概念和目标与时序数据的一些 IIoT 用例相比较,我们就会发现时序数据几乎触及工业运营的所有方面。
工业 4.0 —— 结合时间观察
工业运营商希望对他们的机器和流程有更大的可观察性,而时序数据为此提供了基础。将这些原始数据转化为具有见解的行业 Know-How 是工业 4.0 中时序数据的关键目标之一。利用合理的工具来处理、转换和分析这些数据将成为工业 4.0 计划能否成功的关键。我们发现,很多工厂和制造商都还在使用传统的在工业 3.0 中使用的工业实时数据库(可参考:https://mp.weixin.qq.com/s/QYEZ16sbe4YQuCZY3mXp7Q),而这些方案是不适合工业 4.0 系统的,主要有以下几个原因:
(1)成本高:这些解决方案的设置和维护成本很高,而且每年收取许可费和支持费。大多数工业运营商之前所用的数据库的安装都需要定制开发来满足特定业务或流程的需求,并且可能需要外部咨询资源。这些系统的专有性质意味着这项工作既耗时又昂贵。
(2)供应商锁定:这些解决方案通常基于 Windows,不提供简单、开放的 API 来与其他软件交互。因此,工业运营商需要从单一供应商处购买所有集成和组件,这就会将用户锁定在专有解决方案中。
(3)可扩展性差:此前运营商在构建时序数据库时考虑到了有限的数据集。这在引入人工智能或机器学习 (AI/ML) 等高级功能时会产生问题。这些功能需要更多数据来训练模型,而传统系统无法处理这些数据。
(4)开发人员体验差:之前解决方案式的服务,采用传统的封闭式设计,API 支持有限。因此,实施或集成这些系统需要花费大量时间和金钱。这些封闭式设计解决方案提供的内置工具很少,没有开发人员社区,也不支持模块化开发方法,因此限制了开发人员挑选最适合其组织需求工具的能力。
(5)孤立的数据:数据采集与监控系统制造商可能会为其设备提供数据历史记录,但大多数使用传统制造执行系统(MES) 的工业组织会将其所有数据整合到单个本地数据历史记录中。但是,由于缺乏微服务架构和开放 API,以及防火墙和子网的广泛使用,通常会在站点级别分离数据。
由于无法与现代 IT、云或开源软件解决方案集成,此前运营商所使用的传统工业实时数据库无法提供发展工业运营所需的灵活性和连接性。这显著降低了工业 4.0 环境中所涉及的运营技术和 IT 系统及其包含的数据的功效,因为传统工业实时数据库与其他系统之间缺乏互操作性会抑制创新并限制可观察性。
替换工业实时数据库
我们自然而然的会思考一个问题,如果传统的工业实时数据库不是工业 4.0 的答案,那我们应该用什么来替换他呢?我们相信,大部分制造商可能都想选择他们熟悉的技术来替换,比如关系型数据库,但可惜的是关系型数据库无法针对海量数据进行扩展,存在对时序数据存储容量和查询效率低下的问题。
事实上,最适合这些传统工业运营商或者制造商的数据库替代品应该是一个开源的时序数据平台。比如,CnosDB 就是专门处理时序数据的数据库,其有着良好的压缩比和支持海量数据的写入。它使用 API,因此能够与几乎任何其他连接的设备集成。CnosDB 还是一个无模式平台,因此它会自动适应传入 IIoT 数据形状的变化。与国际领头羊厂商 InfluxDB 相比,CnosDB 未来不仅全面兼容 InfluxDB,且分布式功能完全免费,可以让客户无痛迁移,同时也将更加拥抱云生态。
管理和利用时序数据
这种广泛的连接性还使制造商能够更轻松地监控和管理现场的分布式系统和网络以及远程设备。比如,如果工业制造商或者运营商在不同地域拥有三个不同的设施,CnosDB 允许他们从每个设施的每台机器上的每个传感器收集数据。每个设施生成的数据都可以在现场汇总和存储。这些汇总的数据会发送到中央存储实例,该实例从所有三个站点收集数据并汇总,最终企业可以在公司范围层面通过汇总的数据来分析,从而产生不同的 Know-how。这也适用于边缘上的任何连接设备,无论是农村太阳能电池板还是具有 GSM(全球移动系统)连接的海洋浮标。不论您的公司如何定义“边缘”, CnosDB 都可以处理这些物联网设备收集的数据。
CnosDB 简介
CnosDB 是一款高性能、高易用性的开源分布式时序数据库,现已正式发布及全部开源。
欢迎关注我们的代码仓库,一键三连🙇🙇🙇:https://github.com/cnosdb/cnosdb
版权声明: 本文为 InfoQ 作者【CnosDB】的原创文章。
原文链接:【http://xie.infoq.cn/article/6e8f0d95646213c2c49cd6d29】。文章转载请联系作者。
评论