写点什么

演讲实录|姚延栋:终止“试点炼狱”,智能汽车时代数字化转型与实践

作者:yMatrix
  • 2022-12-15
    北京
  • 本文字数:4179 字

    阅读完需:约 14 分钟

日渐智能化的行车辅助系统,通过搭载先进的传感器、终端设备等装置,使智能化汽车在运行过程中产生海量车辆数据。这些车辆信息内容相当丰富,如油耗,车速,路线,行驶轨迹,行驶里程,驾驶员监控等,数据对于整个汽车行业而言意味着新的机遇。

可以预见,车辆网联化将会带来“存储“的爆发性增长,因为,一辆智能汽车,一条聪明道路,汇成的万物互联,都离不开对数据的充分利用和支撑。


近日,四维纵横受邀参加由中国汽车工程研究院、中国汽车信息化推进产业联盟等共同主办的中国智能网联汽车创新成果大会 (CICVIAC 2022)。公司创新自研的“超融合时序数据库”经过严格筛选,荣获“中国智能网联汽车创新成果奖”。



在会上,由四维纵横创始人兼 CEO 姚延栋从项目架构和实践案例出发,分享主题为“超融合时序数据库 MatrixDB 智能网联汽车的数据基座”,回答车企在数字化转型道路上面临的种种挑战,同时介绍 MatrixDB 在数字汽车场景下的应用和实践,希望对各大车企以及行业发展有所帮助。



我们将本次活动的核心内容进行了整理,希望给大家带来一些深入的启发。

全文会围绕以下三方面内容展开:

  • 超融合时序数据库 MatrixDB 介绍

  • 数字化时代,企业面临的困难和挑战

  • 应用赋能,最佳实践:数字汽车及工厂大脑案例


今天分享的主题和智能网联汽车的数据基座有关,放眼全球汽车产业的发展和演进,智能网联是汽车行业数字化的载体和加速器,将推动全价值链的数字化转型,而这一切,统统由数据组成。


想通过数据库提升数据的处理与挖掘能力,首先要明确一个关键问题——什么是超融合时序数据库?


1、为数字化时代而生的超融合时序数据库


超融合时序数据库 MatrixDB 是一款轻量级、高性能、一站式平台, 通过微内核(microdb)技术架构实现一库多用,提供在一套数据库架构之上,对多模态数据、多场景类型、多种复杂查询的统一支持能力,帮助企业大幅降低数据基础设施的采购、使用及运维门槛。


MatrixDB 为物联网时代全新设计或说专业设计,实现海量数据采集、存储、分析和计算,已成功应用于智能网联汽车、智能制造、工业互联网、智慧能源、智慧城市等场景。


目前,四维纵横已与宁德时代、理想汽车、北理新源、小米制造、比亚迪等汽车领域企业建立了友好的合作关系,在智能网联汽车领域进行了丰富落地探索。

2、数字化是最大的确定性


在所有“不确定性”中,最大的确定是我们已经处在了“数字化时代”。



在 Statista 2021 的报告中提到,全球联网的物联网设备已经超过了非物联网设备,表示数据产生的范式已经发生了根本性的变化。过去的数据是由人、动作所产生,而未来的趋势将会是由设备主动产生数据。譬如,路上的汽车,每一秒的行车轨迹,包括车速、车胎等车辆信号都是实时产生,这就是设备产生数据,数据量在未来的几年将会远超人力所产生的数据


麦肯锡也提出,预计到 2026 年,数据市场规模将会达到 1000 亿美金。好消息是中国仍然是 IoT 最大的部署市场,也为中国的企业创造一个巨大的机会。在新场景下,特别是从数据这个层次,有一个非常重要的变化——时序数据。DB-Engines 也对数据库的流行度做一个排名,时序数据仍然是高居榜首。

抓住机遇,进入数字化时代


研究报告指出,90% 的企业拥抱数字化的同时,仍有 80% 的企业转型是失败的。


企业在数字化转型遇到的困难,从技术上来说,特别是数字技术,都是为“上一个时代而设计的”。上一个时代是信息化时代和互联网时代,而现在仍用上一代技术解决当下的问题。显然,这些技术栈已经不适应未来万能互联这样的新时代,试点炼狱造成大量的精力消耗。


技术栈存在的三大问题


01. 碎片化非常严重

碎片化造成数据孤岛,没办法建立全局、实时的数据驱动。


02. 

解决单一场景的数据库是快的,但几乎所有的用户都是复合场景,使用时需要叠加多种产品使用,像电脑组装机一样,更多的客户需要的是一个品牌机。


03. 复杂

技术栈的复杂造成最直接的影响就是“门槛高”,复杂度是造成人才困难的重要原因之一。想解决人才问题,最根本就是降低复杂度,让它变得所有人都很容易去学。


数据的复杂还可以再细分为两个方向,数据多样化场景多样化

  • 数据多样化,从年代较久远的关系数据,到相对较新的时序数据、GIS 数据或激光雷达数据等,使得数据多样化又进一步的加深。

  • 场景多样化,传统 Orcale 数据库,主要以增删改查为主,但在物联网时代,需要更多的场景支持,除增删改查外,还需要查询最新值等。


举例来说,一辆汽车的最新位置在哪里?最新车速是多少?昨天从九点到十点的行车轨迹,在轨迹行驶过程中,一共踩多少次油门?这些信息可以作为明细数据查询,当然其他还有维度查询,分析型查询及 Machine Learning 查询等。

“多样化”造就技术栈复杂


数据基座的底层有各种各样的数据,关系数据、 时序数据、GIS 数据、KV 数据还是图数据等,上层是对数据的操作,增删改查、点查询、明细查询等。造就互联网时代众多技术产品出现,不管是 OLTP 产品,还是 OLAP 产品,都是为了一个场景,创建一个数据库去解决它,这样的结果导致技术栈的复杂性。



要解决复杂的技术栈,从各种 DIY 数据库拼搭起来的模式走向 All-in-one 的架构方式,超融合时序数据库 MatrixDB 借鉴奧卡姆剃刀原理:“如无必要,勿增实体”,一个数据库可以完成的事情,就不需要使用其他的数据库处理。


我们的目标是把“极简”、“极速”留给用户,把复杂度留给数据库开发人员。

3、应用赋能,最佳实践


我们正积极探索“智能网联”领域,下面将从数字汽车解决方案、工厂大脑案例,为大家带来多种场景解析。

01. 数字汽车解决方案


近年来,随着汽车行业技术不断取得突破,车联网场景对数据存储性能的要求不断提高,汽车的用户数据,车辆数据,场景数据,该如何进一步实现快速采集、快速拿到和快速进行处理分析,让数据的价值能够挖掘是当前遇到的三大问题。

打通数据链入是基础


数据库是智能网联汽车发展的“基础底座”,再细分的话有两个点。第一点是数据采集链路,如何去打通全链路?没有链路,车上数据发不出来,其实就像一个没有联网的电脑一样。



一张简单的架构图,其实充满很多的挑战,之所以把架构画的如此简单,是因为我们把挑战都压到数据库一侧。


汽车的采集数据频率是不一样的,发动机、电池的采集指标是毫秒级;车速数据是秒级;还有车内温度数据,可能是秒级甚至是分钟级。这些数据以不同的频率,高速实时发布到数据中心,挑战是很大的。


第二点是数据是需要分批的,一次采集 300 个指标,这 300 个指标的价值是不一样的,其中 100 个指标需要秒级使用、实时查询,后面 200 个指标每 10 秒或 1 分钟才发送。这些存在数据库里同一时刻发生的数据,就像一张 Excel 表,都是在一行的,这叫分批上传。


当然,还有乱序延迟数据,一辆车进入无人区,或进入没有信号的车库里,数据上传不了。当从无信号地区进入到有信号地区,需要把这辆车的最新信号实时上传,老的延迟数据会随后发出。这个时候怎么让数据库能够“无缝支持”这些新的指标挑战,我们都可以通过这么一个链条去解决。

这才是整个数字汽车或者是智能网联汽车智能化的一个基础。

数据业务化是关键



有了数据支撑后,从以下四个方面提升业务价值:

  • 充电桩选址:通过每辆汽车每秒钟的位置信息数据,分析出最高效、最经济的地方设充电桩。

  • 后市场服务:以电动和智能为主体的后市场服务,将大量依托数据,提升新能源与智能网联汽车产品的全生命周期。


举例来说,警示灯提示胎压报警,这个时候车主并不知道是气候影响导致的胎压低于阈值,还是因为车辆胎压确实是变低,需要补气。通常油车发生这样的问题需要开到 4S 店处理,而数字汽车有实时数据,可以拿出电话或使用手机查询,查看胎压是否在阈值以上或当前车胎阈值是多少?


车辆的所有数据会实时地传送到数据中心,对主机厂的售后服务人员来提升客户售后的用车体验。

  • 实时报警:车辆的某一些符合指标,连续 5 秒钟高于某一个阈值时会反向报警,反向报警目前更多的是给主机厂自己的售后服务人员。

  • 个性化保险:包括驾驶行为分析用户出行行为分析车辆动态行为分析等。我们与某动力电池头部厂商合作,采集电池的充放电数据,每一周会分析过去 15 天电池的充放电数据,然后产生一份电池健康状况报告,主机厂会依照报告里电池关键信息去处理。比如,99% 的电池非常健康可以继续使用,可能有 100 块电池已经是黄色报警,有 2 块是红色报警,需要去处理。



可以看到,这是 MatrixDB 在主机厂的效果,硬件成本节省 80%,大概节省 800 万的成本,同时我们还将数据延迟从以前高峰期 2 小时缩短到只需要 10 秒钟。

02. 工厂大脑体系架构


制造侧有三大类数据:


第一大类是运营数据像是 ERP ,数据一般是 TB 级的;第二大类是生产制造数据就是 MES ,这两大类基本都是关系数据。随着万物互联的发展,第三类数据就是设备数据,一般一个工厂的设备数据大约是 ~10 万点/秒时序数据。



从设备到 DCS/SCADA 控制层、执行层或者运营管控层,时序数据、结构化数据还是非结构化数据都可以采集到 MatrixDB 里进行实时的分析和实时决策。数据库底层最主要的还是数据采集,一旦数据进入到我们的数据库,剩下的全都是通过标准 SQL 去访问标准。

如何采集底层数据


每一台设备都会变成 PLC、DCS 或者 SCADA 等,通过各种各样的协议对互联网网关采集,然后互联网网关再通过 API 发到 Kafka。我们可以通过 MatrixGate 去消费这些数据,实时记录在秒级毫秒级写入到数据库里面去。


数据库就可以做 BI 报表,做数字化应用,做监控分析,甚至做机器学习和 Machine Learning 等,这是一个基于前面采集的数据做智能设备运维相对比较简单的例子。



使用 MatrixDB 后,工厂大脑方案效果主要体现以下 3 点:

  • 硬件上节省成本:

从硬件节省这么多成本,无外乎有两个原因:

1. 我们看待数据的视角和以前的数据库是不一样的,以前是“用一个产品来解决一个问题”;现在从技术上是“一个产品解决几乎所有数据问题”。

2. 一个 MatrixDB 可以解决过去需要 4-5 个产品才能解决的问题。4-5 个产品至少需要 10 台服务器,而 MatrixDB 只需要 2-4 台就可以搞定,所以从硬件的成本上,效果其实是非常显著的。

  • 性能提升 6 倍

  • 降低人才的门槛,做一个极简、极速的数据库,提供标准接口,只要团队懂 SQL,就可以轻松地玩转大数据。


今天我的分享内容就到这里,谢谢大家。


原文链接


本文为 YMatrix 原创内容,未经允许不得转载。

欲了解更多超融合时序数据库相关信息,请访问 “YMatrix 超融合数据库” 官方网站

发布于: 刚刚阅读数: 2
用户头像

yMatrix

关注

MatrixDB 超融合时序数据库 2021-10-28 加入

全球超融合时序数据库开创者,专为物联网、车联网、工业互联网和智慧城市提供一站式数据平台。

评论

发布
暂无评论
演讲实录|姚延栋:终止“试点炼狱”,智能汽车时代数字化转型与实践_车联网_yMatrix_InfoQ写作社区