深度解析智能运维场景下“港口行业”解决方案
行业趋势
基于十四五对“新基建”的要求,结合我国港口发展的阶段性特点,目前智慧港口建设可分为三大方向。一方面是以 5G 通讯、物联网等新一代信息技术与港口服务深度融合,大力发展智能港口基础设施,生产智能自动,做强智慧港口的“信息基础设施”;另一方面是通过区块链、数据分析等技术应用,实现港口要素自我感知、广泛互联,港口运营决策客观智慧,客户服务敏捷高效,搭建智慧港口“服务平台”,做优智慧港口的“融合基础设施”;第三方面是基于港口各种资源、技术、服务、管理深度融合,实现开放共享、系统高效、绿色环保、可持续发展的现代化港口形态,做新智慧港口的“创新基础设施”。
“十三五”期间,全国港口重点围绕港口作业自动化、港口陆运业务协同、信息互联共享、港口物流链、创新技术应用五大方向发展转型,智慧港口工程建设在全国有序开展。
2019 年 12 月 1 日起,网络安全等级保护 2.0 相关标准正式实施。标准强调实现对新技术、新应用安全保护对象和安全保护领域的全覆盖,强化“一个中心,三重防护”的安全保护体系,这无疑对港口信息系统运维保障工作提出更高要求。
当前港口行业信息现状可体现为以下几点:
港口对外服务:在该平台完成全部港外物流、港内物流、通关、交易、货运自动化、行政服务等相关港口业务办理。
港口生产综合管控:实现港口商务、总调度及各码头调度、堆场库场、设备管理维护维修、车队车辆、船舶管理、泊位航道管理、安全生产、能源能耗、计费结费、气象水文、日常办公等全过程的自动化一体化管理。
码头智能化自动化作业:实现码头现场作业的自动化智能化,对作业的各机械设备、车辆、船舶、货物、磅场、库场、卡口、作业人员、生产安全、联检等作业的智能化自动化管理。提供各类作业人员智能终端、机械作业数据自动采集终端、机械自动化控制终端等。
港口安全监管及应急指挥:实现港口安全监管、危险源主动防控、突发事件处置、应急指挥通信、安全监控预警、安全巡检、应急事件的实时发布、应急通信等综合安全监管应急指挥平台。
港口行政管理:主要针对港航局,提供港口政务管理,包括行政许可申请、审批、行政执法、政令发布、公文下达流转等。提供移动 APP、行政执法终端等。
现有信息化系统集成:实现对港口已有各类信息化系统集成到一体化平台。
港口大数据分析:实现对港外客户、港内生产、国内外港口及相关行业等各方面的信息数据资源收集和分析,建立大数据平台。利用数据挖掘、模型分析等技术手段,丰富大数据分析应用服务,实现多种数据源的访问、决策支持智慧化。
口岸通关一体化对接:船舶联检一体化,在口岸业务网上申报基础上对接口岸系统,实现海关、检验检疫、海事、边检等部门跨部门数据共享、监管互认。代理企业可一次性录入申报信息,分别发送到各家联检单位系统,“一单多报”。
网上结算及货运担保:提供网上金融结算、货运担保等业务,开启多种网络支付模式,与保险公司打通接口,一站式购买保险,实现港杂费结算。提供金融、保险资源查询、移动支付等。
港口增值服务:基于港口资源,实现跨境电商、港口金融、港口社区、大数据服务等增值服务。跨境电商:提供针对性的特色跨境电商。港口金融:为各类金融资产提供从登记、交易到结算的全程式服务,推出基于港口优势的金融创新产品,向贸易型和金融型转变。港口社区:为来港客户、承运人、码头企业、公众等相关群体提供港口交通、旅游、购物、餐饮、住宿、教育、金融等智慧社区服务。
挑战分析
现如今,随着港口信息化的快速发展,港口行业 IT 运维保障工作同时也面临着来自政策、监管、用户体验、上级领导等方面的标准升级,从而导致运维保障工作的挑战加大。具体包含以下几方面:
人工巡检缓慢,集中管理困难;
业务系统繁多,流程关联紧密;
安全标准提升、安全防护面广;
业务应用新增,基础适配承压。
解决方案
云智慧作为国内领先的“全栈智能业务运维解决方案服务商”,经过多年自主研发,为金融、政府、运营商、能源、交通、制造等数十个行业的客户提供“数字化运维体系建设+全生命周期运维管理”解决方案。包括围绕业务特色打造行业场景的数字化业务的运维管理(Biz Ops); 围绕用户体验进行风险防控的数字化应用系统的运维管理(App Ops);围绕 IT 基础设施保障的数字化基础设施的运维管理(Infra Ops)。
与此同时,为充分发挥 IT 服务管理的效能,云智慧将智能运维演进路线从 Level 0 到 Level 5 分为 6 个阶段,即人力运维、辅助运维、一体化运维、初步智能化运维、高度智能化运维以及完全智能化运维。目前港口行业运维则基本处于 LEVEL0-LEVEL1 之前,具体如下图所示:
行业应用场景
云智慧提供面向“智慧港口”领域的一体化智能运维解决方案,包含全面监控、智能预警、精准定位、高效派单、规范变更、科学处置等优势。
解决路径方面主要包含全面集中管控、安全稳定运营、全景态势分析、实时精准告警、科学服务管理等主要场景的解决方案。
全面集中管控
全景监控方面,云智慧通过 Agent、SNMP(V1、V2、V3)、WMI、SSH、Telnet、IPMI、ILO、北向接口、串口、ODBC/JDBC、自定义 SQL、URL、WMI、Java 等连接等方式对上百家厂商的服务器、网络设备、操作系统、存储、虚拟化、中间件、数据库、Web 服务等资源的配置数据和指标数据进行统一采集。此外,云智慧拥有成熟的建模能力和指标采集适配能力,为多类型设备全方面运维管控提供强有力的数据源支撑。提供集群化采集能力,扩展监控规模,实现监控系统高可用性。
资源配置管理方面,配置资源图谱故障场景主要是依托 CMDB 的层级拓扑,对故障 CI 进行定位。打通事件与 CMDB,将 CMDB 中的相关 CI 关键属性信息,如 IP 地址、主机名、应用标识、负责人、电话、资源的所属位置等相关信息丰富到告警事件中,加强告警的易读性和准确性。此外,通过告警生成工单,在处置过程中通过关联 CI 保障数据的准确性,对故障进行闭环管理,加强 CMDB 配置数据的流动性和唯一性。最终实现通过配置资源图谱拓扑可视化能力,帮助运维人员对故障进行根因分析、故障自动处置,以快速恢复业务。需注意,CMDB 的资源层级拓扑与 DOEM 的互通,另一方面通过 DOSM 做资源的管控,保障数据的准确性以及对故障进行闭关管理。
监控状态管理方面,云智慧支持对业务服务器、数据库、中间件等离散的系统资源统一纳管,全年 365 天 7*24 小时实时展示各项资源和应用系统的整体运行情况。可基于系统架构构建系统资源的层级化拓扑, 便捷查看上下依赖关系,例如应用所依赖的容器、虚拟机。此外,拓扑节点的颜色展示了各对象的健康程度,使原来错综复杂的运维管理工作变的简单和轻松。
告警管理能根据告警相关的基本规则,通过自动学习算法能力,如:集群合并、IP 合并等将同一时间内与该告警相关联的其他告警进行了聚合。通过对告警的智能分析,企业可以避免无效告警、告警风暴的发生,以快速对故障的排查和定位,全面提升告警管理能力。
安全稳定运营
系统性能分析方面,云智慧基于端到端的服务请求链路细化追踪、分析代码及 SQL 执⾏性能,提供了应用拓扑及代码层事务追踪。针对单次请求,云智慧通过基本信息和业务拓扑发现潜在问题,追踪慢元素和堆栈详情,分析错误和异常信息及堆栈,以及分析 SQL 语句、API 调用与请求参数等执行情况。
系统日志审计方面,主要依托云智慧在智能算法、日志分析方面的能力,帮助港口在业务系统运维监控方面做好事前预防工作,以此降低问题发现和故障排除的时长,从而提升异常检测的准确率。 日志分散在各类服务器主机、容器、网络设备中时需通过 CDC 进行日志的采集,采集对象是 IAAS 层所有设备。
自动巡检方面,为预防运维事故的发生,企业运维人员需每天对大量设备逐一巡检。在传统运维模式下,运维人员必须依次登录设备完成巡检,该操作不仅需要耗费大量时间,而且手工操作的方式也更容易出错。 通过云智慧自动巡检,企业可快速聚焦问题以提升效率。
全景态势分析
下图为云智慧全栈式监控场景,它能够对 IDC 基础设施到上层业务的全方位监控:包括面向机房动力环境设施、服务器硬件、操作系统、网络、应用、业务等运行健康度状态以及性能状况进行实时监控与管理。
此外,平台可提供有代理(即 Agent)、无代理(即 Snmp、Wmi、Syslog、Jdbc 等协方式)两种监控方式,当代理采集的监测指标无法满足企业监控需求时,企业可以通过云智慧产品提供的开放采集能力,开发相关指标来满足自身个性化的监控需求。目前云智慧企业客户数据中心均是两地三中心模式,为满足企业业务的连续性,云智慧提供分布式、跨中心的部署,来满足企业多中心监管需要。
科学服务管理
企业要实现运维问题快速、有效的处置修复,必然需要基于科学化的 IT 服务管理体系。云智慧是通过 AXELOS(ITIL 版权所有方)认证的中国首家官方授权的 IT 服务管理咨询合作伙伴 (ACP)。这意味着行业内,云智慧将能为有意愿引入 ITIL 的企业提供更加权威的 IT 服务管理咨询与服务,并进一步加强该理论的本地化实践。值得一提的是,云智慧现有产品框架也是遵循新一代 ITIL 理念打造的。
智能客服:利用自然语言识别技术,帮助用户解决常见问题,快速响应用户的同时极大减少运维工程师工作量。
坐席监控:可实时查看坐席的接待数、对话数、平均响应时间、平均对话时长、消息总数等信息以及某个坐席的详情数据。
移动提单:灵活对接企业微信、钉钉等企业 IM 以及企业客户自有 APP,支持用户通过移动端访问智能客服和在线服务台,支持用户自助提交工单、查询工单处理进度。
服务目录:提供服务目录的统一定义和管理功能,为企业的服务提供一致准确的信息源,为其他服务管理活动提供支撑。
流程表单:提供可视化工单流程定义面板、丰富的可视化控件和功能强大的表单设计器,能够满足各种场景下工单定制的要求。
知识库链接:平台内置大量知识条目,集中管理历史沉淀文档及常用场景知识,便于知识应用即查即用,提升问题解决效率,减少对专业人才的依赖。
工单看板:对 IT 服务管理中涉及到的各类工单数据进行直观监测,实时展示服务风险点、服务质量、服务效率以及服务水平,帮助管理层从全局视角对 IT 服务的质量进行感知与管控。
一体化智能运维解决方案
云智慧遵循以数据为基础、以算法为支撑、以场景为导向的核心理念,应用先进的实时大数据处理和机器学习技术,结合行业经验的最佳实践,帮助用户建立贴合实战的全栈数字化运维管理体系。在保障业务连续性的同时,赋予业务快速迭代和创新能力,从而带来业务与 IT 管理效能的提升。
案例分享
某港口集团 IT 智能统一运维项目
项目背景
某港口已在数字化转型方面取得了可喜成绩,但随着业务规模扩大,港口企业业务需求逐渐增加,因此造成了企业运维管理复杂度增加,现有监控工具不能满足发展要求。企业需整合现有监控工具的指标数据,构建运维数据中台,优化监控工具,结合智能化的技术手段,保障业务应用的稳定、高效和发展。
现状痛点
系统问题定位困难:系统性能明显下降,且受系统架构局限(异构、分散),从而无法保障系统间(尤其异构系统间)文件互通稳定,无法有效提升性能;
缺乏统一数据分析:当前运维系统能力弱,团队对系统可控性不高;分散分权管理,难以快速有效地实现用户需求及问题处理。
方案亮点
全覆盖监控:扩大基础层面监控范围,弥补应用性能监控和日志监控,实现监控工具全面覆盖;
建立指标体系:打通各类筒仓数据,实现监控中心统一数据分析及驾驶舱可视化展示;
初步智能化建设:利用算法平台能力实现一定的单指标异常检测等场景。
实现价值
促进多部门协同协作:实现联响中心、运保中心、软研中心及各业务部门统一视角进行系统运维,从而提升企业运维效率;
助力企业智能化运维建设:助力建设一套适合该港口集团“新运维”的运维数据中台,结合算法能力,助力企业迈向智能化运维领域。
某港口集团智能监控案例
项目背景
某港口地处浙江南部、东南沿海黄金海岸线中部,是中国二十五个主要港口之一,是中国的重要枢纽港。
现状痛点
缺乏基础监控:该港口业务稳定且高速发展,但是对于基础设施软硬件以及动环设备缺乏统一的管理;
动环监控:下属多个点位机房缺少动环监控和平台。
方案亮点
统一监控:助力建设整套统一监控平台,包含基础设施、动环设备、虚机等,软硬件结合统一监控;
告警抑制:对所有告警进行优化,从而提升港口效能。
实现价值
统一监控:一个平台,一套系统。
告警管理:告警统一管理。
状态展示:仪表盘展示所有基础设施监控状态。
FlyFish 开源福利
云智慧已开源数据可视化编排平台 FlyFish 。通过配置数据模型为用户提供上百种可视化图形组件,零编码即可实现符合自己业务需求的炫酷可视化大屏。 同时,飞鱼也提供了灵活的拓展能力,支持组件开发、自定义函数与全局事件等配置, 面向复杂需求场景能够保证高效开发与交付。
如果喜欢我们的项目,请不要忘记点击下方代码仓库地址,在 GitHub / Gitee 仓库上点个 Star,我们需要您的鼓励与支持。此外,即刻参与 FlyFish 项目贡献成为 FlyFish Contributor 的同时更有万元现金等你来拿。
GitHub 地址: https://github.com/CloudWise-OpenSource/FlyFish
Gitee 地址: https://gitee.com/CloudWise/fly-fish
版权声明: 本文为 InfoQ 作者【云智慧AIOps社区】的原创文章。
原文链接:【http://xie.infoq.cn/article/9da0840fc5b4900cd6bbd282b】。文章转载请联系作者。
评论