写点什么

任务分级技术:突破数据分层 / 加载场景下性能瓶颈

作者:焱融科技
  • 2024-05-24
    北京
  • 本文字数:1686 字

    阅读完需:约 6 分钟

任务分级技术:突破数据分层/加载场景下性能瓶颈

随着云计算和大数据的快速发展,分布式集群已经成为处理大规模数据和高并发需求的关键架构。然而,在分布式集群中,一个节点的 IO 延迟可能会导致整个节点的服务下降,进而影响整个集群的性能。

这一点在智能分层/数据加载场景中尤为突出,由于读写操作需要与对象存储频繁交互,对象的性能和网络的稳定性会极大地影响整个集群的性能。

本文将提出一种创新性的解决方案——任务分级技术,以有效解决分布式存储集群中的性能与可靠性挑战。


PART 01 对象存储如何影响集群读写性能


在分布式集群环境中,当某个节点出现 IO 卡顿时,由于系统资源的有限性,整个节点的服务性能可能会下降。不同于硬件故障导致的正常场景下的性能下降,智能分层/数据加载场景下的读写操作需要与对象存储进行交互,这使得单点慢问题更加突出。

智能分层数据如果长时间不访问,会下刷到对象存储,此时如果用户去访问这部分数据,读写需要从对象存储拉取数据到本地。智能分层场景下 YRCloudFile 读取对象存储的单位大小默认为 1M,这是一个比较均衡的数值。如果使用高性能的对象存储服务,网络带宽足够,那么读写一个 1MB 的文件应该非常快,可能只需要几毫秒的时间,这个延迟可以满足基本上大多数的业务。

然而,在实际业务场景中,读写时间可能会受到多种因素的影响,如网络状况、对象存储服务的性能和负载情况等:在某些情况下,读取一个 1MB 的文件可能需要几百毫秒甚至几秒钟的时间。这种情况下,性能瓶颈可能会占据线程池的大部分资源,进而影响非对象存储的请求处理。

在另外一些情况下,一套 YRCloudFile 集群往往会对接多个对象存储,对象存储之间的规格差异(包括存储介质、网络质量、节点配置等)往往会导致明显的 IO 延迟差异,且对于并发的容忍度也会有很大的差异。这就导致,当集群中出现高延迟的对象时,它会显著地制约低延迟对象存储的分层性能表现。

因此,在智能分层/数据加载场景下,部分 IO 慢可能会导致整个集群性能下降,这在实际业务过程中是一个普遍且严峻的问题。


PART 02 任务分级技术,高效解决问题


任务分级技术的核心思想是实现任务的有效隔离,以确保不同优先级任务在各自独立的线程池中执行。具体而言,高优先级任务被放置在专门设定的高级任务线程池中,确保其得到及时响应,并且执行过程不受低优先级任务的干扰。相对应的,低优先级任务则被分配到另一独立线程池中进行处理。

任务分级技术的应用在智能分层/数据加载场景中,能够显著缓解性能瓶颈问题:高优先级任务线程池的存在保证了关键读写请求的及时响应,保证关键数据的及时性和可用性;低优先级任务线程池可以处理非关键的读写请求,最大限度地利用系统资源,进而提升整个分布式集群的吞吐量。

这种分级处理机制有助于实现更优化的资源分配和任务管理,以满足不同业务场景下的性能需求。


PART 03 如何去做任务分级


我们将任务划分为三个等级,这一分级设计是基于任务的性能表现来进行区分的,旨在更高效地利用资源,并确保关键任务获得优先处理。每个任务等级都拥有独立的线程池,实现了资源上的完全隔离,并且可以动态调整资源分配。

01 高优先级任务

这类任务的特点是它们不与对象存储进行交互,其平均延迟是可控的。

02 中优先级任务

这部分任务会与对象存储交互,但是对象性能比较稳定,大多数有关对象存储的请求会在这个等级。

03 低优先级任务

这部分任务在与对象存储进行交互时,可能会表现出延迟不稳定、IO 时间长等行为。这类任务可以由手动指定,或者由系统自动判断并归类。在正常情况下,大多数任务不会落入这个等级。然而,在对象存储出现故障或介质性能降低的情况下,一些任务可能会被自动降级到这个等级。

综上所述,智能分层/数据加载场景下的 IO 卡顿问题是分布式集群中常见的挑战,对整体性能产生直接影响。通过运用任务分级技术,结合其他针对性措施,我们能够有效缓解这一问题,进而提升分布式集群的整体性能和可靠性。这一方案有助于更精细化的资源管理与任务调度,确保关键任务得到优先处理,资源得到高效利用

未来,我们将持续致力于分布式集群性能问题的深入研究和优化工作,不断推动技术创新,为用户提供更高效、更稳定的分布式集群服务,满足不断增长的业务需求。

用户头像

焱融科技

关注

软件定义的混合云统一文件存储 2020-05-29 加入

焱融科技是一家以软件定义存储技术为核心竞争力的高新技术企业,基于软件定义的混合云统一文件存储为企业客户提供高效存储、数据管理和应用服务,打造面向云+AI 时代的高性能存储。

评论

发布
暂无评论
任务分级技术:突破数据分层/加载场景下性能瓶颈_数据分层_焱融科技_InfoQ写作社区