在线数据迁移,数字化时代的必修课 —— 京东云数据迁移实践
打破数据边界,是数字化时代常挂在嘴边的一句话,数据的价值是在流动中体现的,数据应用也是如此。以往为了满足开发、测试、数据保护容灾和数据分析的需要,我们不断对数据进行复制、备份、迁移,因此数据迁移非常重要。
数据迁移的常见场景
今天我们来重点聊聊混合云时代中数据迁移,先来看看常见的几种企业数据迁移的需求与场景:
传统上云:设备老旧,需要升级,硬件升级性价比不高,云上更经济;
跨云迁移:综合对比多家厂商价格,灵活选型采用成本最优方案;
灾备迁移:需要多云、异构云来架构自己的灾备体系,保证数据的安全;
异地开服:服务不同地域的用户,因各地网络质量不一致需要多云模式用于构建服务本地用户的游戏服务器;
数据安全:要符合金融安全政策的要求,需要数据的迁移。
这些客户都因系统和技术升级、业务发展、以及安全合规等因素采用混合多云的方案,同时对其数据的迁移有着很高的诉求,在不同的业务模式和需求下也会面临多种问题。
数据迁移的困境
数据库的发展多样性提升迁移门槛
在面对关系型数据库与非关系型数据库之间的迁移,关系型数据库 SQL RDBMS 发展久,迁移生态工具齐全,且大部分数据库产品都自带迁移工具;而非关系 NoSQL,数据定义更宽松,产品体积轻量,放弃了一致性校验,导致某些数据结构滥用,提升了迁移难度。而迁移工具大部分开放给生态来做,由于发展时间较短,工具完善度不如 RDBMS 高。
厂商试图“数据绑架”,使迁移雪上加霜
分析完关系型数据库到非关系数据库的发展,可以看到数据存储结构本身已发生了巨大的变化,这从根因上已大幅提升了迁移的难度,而一些云厂商对数据库的再次改造,且对关系型数据库底层改造不透明,导致数据库的复杂性大大加大,试图用数据迁移成本高来长期绑定客户,更是令数据的迁移雪上加霜。
“个体差异”导致通用型解决方案缺失
不同的企业由于自身需求不同与使用场景的多样性,每一个客户,对我们来说都是一个新的案例,我们必须“量身定制”化服务,但在过程中我们也总结出几类常见难点:
难点一:多节点数据库迁移,节点数量不一致
难点二:原生产品跨版本问题,版本不一致且上下版本兼容性不够好
难点三:缓存类数据易失性更高
大规模生产实践,练就京东云数据迁移优势
2019 年京东物流为了实现其轻资产化、降低成本、升级架构的三大目的,将其 ES 开始由本地机房迁移到云上。依托京东云云搜索 ES 高可用、易扩展、近实时等特性,京东物流成功地将分拣中心自动化系统、冷链流程监控系统、开放订单跟踪系统等上百个系统迁移上云。
京东云不仅提供了常规的停机迁移方案,还提供了特殊的不停机迁移方案,保证了物流业务不停服。
不停机迁移方案如下:在云端创建新集群,将云上集群和用户集群合并成一个大集群,利用 Elasticsearch 数据分布 API(cluster.routing.allocation.exclude)将用户集群中的索引数据迁移到云上集群的数据节点,最后将用户集群和云上集群构成的大集群拆分,关闭用户集群即可完成迁移。(采用这种方式须注意同时满足以下两个条件:用户集群版本和云上集群版本相同;用户集群所有节点和云上集群所有节点网络能够互通。)
通过上述方法,很快就就完成了京东物流近百个系统的数百个集群、数千个节点数据上云工作。在此之上京东云还配套提供了一键报警等核心功能,对上云工作进行全天候、全方位的保障。截止目前,京东物流已有超过 90%的应用在公有云上部署了实例,去年 11.11 期间业务量超过日常三倍以上的情况下,整体运营平稳。
“对症下药”,自研关系型数据库迁移利器—— 数据传输 DTS
关系型数据库依然是各行业的主流应用之一,怎样更快的将传统关系型数据中的数据迁移上云也是很多行业用户关心的。为此京东云特意打造了一款针对关系型数据库的迁移工具——数据传输 DTS。
数据传输 DTS 提供实时数据流服务,支持数据迁移、数据订阅和数据同步服务,可简单方便的满足数据上云、业务异步解耦、数据异地灾备、业务系统数据流转等业务场景。目前数据传输 DTS 支持 MySQL、MariaDB、Percona、SQL Server、PostgreSQL 等多种数据库迁移,可以简单快速地将本地自建数据库迁移至京东云,源数据库在迁移过程中可继续正常运行,从而最大程度地减少应用程序的停机时间。
自研 RedisSyncer 在线迁移工具,打造在线迁移优势
Redissyncer1.0:贴近需求,技术创新
某家在线广告公司需要将 Redis 从自有机房迁移到云上。客户系统承载着大量结算缓存和业务缓存,要求在迁移过程中不能有业务中断。当时有一些开源工具,但是不满足要求。主要是由于版本问题,客户用的 Redis 版本是 4.0 而当时开源的工具只支持 3.28 及以下版本。本着京东云客户业务为先的原则,和鼓励创新的技术精神,我们思考,能不能为客户自研一套工具,能够 Cover 住 Redis 数据流转大部分场景的通用工具,于是 2019 年 7 月 Redissyncer 1.0 版本诞生,并持续经历几个行业的应用实践:
互联网行业用户,Redis 单实例,数据体量不大 20Gb 左右。通过启动参数修复、调整每批次 Value 值等细节优化顺利完成了迁移任务;
游戏行业的用户,用户需要将自有 IDC 中的 Redis 迁移到京东云。在使用我们的产品之前,用户自己找过若干开源产品但都不符合要求。由于用户的实例数量较多,在了解过 Redissyncer 产品特性后,用户决定使用我们的工具自行迁移。
Redissyncer2.0:多场景历练,满足多类需求
在剖析过更多客户痛点与需求后,2019 年 11 月底,Redissynce2.0 版本升级。完善了同步模式拆分、断点续传、离线文件加载、跨版本迁移、流式加载等功能。
金融用户。用户需要将原生 Redis 集群迁移到自研的 Redis 集群。目标集群节点数多大 16*2 即 16 对主从构成的集群,迁移过程很顺利,经过准备 15 分钟完成应用割接。
Redissyncer3.0:精益求精,更好体验
持续经过严苛生产场景的打磨,我们陆续修复了一些测试中很难遇到的 bug,添加了一些新特性。使得产品不仅支持升级迁移同时支持降级迁移;为了提高用户体验,我们参考 Redis、MySQL 等优秀开源产品的方式做了一个命令行客户端命名为 redissyncer-cli。至此,完成了 Redissyncer3.0 的升级,这个项目的体系建设基本上可以满足 Redis 迁移同步场景中的大部分需求了。
拥抱开源,开放共进
目前京东云已经积累了覆盖互联网、游戏、金融、物流、零售等多场景领域的迁移经验。随着混合多云趋势到来,我们深知用户迁移之苦,也愿意以兼容开放的心态为客户提供技术服务,真正做到把选择权交给用户,同时为了让更多人享受技术带来的便利,我们在今年决定将自研 Redissyncer 完全开源,将技术回归社区,给更多用户和开发者带来便利!
🔗开源地址:https://github.com/TraceNature/redissyncer-server
推荐阅读
欢迎点击【京东科技】,了解开发者社区
更多精彩技术实践与独家干货解析
欢迎关注【京东科技开发者】公众号
版权声明: 本文为 InfoQ 作者【京东科技开发者】的原创文章。
原文链接:【http://xie.infoq.cn/article/421c5363fb788543b99441354】。文章转载请联系作者。
评论