写点什么

【for 字节跳动数据平台】数智化转型背景下的火山引擎大数据技术揭秘

  • 2023-08-29
    浙江
  • 本文字数:1835 字

    阅读完需:约 6 分钟

【for 字节跳动数据平台】数智化转型背景下的火山引擎大数据技术揭秘

摘要:线下面基+学习火山引擎大数据技术干货+精美礼品领取!快来报名参与吧!


今年 4 月,火山引擎在上海举办了春季 FORCE 原动力大会,正式提出了“数据飞轮”的数字化建设模式。

现如今,越来越多的企业也正围绕数据进行深度的价值挖掘,用数据全方位地驱动业务增长。如何让数据“说话”,更好的帮助企业实现科学决策,并助力企业完成数字化转型?

9 月 16 日,火山引擎开发者社区 Meetup 第 12 期暨超话数据专场邀请到了火山引擎数据平台的 5 位专家,将从数据分析、数据治理、研发提效等角度,为大家带来干货分享,帮你全面了解数智化转型背景下的火山引擎数据飞轮模式在数据资产建设上的技术与实践。现场更有火山引擎定制双肩包、抱枕、水杯、帆布袋等超多精美礼品,线下参与才可领取哦,期待与大家现场面基!

⏰ 时间:2023/9/16(周六)14:00-17:30

📱形式:线下+线上直播

🚇 地点:深圳市南山区高新南九道深圳湾创新科技中心 2 栋 B 座 F6-31&32(科苑地铁站 C 口步行 340 米)

精彩议程

《DataSail CDC 数据整库实时入仓入湖实践》 李延加|火山引擎 DataSail 高级研发工程师

演讲介绍:在线数据库数据导入到数仓分析的链路已经存在多年,随着近年来实时计算的发展,业务希望有延迟更低、运维更便捷、效率更高的 CDC 同步通道。本次分享主要介绍 DataSail 实现 CDC 整库实时同步的技术方案和业务实践。

主要内容:

  1. CDC 数据同步对业务的价值

  2. DataSail CDC 同步实现技术方案

  3. 业务最佳实践

听众受益:

  1. 了解 DataSail 整库实时同步背后的技术

  2. 了解 DataSail 整库实时同步产品的能力

《火山引擎 EMR 基于 Proton 的存算分离实践 》吴志平|火山引擎 EMR 研发工程师

演讲介绍:基于对象存储的存算分离架构,在提升系统稳定性,提高资源利用率,降低运维成本的同时,在大数据量分析场景下也面临着一些核心挑战:HDFS 与对象存储之间的语义差异;存算分离之后带来的较大性能损耗。

EMR 团队针对这些挑战自研了 Proton 加速引擎,深度优化对象存储读写能力,与 Hive/Spark/Trino 等计算引擎集成后,在不改变用户使用习惯的前提条件下,可提供对象存储数据集的透明加速服务。在离线场景下,其性能基本持平存算一体架构。本次分享将介绍 Proton 技术能力和最佳实践。

主要内容:

  1. 存算分离的挑战以及解决方案

  2. Proton 介绍以及原理分析

  3. Proton 最佳实践

听众受益:

  1. 了解对象存储和 HDFS 的差异

  2. 了解 Proton 的基本能力以及实践方式

《字节跳动基于 DataLeap 的 DataOps 实践》黄虹|火山引擎 DataLeap 产品经理

演讲介绍:随着数字化转型的推进以及业务数仓建设不断完善,大数据开发体量及复杂性逐步上升,如何保证数据稳定、正确、持续产出成为数据开发者核心诉求,也成为平台建设面临的挑战之一。本次分享主要介绍字节对于 DataOps 的理解 以及 DataOps 在内部业务如何落地实践。

主要内容:

  1. 字节数据研发面临的挑战

  2. 字节 DataOps 定义

  3. DataOps 产品化方案

  4. 业务最佳实践

听众受益:

  1. 了解 DataOps 理念

  2. 了解 DataOps 在字节业务的最佳实践

《基于 ByteHouse 引擎的增强型数据导入技术实践》孔柏林|火山引擎 ByteHouse 产品经理

演讲介绍:ByteHouse 基于自研 HaMergeTree,构建增强型物化 MySQL、HaKafka 引擎,实现数据快速集成,加速业务数据分析性能与效率,本次 talk 主要介绍物化 MySQL 与 HaKafka 数据导入方案和业务实践。

主要内容:

1. ByteHouse 数据库架构演进 2. 增强 HaKafka 引擎实现方案 3. 增强 MaterializedMySQL 实现方案 4. 案例实践与未来展望

听众受益:

  1. 了解 Bytehouse 基于引擎层数据导入能力

  2. MaterializedMySQL 和 HaKafka 在业务中的实践

《湖仓一体加速引擎 Bolt 及在 LAS 的应用实践》杨嘉义|火山引擎 LAS 高级研发工程师

演讲介绍:Spark、Presto 等引擎原 Java 执行的性能优化进入瓶颈期,而基于向量化和编译优化的 native 引擎,可获两倍性能加速比,降低资源成本。Bolt 已经在字节跳动内部 SparkSQL、Presto 大规模上线,加速效果显著,其特色有:面向多场景统一加速、端到端向量化执行。本次分享将介绍 Bolt 的意义、架构和在 LAS 的应用实践。

主要内容:

  1. Bolt 的背景和意义

  2. Bolt 的架构设计

  3. Bolt 的核心特色

  4. Bolt 在湖仓一体产品 LAS 的实践

听众受益:

  1. 了解基于向量化和编译优化的 Bolt 加速引擎

  2. 了解 Bolt 在湖仓一体产品 LAS 的应用

扫码立即报名

扫码进入活动群

点击【阅读原文】也可以报名哦~快喊上更多小伙伴一起现场打卡吧!期待与大家深圳面基!

【阅读原文】链接:https://developer.volcengine.com/activities/7269017295253733439?utm_campaign=20230916&utm_content=vedi&utm_medium=os_shujupingtai_nocontact&utm_source=community&utm_term=meetup12


发布于: 刚刚阅读数: 3
用户头像

小助手微信号:Bytedance-data 2021-12-29 加入

字节跳动数据平台团队,赋能字节跳动各业务线,对内支持字节绝大多数业务线,对外发布了火山引擎品牌下的数据智能产品,服务行业企业客户。关注微信公众号:字节跳动数据平台(ID:byte-dataplatform)了解更多

评论

发布
暂无评论
【for 字节跳动数据平台】数智化转型背景下的火山引擎大数据技术揭秘_数据库_字节跳动数据平台_InfoQ写作社区