写点什么

数据平台

0 人感兴趣 · 27 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/f6/f63c25ded3f26f28ecb9710e304d0c17.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

企业级数据平台云原生转型之路

用户头像
KubeData
2023-12-31

在没有大数据生态之前,企业内部大多数据量沉淀是有上限的,大多数的企业报表分析通过Excel、Mysql、SqlServer就可以满足相关的业务分析,随着互联网的蓬勃发展以及移动互联网浪潮的冲击下,数据量呈现了指数级的增长趋势,在原有的技术实现路径中已经无法满

https://static001.geekbang.org/infoq/97/97e777300451944737491064cc2525ec.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据飞轮拆解车企数据驱动三板斧:数据分析、市场画像、A/B 实验

近日,火山引擎数智平台(VeDI)2023数据飞轮汽车行业研讨会在上海举办,活动聚焦汽车行业数字化转型痛点,从字节跳动自身数据驱动经验、数据飞轮模式落地、企业侧场景实践三方面,诠释数据飞轮如何在汽车行业转活数据消费。

https://static001.geekbang.org/infoq/9d/9d5f279a3933353b4758f396f6c1e118.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

聚焦私域营销降本提效,国联股份与火山引擎数智平台展开合作

北京国联视讯信息技术股份有限公司与火山引擎数智平台VeDI的合作进入新阶段,双方将继续聚焦国联股份自建的数字营销平台「国联云销通」,在市场数据洞察和数据实时计算两方面开启新探索。

火山引擎 DataLeap 的 Catalog 系统搜索实践(三):Learning to rank 与后续工作

Learning to rank主要分为数据收集,离线训练和在线预测三个部分。搜索系统是一个Data-driven system,因此火山引擎DataLeap的Catalog系统设计之初就需要考虑数据收集。收集的数据可以用来评估和提升搜索的效果。数据收集和在线预测前面已有介绍,不再赘述,

火山引擎 DataLeap 数据调度实例的 DAG 优化方案 (一):问题与需求分析

DAG:全称为 Directed Acyclic Graph,指有向无环图,具备严密的拓扑性质,有很强的流程表达能力。

看火山引擎 DataLeap 如何做好电商治理(一):挑战与痛点

现在人们的日常生活中,网购已经成为人们生活中不可或缺的购物形式。根据中国电子商会发布的《中国社交电商行业发展白皮书(2022)》的数据显示,2022年社交电商市场交易规模达到28542.8亿元,预计2023年中国社交电商行业交易规模将达34165.8亿元。

https://static001.geekbang.org/infoq/d0/d0181a044e28d880f2005a914ed962f7.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

企业级统一数据平台建设思路

用户头像
星环科技
2023-04-27

由于企业的业务系统信息化的分阶段建设、以各自业务为导向等原因,每个业务都积累自身的数据,形成一定的数据孤岛。而数字化转型的一个核心就是以数据为抓手来打通各个不同的业务,以数据驱动辅助经验主导的流程来辅助业务,因此需要企业建成一个统一的、可共

https://static001.geekbang.org/infoq/31/31361fb4706db9a252cd0d34cd5f5a39.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

火山引擎 VeDI 零售行业解决方案 聚焦精准营销场景提升品牌转化

在3月刚结束的第8期火山引擎数智平台VeDI「增长课堂」活动上,火山引擎数智平台介绍了面向营销场景的“达人直播优选”场景的解决方案,帮助品牌商从数据角度出发,挖掘商品与直播间的最强关联点,并以此为基础驱动品牌实现商品与直播间的精准”人-货“匹配。

https://static001.geekbang.org/infoq/c5/c50e43eb7b775ab3090d0de50a55c5f4.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

从银行数字化转型来聊一聊,火山引擎 VeDI 旗下 ByteHouse 的应用场景

作为火山引擎数智平台VeDI旗下核心数智产品之一,ByteHouse起源于字节跳动的内部数智实践,并于2021年8月正式外对发布,随后在12月发布数仓版本。

https://static001.geekbang.org/infoq/7d/7d6b8741bf1a124c32c1335b8223cdf1.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

火山引擎 ByteHouse 助力中国地震台网中心,快速构建一站式实时数仓

近日,中国地震台网中心与火山引擎达成合作,双方将围绕ByteHouse实时数仓展开合作。

https://static001.geekbang.org/infoq/4c/4c1d844f764026a58f5e8884a2d56acf.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据治理的核心:大数据开发平台

用户头像
Taylor
2022-11-13

数据开发平台是企业级大数据平台的核心内容之一,本文主要讨论下如何搭建基础形态的数据开发平台。

https://static001.geekbang.org/infoq/ac/ac7cd20a9612b6aba3fdc31edb4945ef.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

基于 HDP 构建企业数据平台

用户头像
Bright
2022-10-16

本文简单介绍了如何基于 HDP 来构建企业数据平台,包括一些 HDP 相关软件系统的基本介绍及我们项目上的具体技术选型。从企业数据工作流程的角度阐述如何在基础数据平台上面构建适合自身的工作流程。有了基础数据平台及数据工作流程定义......

https://static001.geekbang.org/infoq/3a/3ac12d548d369bb48d877708acd40283.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据中台与数据平台有什么区别?

用户头像
雨果
2022-09-28

从某种意义上来说,数据中台是“平台思维”的自然演进,比如很多人认为今天许多企业的中台都是之前一些平台化的升级版,但是他们与数据平台还是有本质的差别。

https://static001.geekbang.org/infoq/e3/e3df86c86569d1d890157dc37a415f33.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

InfoWorld 文章丨将数据编排技术用于 AI 模型训练

用户头像
Alluxio
2022-08-25

当进行AI模型训练时,我们需要高效的数据平台架构来快速生成分析结果,而模型训练在很大程度上依赖于大型数据集。执行所有模型训练的第一步都是将训练数据从存储输送到计算引擎的集群,而数据工作流的效率会大大影响模型训练的效率。

https://static001.geekbang.org/infoq/d3/d3bb69c49256ab9d877f75a54334d3e4.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

一些企业数据平台建设的思考

用户头像
Bright
2022-07-28

本文首先讨论了什么是数据平台这个问题,尝试回答了数据平台的定义和功能范围。接着,结合作者本人所经历过的数据项目经验,对建设企业数据平台的思路进行了一定的梳理。

https://static001.geekbang.org/infoq/42/42e5dbc40a956be986d357287034377a.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Snowflake vs. Databricks 谁更胜一筹?2022 年最新战报

用户头像
雨果
2022-07-27

导读:Snowflake 和 Databricks 都是广受好评的数据平台,但哪一个最适合您的业务?这篇将逐一对比谁更胜一筹。

制造业企业数据平台建设最佳实践分享

分享华为云在制造领域里建设数据平台的最佳实践,帮助企业解决在数字化转型中面临的挑战,并结合华为云数据平台架构设计和数据应用等方面的丰富经验,助力企业挖掘数据价值、驱动数字化转型、创造发展新机会。

https://static001.geekbang.org/infoq/1c/1cabab4b8750a3ba22b42c93d2458f91.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

来了来了!MatrixOne 技术架构详解来了!

用户头像
MatrixOrigin
2022-03-18

​前一段时间在知乎上有个小伙伴吐槽说已放弃阅读MatrixOne源代码,想必是对MatrixOne的代码可读性与解释文档的缺乏不太满意。确实,MO在这些方面还需要做很多改进工作,作为一个开源项目,良好的代码和文档可阅读性是让大家来参与的基础。

https://static001.geekbang.org/infoq/46/46c5a43628ce27872467d55eb684d7da.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据服务系统 0 到 1 落地实现方案

2021-11-14

数据服务通常有很多种业务模式,也就导致系统的架构与业务都会很复杂,不同的业务都具有自身的能力和复杂度。

https://static001.geekbang.org/infoq/19/19ef9c85e069523ef834d3fffbd57330.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

现代电信企业:极低延迟与复杂决策如何兼得?

用户头像
VoltDB
2021-05-08

我们面临着这样的难题:这些系统需要做出复杂的决策,且要以极低延迟的方式做出决策。

https://static001.geekbang.org/infoq/8b/8b9af8ecc8d3278eed253b0520e960ce.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

随笔文,关于”中台“ 的一些“小偏论”

这是一个随笔,也是回答几个“中台” 直播的几个问题与仅代表个人的观点

https://static001.geekbang.org/infoq/08/08aa906b3b6036f90d9dcdc7f10cebe8.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

大数据平台架构设计探究

本文介绍了一些数据平台设计思路来帮助业务减少数据开发中的痛点和难点。

https://static001.geekbang.org/infoq/f8/f8d65bd5195d247d4ffa27874af881bf.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据治理第一步,摆脱“手工作坊”

用户头像
KAMI
2020-08-15

目前绝大部分数据的生产模式,本质上就是个“手工作坊”。不摆脱“手工作坊”模式,数据治理往往沦为规范和工具的无效堆叠,达不到预期效果,甚至失败。摆脱“手工作坊”模式,关键是不要再依靠个体把控流程和质量的把控。

数据平台_数据平台技术文章_InfoQ写作社区