写点什么

大数据分析

1 人感兴趣 · 16 次引用

  • 最新
  • 推荐

火山引擎 DataLeap 的 Catalog 系统搜索实践(三):Learning to rank 与后续工作

Learning to rank主要分为数据收集,离线训练和在线预测三个部分。搜索系统是一个Data-driven system,因此火山引擎DataLeap的Catalog系统设计之初就需要考虑数据收集。收集的数据可以用来评估和提升搜索的效果。数据收集和在线预测前面已有介绍,不再赘述,

https://static001.geekbang.org/infoq/9a/9ae005ead5f3c1f34e08d2f0f190f107.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

北京 Meetup 邀你来|云上 StarRocks 极速湖仓

4月19日(周三)下午,水滴筹、猿辅导、阿里云 EMR 团队和 StarRocks 社区的技术专家,将针对开源 OLAP 技术架构、 StarRocks 产品硬核技术及 EMR StarRocks 实战经验等一系列超干货内容。

https://static001.geekbang.org/infoq/0a/0a46f2bd8f0b1e710ff8160e0bc2de6c.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

即刻下载|连锁零售数字化转型难?领先企业实践助你打开新思路

基于多年来服务连锁餐饮、零售等行业的经验与实践,领先的大数据分析和指标平台供应商 Kyligence 特别推出《连锁零售指标中台精选案例集》,收集了多家领先企业基于 Kyligence 产品搭建指标中台、构建统一数据分析和管理平台的真实案例。

https://static001.geekbang.org/infoq/79/79ba7377f5cad35287373701d4224038.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

跬智信息全新推出云原生数据底座玄武,助力国产化数据服务再次升级

2月28日,跬智信息(Kyligence)宣布全新推出国产化云原生数据底座开源项目玄武(XUANWU),以助力企业加速数据平台上云,并实现国产化升级。

https://static001.geekbang.org/infoq/f0/f0384c3e7ab45e86a159c976fa4bf253.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Python 数据可视化:数据分布图表可视化

数据分布型图表主要显示数据集中的数值及其出现的频率或者分布规律,包括统计直方图、核密度曲线图、箱形图、小提琴图等。

https://static001.geekbang.org/infoq/df/dfc9ce7261e96ef222cb5877cc4bc770.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

ClickHouse 在自助行为分析场景的实践应用

本文将分享MPP主流框架lickHouse在自助分析场景中的探索及实践,包含:自助分析场景OLAP技术选型、高斯平台自助分析场景、ClickHouse的优化实践、ClickHouse未来规划与展望

https://static001.geekbang.org/infoq/2f/2fa692dc8209ddb535babd732407fb1a.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

炎凰数据完成超亿元 A1 和 A1+ 轮融资,推出异构数据即时分析平台

用户头像
晨山资本
2022-11-23

「炎凰数据」专注异构数据处理,致力于打造新一代异构数据即时分析平台。

https://static001.geekbang.org/infoq/18/18d4557fce2df5d793590217283cf571.gif?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

淘宝大数据分析案例(百万数据集 Hadoop 项目)

用户头像
王小王-123
2022-06-29

本次结合的是一份淘宝大数据数据,数据集的大小共177MB,数据一共有3182261份(三百多万份数据集),一般的软件是无法计算和分析的,比如Excel,MySQL,Python这些都无法较好的完成相关数据分析。

https://static001.geekbang.org/infoq/37/379897483fa59e00f4104e92e4e20c33.gif?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

基于学生选课数据库分析(Hadoop 实验)

用户头像
王小王-123
2022-06-29

前面我们介绍了Hadoop环境下,分析淘宝大数据案例的过程及方法,根据分析效果还不错,实验效果也体现了大数据的数据集大的一个特点。本次实验我们假设了一个实际场景:假设现在有一个省份的学生选课数据需

https://static001.geekbang.org/infoq/18/18d4557fce2df5d793590217283cf571.gif?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

淘宝数据可视化大屏案例 (Hadoop 实验)

用户头像
王小王-123
2022-06-29

身处大数据时代,每一天都在产生数据,对于数据的应用是每一个行业的最基本的要求,也是他们立足和竞争商业世界的必要手段。在这个“化数为金”的时代,对数据的敏感程度不仅仅是那些专业人士的目标所向,而是对于每一个人的挑战与机遇。数据分析已经成为21世

https://static001.geekbang.org/infoq/70/7035c0a2dcf1302dcbb22086b5ca86dd.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

关河因果将机器学习融合逻辑规则,突破黑盒壁垒

用户头像
6979阿强
2022-06-22

机器学习特别是深度学习,以神经网络为代表,发展至今,在很多任务上获得了很大的成功。在有足够多标注数据的情况下,神经网络往往效果惊人。但是,当标注数据匮乏时,神经网络的性能就会大打折扣。此外,神经网络作为黑盒缺少可解释性以及难以融入外部知识的

https://static001.geekbang.org/infoq/37/37761718d555728ef1cd623ce8d1f634.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

后 Hadoop 时代的大数据分析路在何方?

用户头像
Kyligence
2021-12-08

Apache Hadoop 作为一个完整的开源大数据套件,在过去的十多年里深刻影响了整个计算机界,随着各类新兴技术的发展, Hadoop 生态圈也发生了巨大的变化,Kyligence 合伙人兼首席架构师史少锋先生将从 Hadoop 的发展历程、大数据分析的未来展望等角度展开讨论。

https://static001.geekbang.org/infoq/75/757fa55daba42b2046d2a70fe27ca42e.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

openLooKeng v1.4.1 上线,OmniData Connector 来了

用户头像
openLooKeng
2021-11-15

前不久,在Hadoop、openLooKeng联合发起的Apache Hadoop Meetup 2021上,社区 PMC 主席 Ken Zhang 分享了主题:openLooKeng and the technical trend of big data(点此回顾),其中OmniRuntime 受到不少朋友的关注。11月12日,openLooKeng v1.4.1正式上线。

DolphinDB 插件开发深度解析

用户头像
DolphinDB
2021-07-08

DolphinDB支持动态加载外部插件,以扩展系统功能。插件用C++编写,需要编译成".so"或".dll"共享库文件。插件开发和使用的整体流程请参考DolphinDB Plugin主页

Pandas 之:Pandas 简洁教程

用户头像
程序那些事
2021-06-05

pandas是建立在Python编程语言之上的一种快速,强大,灵活且易于使用的开源数据分析和处理工具,它含有使数据清洗和分析⼯

https://static001.geekbang.org/infoq/50/5070e9eeb38851fb2d281a4ca2c20ce8.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

阿里云:城市大脑数据智能解决方案

一起看看基于云计算、大数据、人工智能、物联网新一代信息技术构建的阿里云城市大脑人工智能开发创新和运营平台~

大数据分析_大数据分析技术文章_InfoQ写作社区