写点什么

数据分析

4 人感兴趣 · 71 次引用

  • 最新
  • 推荐

运维大规模 ES 集群的思考和实践

京东智联云ES支撑了公有云,私有云和京东集团内部的大量ES集群。京东商城,京东物流,京东金融等各个业务领域都对ES服务有很大量的需求。目前已使用数十万核,上万个节点,数十万亿个文档。

https://static001.geekbang.org/infoq/e0/e0f7659baa8b7d7f8050b11b15e57dae.png?x-oss-process=image/resize,w_416,h_234

致 ClickHouse 用户的一封信

用户头像
DorisDB1 月 12 日

今天,请给国产新一代MPP数据库一个机会,让鼎石数据库助力您的业务飞速发展!

初识 D3.js :打造专属可视化

掌握 D3 后,我们几乎可以实现任何 2d 的可视化需求。

Python 解释器和 IPython

用户头像
程序那些事1 月 12 日

今天给大家介绍一下Python的一个功能非常强大的解释器IPython。虽然Python本身自带解释器,但是相对而言IPython的功能更加的强大。

OpenLookeng 连接器 -Clickhouse connector 性能测试报告

用户头像
Galaxy数据平台1 月 10 日

OpenLooKeng是一款开源的高性能数据虚拟化引擎,提供统一SQL接口,可以实现对多个数据库的跨源异构和跨域跨DC查询。我们使用SSB测试基准提供的数据和SQL查询语句,对OpenLookeng的ClickHouse connector的性能进行了初步的评估。

https://static001.geekbang.org/infoq/b2/b24b48b84381787fe9b8e2fd004ce4a6.png?x-oss-process=image/resize,w_416,h_234

打造新一代企业数据驱动体系

用户头像
DorisDB1 月 4 日

用一套统一的体系来满足企业多种数据分析场景的需求,让更多的企业成员能够同时更快、更灵活、更实时地分析数据,这已经成为企业数字化建设的一个必然趋势。

https://static001.geekbang.org/infoq/20/20145d7474b51d90baeda1a59b0c3def.jpeg?x-oss-process=image/resize,w_416,h_234

鸟枪换炮,利用 python3 对球员做大数据降维 (因子分析得分),为 C 罗找到合格僚机

用户头像
刘悦的技术博客2020 年 12 月 31 日

众所周知,尤文图斯需要一座欧冠奖杯,C罗也还想再拿一座欧冠奖杯,为自己的荣誉簙上锦上添花。意甲霸主在意甲虽然风生水起,予取予求,但是在今年欧冠1/8决赛赛场上,被法甲球队里昂所淘汰,痛定思痛,球队解雇了主教练萨里,签约名宿皮尔洛,但是要想在欧冠

https://static001.geekbang.org/infoq/23/236229fab659501d63ad76022d238e38.jpeg?x-oss-process=image/resize,w_416,h_234

直播报名 | 携程技术沙龙——前端测试技术创新与实践

用户头像
携程技术中心2020 年 12 月 17 日

随着app的发布更新节奏越来越快,如何快速进行测试?如何利用数据分析快速预判质量?如何让测试覆盖更深入?如何让测试更智能化?是大家比较关心的问题。

利用 Python 进行数据分析(原书第 2 版)免费下载

用户头像
计算机与AI2020 年 12 月 17 日

本书由Python pandas项目创始人Wes McKinney亲笔撰写,详细介绍利用Python进行操作、处理、清洗和规整数据等方面的具体细节和基本要点。第2版针对Python 3.6进行全面修订和更新,涵盖新版的pandas、NumPy、IPython和Jupyter,并增加大量实际案例,可以帮助你

https://static001.geekbang.org/infoq/e8/e82b20431febeed6e02779337ebb716f.png?x-oss-process=image/resize,w_416,h_234

Superset 助力企业级大数据 Ad-hoc 查询

用户头像
麻婆豆腐没麻婆2020 年 12 月 17 日

导语 | Apache Superset是一个现代的数据探索和可视化平台,可以帮助分析人员能够迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目的。本文基于供应链行业大数据实时分析场景,集成Superset分析工具进行相应解读。

京东智联云与 CDA 携手 共同打造电商领域数字化人才认证标准

用户头像
京东智联云开发者2020 年 12 月 15 日

京东智联云与 CDA 强强联合,在日前完成“电商领域数字化人才认证”签约,共同打造电商领域数字化人才认证标准,携手为电商领域输送更多优秀数据分析和数据挖掘人才,推送优质电商人才方案,提升企业人才竞争力

时序数据库 DolphinDB 与 Druid 的对比测试

用户头像
DolphinDB2020 年 12 月 10 日

DolphinDB和Druid都是分布式的分析型时序数据库。尽管前者使用c++开发,后者使用java开发,两者在架构、功能、应用场景等方面有很多共同点。本报告在SQL查询、数据导入、磁盘占用空间等方面对两者进行性能的对比测试。

时空碰撞系列·终

用户头像
誓约·追光者2020 年 11 月 30 日

我决定放弃所有花里胡哨的发言,就简单直接的上干货吧

11.11 数据可视化大屏设计揭秘

用户头像
京东智联云开发者2020 年 11 月 27 日

本次与大家分享的11.11机房数据图谱大屏,作为这系列之一,以最新的视觉体验和可视化形态为观者传递了机房、网络的实时状况。本篇文章我们将以设计者的身份为大家带来相关见解与分析。

https://static001.geekbang.org/infoq/c5/c5b6be81c38a66624b3e2839352c18ed.png?x-oss-process=image/resize,w_416,h_234

物化视图如何快速完成数据聚合操作?

用户头像
VoltDB2020 年 11 月 26 日

SQL在过去十年逐渐走向没落,如今春风吹又生。

https://static001.geekbang.org/infoq/85/85fcf50237e4269b7e763d689da0aff4.png?x-oss-process=image/resize,w_416,h_234

5G 革命:如何让「数据」实现最大性能?

用户头像
VoltDB2020 年 11 月 23 日

早在2000年代中期,H-Store第一次在M.I.T.被我们提出来。

https://static001.geekbang.org/infoq/6e/6eb240d1eab2d6aed0f27394565d96e3.jpeg?x-oss-process=image/resize,w_416,h_234

过滤 Spark 数据集的四种方法

用户头像
大数志2020 年 11 月 16 日

你知道有四种过滤Spark数据集的方法吗?

https://static001.geekbang.org/infoq/b5/b5988f49fbb6c01dd16f7202ae4400bd.jpeg?x-oss-process=image/resize,w_416,h_234

Apache Doris 在京东搜索实时 OLAP 中的应用实践

用户头像
DorisDB2020 年 11 月 16 日

用Apache Doris充当实时数据仓库的聚合层,并提供统一的接口服务,保证了数据的一致性和安全性。

https://static001.geekbang.org/infoq/1b/1be3f1c742a8b66a1fda34f206d6f75b.png?x-oss-process=image/resize,w_416,h_234

技术分析:AnalyticDB 强力支撑双 11

用户头像
阿里云情报局2020 年 11 月 16 日

每年双十一购物狂欢节都是云原生数据仓库AnalyticDB MySQL版(原分析型数据库MySQL版)的一块试金石。今年AnalyticDB除了在阿里数字经济体内进入更多核心交易链路,全力支撑双十一以外,AnalyticDB全面拥抱云原生,构建极致弹性,大幅降低成本,释放技术红利

https://static001.geekbang.org/infoq/41/4124aac4e725ce53634493d49dbdd510.png?x-oss-process=image/resize,w_416,h_234

Oracle、NoSQL 和 NewSQL 数据库技术对比

用户头像
VoltDB2020 年 11 月 12 日

物联网(Internet of Things)让速度急剧加快!

https://static001.geekbang.org/infoq/9a/9a6f8cc6c53fe7e1523a21b59a8b5697.jpeg?x-oss-process=image/resize,w_416,h_234

如何预防工业物联网中的恶意攻击?

用户头像
VoltDB2020 年 11 月 11 日

本文摘录自我们最新白皮书《工业物联网的主动欺诈预防》。

https://static001.geekbang.org/infoq/58/581f2f2871980d82c2502232c0dcdd78.png?x-oss-process=image/resize,w_416,h_234

【得物技术】数据分析 - 生活品类社区内容精选池模型

用户头像
得物技术2020 年 11 月 6 日

通过分析特定品类的核心内容,生成相应精品池规则从而找出好的内容作为标杆从而带动推荐流整体pvctr上涨。

numexpr:你以为 numpy 已经够快了,其实它还可以更快

用户头像
计算机与AI2020 年 10 月 16 日

python语言被广泛用于数据分析和机器学习。但是,由于python的底层特性,python的运行速率低一直被广泛诟病。其中,numpy和pandas的广泛使用已经将数据处理和机器学习的速率提升了几个档次。

https://static001.geekbang.org/infoq/e2/e2e7b32e3347f620203ecd64d2e7e43d.jpeg?x-oss-process=image/resize,w_416,h_234

Anaconda 安装使用和 akshare 库使用

用户头像
MySQL从删库到跑路2020 年 10 月 14 日

Anaconda在window10下安装使用。使用akshare获取股票数据。

https://static001.geekbang.org/infoq/d0/d0901be30f2408b5a50e9c9ec17b2727.jpeg?x-oss-process=image/resize,w_416,h_234

作业帮基于 Apache Doris 的数仓实践

用户头像
DorisDB2020 年 9 月 29 日

在过去半年多时间内,我们基于Apache Doris,构建了数仓实时查询系统。

数据分析_数据分析资料文章-InfoQ写作平台