写点什么

大数据技术

0 人感兴趣 · 17 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/c8/c8345e4f83a410430444d3bcae1975ec.jpeg?x-oss-process=image/resize,w_416,h_234

如何通过 openLooKeng 更高效访问 HBase?

用户头像
openLooKeng4 月 28 日

数据虚拟化引擎openLooKeng中的HBase Connector支持访问Apache HBase集群并进行查询和创建表的操作。用户可以在openLooKeng中创建表,并映射到HBase Cluster中已有的表,支持INSERT、SELECT和DELETE操作。

https://static001.geekbang.org/infoq/4d/4de4eb94af74cfa19862f341b9e48283.png?x-oss-process=image/resize,w_416,h_234

Prophecis 0.2.0 版本发布

用户头像
WeDataSphere3 月 22 日

Prophecis 是微众银行大数据平台团队开发的一站式机器学习平台,提供多种模型训练调试方式,集成多种开源机器学习框架,具备机器学习计算集群的多租户管理能力,提供生产环境全栈化容器部署与管理服务。

https://static001.geekbang.org/infoq/db/db32c73e38c6f291ce88d1b834c20a35.jpeg?x-oss-process=image/resize,w_416,h_234

Hadoop 之 YARN 的内部机制

用户头像
hanke3 月 15 日

前面两篇文章,我们介绍了Hadoop里两个重要的组件MapReduce和HDFS。本文我们一起看一下,作为大数据业内用的比较普遍的YARN的内部机制。

https://static001.geekbang.org/infoq/8a/8ab3c0e215fafcaff9aad5e253fd3c47.jpeg?x-oss-process=image/resize,w_416,h_234

大数据知识专栏 - Hadoop 的资源管理 Yarn 介绍

用户头像
小马哥1 月 23 日

大数据专栏系列文章: 通过该文章, 了解Yarn的运行机制, 包括资源调度与应用管理.

https://static001.geekbang.org/infoq/be/be3537f2940564f3a07450dd03fc3df0.jpeg?x-oss-process=image/resize,w_416,h_234

Spark 3.0 关键新特性回顾

用户头像
hanke1 月 6 日

从Spark 3.0官方的Release Notes可以看到,这次大版本的升级主要是集中在性能优化和文档丰富上(如下图),其中46%的优化都集中在Spark SQL上。

https://static001.geekbang.org/infoq/17/17b1e789f3cf873071b960e1de83005a.png?x-oss-process=image/resize,w_416,h_234

智慧警务大数据平台开发,数据可视化分析平台搭建

用户头像
t138231159671 月 6 日

随着大数据时代的来临,科技的进步的日异月新,互联网已经深入了我们所有人生活的方方面面。云计算、大数据技术的出现,为传统公安信息化的建设模式、方法、技术等方面带来了变革。

https://static001.geekbang.org/infoq/74/74855cd85f573c258518005f92eb14ca.jpeg?x-oss-process=image/resize,w_416,h_234

Hadoop 编程实战:HDFS API 编程

用户头像
罗小龙2020 年 12 月 27 日

前言:Hadoop分布式计算平台不等同大数据。大数据是当前时代数据爆炸的一种表征,Hadoop是通过生态圈内的分布式工具,凝聚计算机集群的算力,对大数据进行计算的一个平台。

https://static001.geekbang.org/infoq/bf/bf480e1054c377596823e436fb230738.png?x-oss-process=image/resize,w_416,h_234

深度探索 Hadoop 分布式文件系统(HDFS)数据读取流程

用户头像
读字节2020 年 12 月 24 日

Hadoop分布式文件系统(HDFS)是Hadoop大数据生态最底层的数据存储设施。因其具备了海量数据分布式存储能力,针对不同批处理业务的大吞吐数据计算承载力,使其综合复杂度要远远高于其他数据存储系统。

https://static001.geekbang.org/infoq/98/984b408c43f9c133c0ea2d18209d5d0a.jpeg?x-oss-process=image/resize,w_416,h_234

分布式时序数据库 DolphinDB 与 InfluxDB 对比测试报告

用户头像
DolphinDB2020 年 12 月 10 日

2019年1月,我们曾发布测试报告 DolphinDB与InfluxDB对比测试报告。当时的结果显示,DolphinDB的查询性能领先InfluxDB一到三个数据量级,数据导入性能领先一个数量级,数据导出性能相差不大。时隔近一年,DolphinDB与InfluxDB都做了不少功能和性能上的优化,

https://static001.geekbang.org/infoq/b6/b66ff107f1f213c8b5d5b4794e7f5c22.png?x-oss-process=image/resize,w_416,h_234

智慧公安大数据分析平台开发解决方案

用户头像
t138231159672020 年 12 月 5 日

近年来,随着数据的不断累积,大数据分析平台不单单只是强调一些概念和技术而已,它加快了各大领域之间的业务融合。

大数据总结

用户头像
周冬辉2020 年 9 月 2 日

大数据总结

https://static001.geekbang.org/infoq/3b/3b9f407be74da6566b965d03d73d85f4.png?x-oss-process=image/resize,w_416,h_234

初识 Druid——实时 OLAP 系统

用户头像
justskinny2020 年 8 月 29 日

这篇文章介绍 Druid ——一个实时分析 OLAP 系统,内容主要分三块:Druid 的简介、主要特点还有适用场景。分享的目标是让读者了解 Druid 是什么,以后在做数据分析技术选型的时候可以快速匹配。如果有写得不对或者不清楚的地方,欢迎留言讨论。

https://static001.geekbang.org/infoq/1f/1f43b8e6627cbe85ae2a0ea62eab49ae.png?x-oss-process=image/resize,w_416,h_234

Flink 的 2 种部署模式 -2

用户头像
小知识点2020 年 8 月 20 日

框架模式是传统模式,即通过客户端提交应用到正在运行的服务器上。库模式Flink不是作为服务,而是以库的形式绑定到所在容器中,常用于微服务。

https://static001.geekbang.org/infoq/26/260fddbb23bd752f08e5f01f82f59ebb.png?x-oss-process=image/resize,w_416,h_234

大数据技术发展 (二):Hadoop 技术生态圈的发展

用户头像
抖码算法2020 年 8 月 19 日

Hadoop 是大数据领域中最重要的一门技术,我们很多人知道它是发源于 google 的"三驾马车",实际上真的是这样的吗?这篇文章一探 Hadoop 技术的起源。

https://static001.geekbang.org/infoq/c4/c4034e1236b91f9c83daf84a45863228.png?x-oss-process=image/resize,w_416,h_234

大数据技术发展 (一):大数据技术的起源

用户头像
抖码算法2020 年 8 月 18 日

我们知道大数据技术是时下应用非常广泛的技术,也是未来的趋势,但是你知道大数据技术的起源吗?本文带你一探大数据技术的起源

大数据技术_大数据技术资料文章-InfoQ写作平台