写点什么

数据

2 人感兴趣 · 123 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/98/9809cc14105e64df19233a7287e2c86d.png?x-oss-process=image/resize,w_416,h_234

关于机器学习的十大常见问题

用户头像
澳鹏Appen4 月 8 日

机器学习即教授机器如何学习的过程,为机器提供指导,帮助它们自己开发逻辑,访问您希望它们访问的数据。机器学习的成果就是某种形式的人工智能(AI)。通俗来讲,机器学习就是不断输入基础资料、训练数据,以帮助其撷取特征,建立模型,得到答案的过程。

教你一个著名的流行数据格式:Python JSON

摘要: 您知道如何从在线API传输数据或将各种数据存储到本地计算机吗?您已经将自己沉浸于JSON的一种方式中,JSON表示Java Script Object Notation。它是一种著名的流行数据格式,用于表示半结构化数据。让我们详细了解Python JSON。

对于数据,科技小白提出了灵魂三问:从哪儿来?到哪儿去?能干什么?

​​​​摘要: 作为科技圈小白,经常被数据搞得头晕脑胀,数据打哪儿来?到哪儿去?能干什么?那么多数据怎么区分谁有用谁没用?今天这篇文章,小编就带你查一查数据采集技术的水表。

带你了解数据库的“吸尘器”:VACUUM

摘要:在GaussDB(DWS)中,VACUUM的本质就是一个“吸尘器”,用于吸收“尘埃”。 下面将从VACUUM的作用、用法、原理等方面进行介绍。

https://static001.geekbang.org/infoq/05/0515f28ab41bc4f81fb6d9dd1f5d9cfa.png?x-oss-process=image/resize,w_416,h_234

【得物技术】TDengine 在得物的落地应用

用户头像
得物技术3 月 19 日

目前在生产环境中,我们有数百个业务系统、数千台服务器接入了Sentinel,如此产生的流控数据无疑非常庞大。那么对于这个需求来说,选择一款适合的数据库无疑极为重要,一个好的选择能够达到事半功倍的效果。同事安利了一款国产物联网大数据平台——TDengine。

基于 GES 图数据库的大规模数据追溯服务优化

摘要:利用华为云GES分析,如何基于GES图数据库追溯服务的实现和优化。

全面开放!华为云 GaussDB(for openGauss) 正式商用发布

摘要:截止目前,华为消费者云已在GaussDB(for openGauss)上线了40+业务,包括弹幕&评论、云空间、地理大数据等业务系统,实时为5亿+用户提供高效服务。

处理 XML 数据应用实践

摘要:GaussDB(DWS)支持XML数据类型及丰富的XML解析函数,可实现关系数据和XML数据的映射管理功能。

https://static001.geekbang.org/infoq/2f/2fe57484f67ac224e260a2003b4fb030.jpeg?x-oss-process=image/resize,w_416,h_234

「TcaplusDB 知识库」概念(表、键、记录、索引)

用户头像
TcaplusDB2 月 24 日

TcaplusDB作为一款NoSQL数据库,语法与传统的SQL关系库有所差异。本文将详细介绍TcaplusDB表、记录、索引这三个数据库中常用术语在TcaplusDB中的概念与意义。

CPU 高速缓存与极性代码设计

摘要:CPU内置少量的高速缓存的重要性不言而喻,在体积、成本、效率等因素下产生了当今用到的计算机的存储结构。

https://static001.geekbang.org/infoq/36/36e24c70f954897b39e264399f4d6856.png?x-oss-process=image/resize,w_416,h_234

Spark Shuffle 内部机制(三)

用户头像
hanke2 月 24 日

本篇中我们继续总结一下Spark Shuffle整个的发展历史

数据主权,才是业务在线化的核心

用户头像
boshi2 月 4 日

从现在业务在线化的工作本质来讲,传播,对接,价值转化是根本要素,而这些要素的前提都是连接,只有可触达能连接才意味着后续的价值实现才成为可能,而互联网的本质在于连接,连接的状态就是实时在线化。

如何快速上手 angular.js

摘要:angular.js 准确的来说,应该不是一个框架,是一个 js 库,一个依赖于 jQuery 的进一步封装,去除繁琐的 DOM 操作,使用数据驱动的 MVC 模块化库。

5 步教你将 MRS 数据导入 DWS

摘要:GaussDB(DWS)支持在相同网络中,配置一个GaussDB(DWS)集群连接到一个MRS集群,然后将数据从HDFS中的文件读取到GaussDB(DWS)。

面试官:请讲一下 Redis 主从复制的功能及实现原理

摘要:Redis在主从模式下会有许多问题需要考虑,这里写了一些关于redis在多服务器下的一些问题分析和总结。

分盘存储:实现数据库备集群备份文件分散存储

摘要:为了解决磁盘存储空间限制的问题,提出分盘存储手段,从而实现备集群备份文件分散存储的目的。

https://static001.geekbang.org/infoq/65/65b34504076290dd2fb1af6627c095d2.png?x-oss-process=image/resize,w_416,h_234

【得物技术】无侵入式 mock 平台在得物的实践

用户头像
得物技术1 月 29 日

hulk是一个无侵入式的http mock平台,支持客户端代理,从网关层mock,支持后端服务之间的mock。支持返回报文函数配置,并且具备放行逻辑。未来还将支持filter,根据不同的入参返回不同的mock数据。

面对 key 数量多和区间查询低效问题:Hash 索引趴窝,LSM 树申请出场

摘要:Hash索引有两个明显的限制:(1)当key的数量很多时,维护Hash索引会给内存带来很大的压力;(2)区间查询很低效。如何对这两个限制进行优化呢?这就轮到本文介绍的主角,LSM树,出场了。

数据库覆盖式数据导入方法:部分和完全

众所周知,数据库中INSERT INTO语法是append方式的插入,而最近在处理一些客户数据导入场景时,经常遇到需要覆盖式导入的情况,常见的覆盖式导入主要有下面两种:

数据库运维家中常备:上限约 400MB/s,比 COPY 等工具还好用的数据利器

摘要:随着数据仓库业务的发展,GDS使用场景日益增多,这就要求GDS仍要不断迭代,充分深入挖掘用户需求,提高产品化程度。

“数据库网络故障”愁坏了头,五种方法带你解难题

摘要:本文将介绍几种常用手段,用于梳理数据库网络故障可能存在的问题,从而快速定位恢复。

简化业务代码开发:看 Lambda 表达式如何将代码封装为数据

摘要:在云服务业务开发中,善于使用代码新特性,往往能让开发效率大大提升,这里简单介绍下lambad表达式及函数式接口特性。

亿级大表在线不锁表变更字段与索引

摘要:在业界中有一个比较成熟的工具,针对大表的场景,可以在线进行Alter变更,且不会出现锁表的风险。除此之外,它还有其他的一些优点,让我们开始探索吧。

数据_数据资料文章-InfoQ写作平台