写点什么

数据挖掘

0 人感兴趣 · 83 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/ea/ea6c48b6ff835945448e881ac759d1b9.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

淘系接口推荐:淘宝天猫实时商品详情页面数据采集接口

用户头像
tbapi
04-03

淘宝和天猫都提供了用于实时商品详情页面数据采集的API接口。这些接口能够帮助商家或开发者获取商品的详细信息,以便更好地了解市场动态和消费者需求。

低代码与数据分析:重塑软件开发与数据分析的未来

随着技术的不断进步和数字化转型的加速,软件开发和数据分析已经成为了许多企业不可或缺的核心能力。在这个过程中,低代码平台以其高效、灵活的特性,正逐渐在软件开发领域崭露头角。同时,数据分析技术也在不断发展,为企业提供了更深入的洞察和更精准的决策

数据挖掘与低代码开发应用:加速业务创新的黄金组合

数据挖掘与低代码开发是当今创新领域的两大热点技术。数据挖掘技术可以从大量数据中发现隐藏的模式和知识,为决策提供有力支持;而低代码开发则使得应用程序的开发变得更加快捷和高效。本文将介绍数据挖掘和低代码开发的概念及其应用,并阐述它们联合应用的优

https://static001.geekbang.org/infoq/89/89d9d8d7fff16f07ab90e536ec235ae6.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

大模型助力交互式数据挖掘的探索与发现

用户头像
鲸品堂
2023-11-27

​在这个数据驱动的时代,数据挖掘已成为解锁信息宝库的关键。过去,我们依赖传统的拖拉拽方式来建模,这种方式在早期的数据探索中起到了作用,但随着数据量的激增和需求的多样化,它的局限性逐渐显露。

https://static001.geekbang.org/infoq/89/89fc01bf3c4d303a0e5337c23253ca96.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

异常检测:探索数据深层次背后的奥秘《下篇》

在实际场景中,很多数据集都是多维度的。随着维度的增加,数据空间的大小(体积)会以指数级别增长,使数据变得稀疏,这便是维度诅咒的难题。维度诅咒不止给异常检测带来了挑战,对距离的计算,聚类都带来了难题。例如基于邻近度的方法是在所有维度使用距离函

https://static001.geekbang.org/infoq/89/89fc01bf3c4d303a0e5337c23253ca96.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

异常检测:探索数据深层次背后的奥秘《上篇》

异常检测(Outlier Detection),顾名思义,是识别与正常数据不同的数据,与预期行为差异大的数据。异常检测:探索数据深层次背后的奥秘《上篇》

https://static001.geekbang.org/infoq/7a/7adf5fd133f207ddae5709e7b4fda8d9.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Python 案例|Matplotlib 库实现的数据分析

用户头像
TiAmo
2023-08-25

数据展示是数据分析和挖掘中的重要环节,通过图形的形式可以直观、清晰地呈现数据内在的规律。

https://static001.geekbang.org/infoq/58/58d56734f788732717ea3fbd4d589a18.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据分析实战│时间序列预测

用户头像
TiAmo
2023-08-24

时间序列预测问题是一类常见的数据分析问题。数据中往往包含时间标签,这类问题往往根据过去一段时间的数据,建立能够比较精确地反映序列中所包含的动态依存关系的数学模型,并对未来的数据进行预测。

https://static001.geekbang.org/infoq/a1/a1fefbe02e61ca52a69c29d083ff9613.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据分析实战│价格预测挑战

用户头像
TiAmo
2023-08-23

文本分析是指对文本信息的表示及特征项的选取,商品文本的描述能够反映特定立场、观点、价值和利益。考虑到网上海量的商品数量,对产品的定价难度很大,因此可以使用商品描述帮助商户定价。比如,服装具有较强的季节性价格趋势,受品牌影响很大,而电子产品则

基于新浪微博海量用户行为数据、博文数据数据分析:包括综合指数、移动指数、PC 指数三个指数

基于新浪微博海量用户行为数据、博文数据数据分析:包括综合指数、移动指数、PC指数三个指数

https://static001.geekbang.org/infoq/5c/5c3c10489a6a5df8e5af8fbcc239935a.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

金融时间序列预测方法合集:CNN、LSTM、随机森林、ARMA 预测价格(适用于时序问题)、相似度计算、各类评判指标绘图(数学建模科研适用)

金融时间序列预测方法合集:CNN、LSTM、随机森林、ARMA预测价格(适用于时序问题)、相似度计算、各类评判指标绘图(数学建模科研适用)

https://static001.geekbang.org/infoq/6e/6e78595291d1010f9c6c23813cdb66fd.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据挖掘 18 大算法实现以及其他相关经典 DM 算法:决策分类,聚类,链接挖掘,关联挖掘,模式挖掘。图算法,搜索算法等

18大数据挖掘的经典算法以及代码实现,涉及到了决策分类,聚类,链接挖掘,关联挖掘,模式挖掘等等方面,后面都是相应算法的博文链接,希望能够帮助大家学。目前追加了其他的一些经典的DM算法,在others的包中涉及聚类,分类,图算法,搜索算等等,没有具体分

https://static001.geekbang.org/infoq/28/28f320f80e40b0a93a0ea3449a569156.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

人工智能创新挑战赛:海洋气象预测 Baseline[4] 完整版(TensorFlow、torch 版本)含数据转化、模型构建、MLP、TCNN+RNN、LSTM 模型训练以及预测

2021 “AI Earth” 人工智能创新挑战赛,以 “AI 助力精准气象和海洋预测” 为主题,旨在探索人工智能技术在气象和海洋领域的应用。

DataLeap 的全链路智能监控报警实践(一):常见问题

随着字节跳动业务的快速发展,大数据开发场景下需要运维管理的任务越来越多,然而普通的监控系统只支持配置相应任务的监控规则,已经不能完全满足当前需求,在日常运维中开发者经常会面临以下几个问题:

https://static001.geekbang.org/infoq/e4/e4d4803f4c227470de17753b1f41d60b.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

“AI Earth”人工智能创新挑战赛:助力精准气象和海洋预测 Baseline[2]:数据探索性分析(温度风场可视化)、CNN+LSTM 模型建模

数据分析是解决一个数据挖掘任务的重要一环,通过数据分析,我们可以了解标签的分布、数据中存在的缺失值和异常值、特征与标签之间的相关性、特征之间的相关性等,并根据数据分析的结果,指导我们后续的特征工程以及模型的选择和设计。

https://static001.geekbang.org/infoq/4e/4ec6eb50af4ee989e5fe8b1a0c978b6e.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

“AI Earth”人工智能创新挑战赛:助力精准气象和海洋预测 Baseline[1]、NetCDF4 使用教学、Xarray 使用教学,针对气象领域.nc 文件读取处理

“AI Earth”人工智能创新挑战赛:助力精准气象和海洋预测Baseline[1]、NetCDF4使用教学、Xarray 使用教学,针对气象领域.nc文件读取处理

https://static001.geekbang.org/infoq/a2/a219ab25ad4c4a6da416c4216b8030d9.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

合合信息商业大数据技术为农商行打造数字化转型专项方案

作为农村金融服务体系的重要组成,农村商业银行(简称“农商行”)通过服务三农经济发展,为小微企业提供了方便、快捷、高效、优质的金融服务,同时也面临着巨大的发展压力:大型银行服务重心的持续下沉,对农商行的客群拓展和存量客户运营工作带来“降维打击

https://static001.geekbang.org/infoq/74/74135a39abade6470d82c5f2c2d8d314.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

“Fabarta 数据血缘治理解决方案”荣获“2023 鑫智奖”双料奖项

用户头像
Fabarta
2023-05-29

Fabarta 数据血缘治理解决方案荣获2023年鑫智奖“专家推荐 TOP10 优秀解决方案”及“数据治理与数据平台创新优秀解决方案”两项奖项。

https://static001.geekbang.org/infoq/89/89fc01bf3c4d303a0e5337c23253ca96.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据挖掘实践(金融风控):金融风控之贷款违约预测挑战赛(上篇)[xgboots/lightgbm/Catboost 等模型]-- 模型融合:stacking、blending

赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款,这是一个典型的分类问题。通过这道赛题来引导大家了解金融风控中的一些业务背景,解决实际问题,帮助竞赛新人进行自我练习、自我提高

https://static001.geekbang.org/infoq/a9/a9f39137d7b46f51d0c83ed995d6f1d9.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Fabarta 与青岛市城阳区政府达成战略合作,共同推动区域数据要素市场建设

用户头像
Fabarta
2023-05-08

Fabarta 与青岛市城阳区人民政府达成了战略合作,成为首批入驻产业园的数据要素生态链企业之一,将与各方携手共同推动区域数据要素市场的建设与发展。

https://static001.geekbang.org/infoq/ef/ef22d6fa64cd85f515d3620961ba0c34.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

【机器学习入门与实践】数据挖掘 - 二手车价格交易预测(含 EDA 探索、特征工程、特征优化、模型融合等)

【机器学习入门与实践】数据挖掘-二手车价格交易预测(含EDA探索、特征工程、特征优化、模型融合等)

机器学习实战系列 [一]:工业蒸汽量预测(最新版本下篇)含特征优化模型融合等

机器学习实战系列[一]:工业蒸汽量预测(最新版本下篇)含特征优化模型融合等

机器学习实战系列 [一]:工业蒸汽量预测(最新版本下篇)含特征优化模型融合等

机器学习实战系列[一]:工业蒸汽量预测(最新版本下篇)含特征优化模型融合等

机器学习实战系列 [一]:工业蒸汽量预测(最新版本上篇)含数据探索特征工程等

机器学习实战系列[一]:工业蒸汽量预测(最新版本上篇)含数据探索特征工程等

数据挖掘_数据挖掘技术文章_InfoQ写作社区