写点什么

机器学习

74 人感兴趣 · 652 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/d8/d8618b5e804721e35b98b8b9116f1ee4.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

从零开始初识机器学习 | 京东云技术团队

本篇文章中我们将对机器学习做全面的了解与介绍,其中第一章 初识机器学习分为上下两个小章节,对机器学习是什么、机器学习由来以及机器学习的理论等展开说明。目的是能让即便完全没接触过机器学习的人也能在短时间对机器学习有一个全面了解。

分布式机器学习 (Parameter Server)

分布式机器学习中,参数服务器(Parameter Server)用于管理和共享模型参数,其基本思想是将模型参数存储在一个或多个中央服务器上,并通过网络将这些参数共享给参与训练的各个计算节点。

https://static001.geekbang.org/infoq/7a/7aebdf9c5f108bed2f16ed810404cb94.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

AIGC 时代,基于云原生 MLOps 构建属于你的大模型(下)

用户头像
York
06-25

为了满足企业在数字化转型过程中对更新迭代生产力工具的需求,灵雀云近日推出了Alauda MLOps 解决方案,帮助企业快速落地AI技术、实现智能化应用和服务。

让性能腾飞!亚马逊云科技的 Java 云端之旅

在上篇文章中,我们为大家介绍了亚马逊的 Java 生态及丰富的开发工具、框架。本文将分享亚马逊的 Java 架构、迁移途径,并分享一个具体实例,介绍如何使用机器学习来构建 Java 应用和提升 Java 性能。

Generative AI 新世界:过去、现在和未来

人类善于分析事物。但是现在看来,机器很有可能做得更好。机器可以不知疲倦夜以继日地分析数据,不断从中找到很多人类场景用例的模式:信用卡欺诈预警、垃圾邮件检测,股票价格预测、以及个性化地推荐商品和视频等等。他们在这些任务上变得越来越聪明了。这被

https://static001.geekbang.org/infoq/7e/7ed73acad2abf71c0ebdf0e85fca1303.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

GitHub 2800 颗星,支持 GPT/Transformer,字节跳动这个开源项目是怎么来的?

AI 绘画、机器翻译、多轮对话……对于各类 AI 相关的功能来说,总有一个痛点,困扰着所有训模型的算法工程师们:

https://static001.geekbang.org/infoq/50/50112d3ca3ade08e74a6584fec77bc4a.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

阿里云 PAIx 达摩院 GraphScope 开源基于 PyTorch 的 GPU 加速分布式 GNN 框架

阿里云机器学习平台 PAI 团队和达摩院 GraphScope 团队联合推出了面向 PyTorch 的 GPU 加速分布式 GNN 框架 GraphLearn-for-PyTorch(GLT) 。

https://static001.geekbang.org/infoq/e4/e4d4803f4c227470de17753b1f41d60b.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

“AI Earth”人工智能创新挑战赛:助力精准气象和海洋预测 Baseline[2]:数据探索性分析(温度风场可视化)、CNN+LSTM 模型建模

数据分析是解决一个数据挖掘任务的重要一环,通过数据分析,我们可以了解标签的分布、数据中存在的缺失值和异常值、特征与标签之间的相关性、特征之间的相关性等,并根据数据分析的结果,指导我们后续的特征工程以及模型的选择和设计。

https://static001.geekbang.org/infoq/c8/c81531adb374b0e3f84b64a77ddddf02.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

深度学习入门系列(一):一文看懂 MNIST

用户头像
U2647
06-03

深度学习领域的 hello world,包括完整代码示例,并从数据角度分析了深度学习到底在做什么。

https://static001.geekbang.org/infoq/e1/e1adb95ba3b08f68f9f6c7956e44a6a6.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

OpenMLDB v0.8 新功能:离线引擎数据源支持 Amazon S3

OpenMLDB v0.8.0 新版本发布中新增加了对于 Amazon S3 作为离线数据源的支持。点击文章了解更多

Generative AI 新世界 | 大语言模型(LLMs)在 Amazon SageMaker 上的动手实践

在上一篇《Generative AI 新世界:大型语言模型(LLMs)概述》中,我们一起探讨了大型语言模型的发展历史、语料来源、数据预处理流程策略、训练使用的网络架构、最新研究方向分析(Amazon Titan、LLaMA、PaLM-E 等),以及在亚马逊云科技上进行大型语言模型训

Generative AI 新世界 | 走进文生图(Text-to-Image)领域

在之前的四篇 “Generative AI 新世界” 中,我们带领大家一起探索了生成式 AI(Generative AI),以及大型语言模型(LLMs)的全新世界概览。并在文本生成(Text Generation)领域做了一些概述、相关论文解读、以及在亚马逊云科技的落地实践和动手实验。

https://static001.geekbang.org/infoq/41/4167cc2eb96c3ffa0a1237d9b73b8d69.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

人工智能与数据分析

当今社会,数据已经成为各行各业的核心,而机器学习已经成为数据分析领域中最为热门的技术之一。机器学习算法可以分析大量数据,并从中获取有价值的信息。让我们先了解什么是机器学习:机器学习是一种利用数据和算法,训练计算机自动学习和提高性能的技术。

https://static001.geekbang.org/infoq/d5/d5f5b6a2aa301e1aee0660c83e47d192.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

AIGC 背后的技术分析 | 机器学习背后的微分入门

用户头像
TiAmo
05-27

为了理解更深层次的原理,让我们再来讨论一下最简单的神经网络——感知器(perceptron)。感知器是由Frank Rosenblatt在1957年发明的,要想理解它,请参考图1。

https://static001.geekbang.org/infoq/52/527cf851cd57e28cd0b39b68f23247c1.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

AIGC 背后的技术分析 | 机器学习?机器如何学习?

用户头像
TiAmo
05-26

简介: 通过Julia的语法、函数、编译器使机器学习技术变得更加简单。

https://static001.geekbang.org/infoq/5e/5e315b115ec34eb0529f6f380d50498f.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

首个机器学习实时特征平台测试基准论文被 VLDB 2023 录取

首个机器学习实时特征平台测试基准论文 FEBench: A Benchmark for Real-Time Relational Data Feature Extraction 被 VLDB 2023 录取

推荐系统系列之推荐系统概览(下)

在推荐系统概览的第一讲中,我们介绍了推荐系统的常见概念,常用的评价指标以及首页推荐场景的通用召回策略。本文我们将继续介绍推荐系统概览的其余内容,包括详情页推荐场景中的通用召回策略,排序阶段常用的排序模型,推荐系统的冷启动问题和推荐系统架构,

https://static001.geekbang.org/infoq/4f/4fbf8b8022066b26e0665cc3f2081ba7.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

机器学习平台 PAI 支持抢占型实例,模型服务最高降本 90%

助力模型推理服务降本增效,适用于推理成本敏感场景,如:AIGC内容生成异步推理、批量图像处理、批量音视频处理等。

https://static001.geekbang.org/infoq/00/00f4ccd40c2f84ff3c02257a4896ea24.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

让算力不再成为瓶颈,小红书机器学习异构硬件推理优化之道

在全球降本增效的趋势下,异构计算成为了一种很有前途的方向,可以通过将不同类型的处理器(如 CPU、GPU、FPGA 等)组合在一起来提高计算性能,从而实现更好的效率和更低的成本。

https://static001.geekbang.org/infoq/89/89fc01bf3c4d303a0e5337c23253ca96.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据挖掘实践(金融风控):金融风控之贷款违约预测挑战赛(上篇)[xgboots/lightgbm/Catboost 等模型]-- 模型融合:stacking、blending

赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款,这是一个典型的分类问题。通过这道赛题来引导大家了解金融风控中的一些业务背景,解决实际问题,帮助竞赛新人进行自我练习、自我提高

https://static001.geekbang.org/infoq/dd/dd071247ef5ac6a0cdff34766f62eb5d.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

AIGC 背后的技术分析 | 知识图谱

用户头像
TiAmo
05-16

简介: 知识图谱是知识工程的一个分支,以知识工程中语义网络作为理论基础,并且结合了机器学习、自然语言处理以及知识表示和推理的最新成果,在大数据的推动下受到了业界和学术界的广泛关注。知识图谱对于解决大数据中文本分析和图像理解问题发挥了重要作用

https://static001.geekbang.org/infoq/fd/fd4e27381a63ebbd404bee97b4a50b5c.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

可计算存储技术全面升级 CSD 3000 存储体验

随着现代数据中心的演进和增长,实际应用中的高性能工作负载(例如事务性数据库、交易应用、人工智能和机器学习(AI/ML)、数据挖掘/分析等)需要更高的容量、更好的性能、更长的寿命和更好的经济性。

https://static001.geekbang.org/infoq/8a/8aa8eadf4380a1e636e13538c4652618.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

增强型语言模型——走向通用智能的道路?

大规模语言模型可能并不只受限于『语言』,而是能在非常广阔的其他领域有所应用。

机器学习_机器学习技术文章_InfoQ写作社区