模型训练_模型训练技术文章

2024-08-15

使用 PAI 平台及 LLaMA Factory 训练框架完成模型的中文化与角色扮演微调和评估，搭建专属“ AI 诸葛亮”问答机器人，7×24小时为你出谋划策！

人工智能模型训练 LLM PAI

对比速览 | Alluxio 企业版 v.s. 社区版

2024-08-06

当前诸多企业面临着日益增长的数据量和复杂的数据管理挑战。特别是在模型训练的过程中，诸如GPU短缺、GPU利用率不高等问题已经成为许多企业在技术实施中面临的挑战。同时，大数据分析中跨云数据访问速度慢、成本高等问题也给企业带来了痛点。

模型训练大数据分析大模型 Alluxio GPU 利用率

https://static001.geekbang.org/infoq/69/69a0fb272bb7df29a77ef1e39176fe16.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

教你基于 MindSpore 用 DCGAN 生成漫画头像

华为云开发者联盟

2024-07-10

本教程将使用动漫头像数据集来训练一个生成式对抗网络，接着使用该网络生成动漫头像图片。

人工智能模型训练华为云华为云开发者联盟企业号2024年7月PK榜

https://static001.geekbang.org/infoq/ad/ad316b4baae98e31e36ceb621d6266af.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据管理优化，支持从 API 和对象存储更新数据集｜ModelWhale 版本更新

ModelWhale

2024-06-14

一年一端午，一岁一安康。端午佳节临近， ModelWhale 也带来了新一轮的版本更新，期待为大家带来更优质的使用体验。

人工智能对象存储模型训练数据集 API

基于 NVIDIA Megatron-Core 的 MoE LLM 实现和训练优化

2024-03-26

本文将分享阿里云人工智能平台 PAI 团队与 NVIDIA Megatron-Core 团队在 MoE (Mixture of Experts) 大型语言模型（LLM）实现与训练优化上的创新工作。

人工智能模型训练大模型 LLM

TorchAcc：基于 TorchXLA 的分布式训练框架

2024-03-25

阿里云研究员、阿里云人工智能平台 PAI 技术负责人--林伟在GTC 2024 大会 China AI Day 线上中文演讲专场上介绍了TorchAcc，这是一个基于 PyTorch/XLA 的大模型分布式训练框架。

人工智能机器学习分布式模型训练大模型

https://static001.geekbang.org/infoq/e6/e678dca983e946f0c7127d1d2ad32208.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

OPPO 案例 | Alluxio 在 Data&AI 湖仓一体的实践

2024-03-22

在OPPO的实际应用中，将自研的Shuttle与Alluxio完美结合，使得整个Shuttle Service的性能得到显著提升，基本上实现了性能翻倍的效果。通过这一优化，我们成功降低了约一半的系统压力，同时吞吐量也直接翻倍。

机器学习模型训练 OPPO Alluxio #人工智能

https://static001.geekbang.org/infoq/1c/1cbe09c5e070bac2c9cbb03a2bfa2e18.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据本地性如何助力企业在云上实现高效机器学习

2024-03-22

本文将讨论数据本地性对于在云上进行高效机器学习的重要性。对比现有解决方案的利弊，并综合考虑如何通过数据本地性来降低成本和实现性能最大化。介绍新一代的Alluxio设计与实现，详细说明其在模型训练和部署中的价值。

机器学习 gpu 模型训练云存储 Alluxio

【AAAI 2024】MuLTI：高效视频与语言理解

2024-03-18

MuLTI，这是一种高度准确高效的视频和语言理解模型，可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

人工智能机器学习模型训练大模型

AI 加速引擎 PAI-TorchAcc：整体介绍与性能概述

2024-03-04

作者作者：沈雯婷、黄奕桐、艾宝乐、王昂、李永

模型训练大模型 #人工智能机器学习PAI

AI 加速引擎 PAI-TorchAcc：OLMo 训练加速最佳实践

2024-03-04

作者：黄奕桐、沈雯婷、艾宝乐、王昂、李永

模型训练大模型机器学习PAI

https://static001.geekbang.org/infoq/f4/f424e28e0802ce81a3d4d4b4284547e2.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

新增模型检验，指标自动评估模型效果｜ModelWhale 版本更新

ModelWhale

2024-02-02

ModelWhale 将编程建模、模型训练、数据＆算力管理等功能深度整合，通过逐级开放的基础设施，与 Jupyter Notebook 交互式、Canvas 低代码拖拽式、CloudIDE 三种即开即用的云分析环境，为研究者团队解决数据安全应用、底层工程繁复、研究成果流转困难等问题。

人工智能机器学习大数据数据分析模型训练

MegEngine 正式支持 XLA 啦！

MegEngineBot

2023-12-13

XLA（Accelerated Linear Algebra）是 Google 提出的一个神经网络编译器，可以用于加速 AI 模型的训练和推理。MegEngine 1.13.1 中也已经支持了 XLA，在训练模型时可以选择开启此项功能，不同的模型可以获得 10%~80% 不等的速度提升。

模型训练开源框架模型推理

训练集、验证集与测试集的划分策略

2023-10-27

随着人工智能和机器学习的快速发展，如何有效地划分训练集、验证集和测试集成为了一个重要的问题。本文将详细讨论这些集合的划分比例，以及它们在机器学习过程中的作用和意义。

人工智能机器学习模型训练

深度学习预训练模型的突破与发展

2023-10-26

深度学习预训练模型在很多应用领域都表现出了优越的性能，如语音识别、自然语言处理和计算机视觉等。然而，对于这些预训练模型，一个问题一直困扰着研究人员和开发人员：预训练模型是否还需要进行额外的训练？

模型训练大模型深度学习‘’LLM

基于大模型训练的中文自然语言处理平台

2023-10-25

随着人工智能技术的快速发展，自然语言处理（NLP）技术也日益受到关注。在众多NLP技术中，预训练模型作为一种有效的自然语言处理方法，被广泛应用于各种任务中。

自然语言处理模型训练大模型

大模型训练：数据与算法的关键融合

2023-10-17

在今天的数字化时代，人工智能(AI)和机器学习(ML)领域已经变得至关重要。而Python，作为最受欢迎的编程语言之一，经常被用来进行各种AI和ML项目。这些项目需要使用特定的算法来分析数据并从中学习，而Python训练就是对这些算法的学习和实践。

人工智能模型训练大模型

https://static001.geekbang.org/infoq/af/af4e9d9bd641bb78c35b9af96496c1f2.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

突破大模型 | Alluxio 助力 AI 大模型训练 - 成功案例（一）

2023-08-15

更多详细内容可见《Alluxio助力AI大模型训练制胜宝典》

机器学习 gpu 模型训练大模型 AIGC

https://static001.geekbang.org/infoq/70/705e86e27dc7d801f2b6a38ed3b77baa.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

预约直播 | 展心展力 MetaApp：基于 DeepRec 的稀疏模型训练实践