写点什么

gpu

0 人感兴趣 · 58 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/45/45246d7f8caf3727a29206c49b17fbac.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

保姆教程 | 用 GPU 云主机搭建 AI 大语言模型并用 Flask 封装成 API,实现用户与模型对话 | 京东云技术团队

在本文中,我们将以chatglm-6b为例详细介绍GPU云主机搭建AI大语言模型的过程,并使用Flask构建前端界面与该模型进行对话。

Milvus 2.3 Massively Accelerates AI-Powered Applications With NVIDIA GPU Support

用户头像
Zilliz
03-23

NVIDIA GTC 2023—March 21, 2023—Zilliz[1], the inventor of the open-source vector database Milvus, today announced the beta launch of Milvus 2.3, featuring NVIDIA GPU support for greater flexibility and dramatic improvements in real-time

https://static001.geekbang.org/infoq/b9/b927b28c2ad7693d7b31b9229bf97708.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

喜马拉雅基于阿里云机器学习平台 PAI-HybridBackend 的深度学习模型训练优化实践

喜马拉雅AI云借助阿里云提供的HybridBackend开源框架,实现了其推荐模型在 GPU 上的高效训练。

https://static001.geekbang.org/infoq/48/482f137c6a8803f53c119b0642334485.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

用于双目重建中的 GPU 编程:julia-cuda

julia是2010年开始面世的语言,作为一个10后,Julia必然有前辈们没有的特点。本文着重介绍julia的项目背景、效率问题,如何使用for训练的方式、julia-cuda的实现方式。

https://static001.geekbang.org/infoq/8b/8b796f0cf4509280909c83b2eb3fe5a9.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

vivo 推荐业务 x DeepRec:全链路优化实践

DeepRec提供大量的解决方案帮助vivo用户快速实施GPU推理,便于业务快速构建推荐服务及算法策略高效迭代。

https://static001.geekbang.org/infoq/54/54c44d437cb1d87f469179ed9592ba70.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

GPU 和显卡是什么关系?

用户头像
Finovy Cloud
2022-11-08

在没有GPU之前,基本上所有的任务都是交给CPU来做的。有GPU之后,二者就进行了分工,CPU负责逻辑性强的事物处理和串行计算,GPU则专注于执行高度线程化的并行处理任务(大规模计算任务)。

https://static001.geekbang.org/infoq/1f/1f6aa198895e889d67143c25c6b5a1a8.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

“云上生长”网络研讨会|使用 GPU 和 VPU 等异构硬件加速视频转码

随着 AI 技术的成熟,以及云游戏、直播等新应用的普及,流量的形式已经从文字、图形、图像转变为音频、视频等流媒体。

用 Rust 编写的 Linux 内核 GPU 驱动程序,或将到来

用户头像
非凸科技
2022-08-16

外媒 Phoronix 报道,Asahi Linix 的核心开发者 Asahi Lina 正在探索用 Rust 编程语言编写该 DRM 内核 GPU 驱动程序的可行性。

https://static001.geekbang.org/infoq/3a/3a77b9fcbf75f76404f052d37601127b.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

一块 GPU 训练 TB 级推荐模型不是梦,OneEmbedding 性能一骑绝尘

用户头像
OneFlow
2022-08-12

针对现代推荐系统的种种痛点,OneFlow 团队推出了一款高性能、可扩展、灵活度高的推荐系统组件 OneEmbedding。它的使用方式和通用深度学习框架一样简单,性能却远超通用框架,甚至超过了 NVIDIA HugeCTR 这样为推荐场景定制开发的系统。

https://static001.geekbang.org/infoq/3e/3ee738f2bf21ff13290a1db52ce60bd5.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

GPU 加速 Pinterest 推荐模型,参数量增加 100 倍,用户活跃度提高 16%

用户头像
OneFlow
2022-08-10

将基于CPU模型服务转换成基于GPU服务的过程很复杂,但这是我们在Pinterest使用最先进推荐模型的一个必要步骤。我们能够以适当的成本提供大100倍的推荐模型,这为我们的机器学习工程师给Pinner解锁更相关和响应更迅速的推荐内容提供了基础。

https://static001.geekbang.org/infoq/f9/f9e55566992052a8d90501a9bc71e6e8.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

云 GPU 如何安装和启动 VNC 远程桌面服务?

用户头像
恒源云
2022-08-03

大家桌面安装后,启动VNC服务,可通过VNC来连接实例桌面,平台已提供了Ubuntu的xfce4桌面安装文档,大家参照步骤进行安装及使用即可。

https://static001.geekbang.org/infoq/da/da51a4a2c50a98edfa7340047daeacee.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

kubernetes GPU 的困境和破局

用户头像
琦彦
2022-07-24

随着人工智能与机器学习技术的快速发展,在 Kubernetes 上运行模型训练、图像处理类程序的需求日益增加,而实现这类需求的基础,就是 Kubernetes 对 GPU 等硬件加速设备的支持与管理。

https://static001.geekbang.org/infoq/6d/6d9993c32d3f3b425c11dfd57ca9f2e1.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

十分钟生成影视级室内设计效果,红星美凯龙设计云如何升级传统家居行业

依托于阿里云强大的弹性云上GPU算力,红星美凯龙可以为客户提供快速的、高质量的渲染,实现秒级的门店快速设计。

https://static001.geekbang.org/infoq/a7/a7ac6ee41b139f9fdca9dd97745adb43.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

大模型训练难于上青天?效率超群、易用的“李白”模型库来了

用户头像
OneFlow
2022-07-14

大模型对显存的需求增长远超过 GPU 显存增长的速度,根据 OpenAI 的报告,模型大小的增长速度是每 3.5 月翻一倍,而 GPU 显存则需要 18 个月才能翻倍。受限于 GPU 显存,单个 GPU 无法再容纳大规模模型参数。

https://static001.geekbang.org/infoq/7c/7c26def9ac1072e896169917ee4be467.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

GPU 管线概述

用户头像
Finovy Cloud
2022-07-08

顶点着色器是流水线的第一个阶段,它的输入来自于CPU。顶点着色器的处理单位是顶点,也就是说输入进来的每个顶点都会调用一次顶点着色器。

https://static001.geekbang.org/infoq/fc/fc0efb5b553947bfa1e63e33d2ec7e62.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

助力工业化设计,提升变电站三维设计效率和业务保障

用户头像
焱融科技
2022-06-08

当前,随着国家基础建设规模和速度不断增大的市场环境下,现有数据平台已然不能满足图形工作站三维数字化设计的发展。基于此背景,我们将以某电力信产公司变电站工程的三维设计平台为例,探求他们是如何搭建起具备高性能、高可用、高扩展等特性的数据平台。

https://static001.geekbang.org/infoq/fa/fa4b1d92855e2b018f0fb9804d3dc7e1.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

阿里云刘珅孜:云游戏带来的启发——端上创新

围绕移动端来打造创新场景,重视轻量化趋势。

https://static001.geekbang.org/infoq/e9/e96f4d1ec06e1ea09d7540ee28411fba.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

深度学习利器之 GPU

用户头像
AIWeker
2022-05-26

深度学习算法在CPU和GPU上的训练效率有明显的差距。为什么GPU更适合深度学习,今天和大家扒一扒GPU。

https://static001.geekbang.org/infoq/b7/b7d7aee521857473584b28a09593a3a9.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

GPU 不可不知的指标项

用户头像
AIWeker
2022-05-25

你可以在本文中看到:GPU的显存和计算力 ;深度学习中显存的占用 ;市场上GPU产品选择

https://static001.geekbang.org/infoq/94/94dfca1df828c5403f3590a186fdee08.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

国产 CPU 产业链的逻辑架构

用户头像
Finovy Cloud
2022-05-24

服务器的逻辑架构主要包含:处理器(GPU、CPU、DPU等)、存储器、I/O接口以及SSD、BMC、主板、电源等。

https://static001.geekbang.org/infoq/64/64f788ba69696031b3e729d61ac89767.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

什么是显卡?GPU 服务器到底有什么作用?

用户头像
Finovy Cloud
2022-05-23

通常在CAD软件中,工作站计算能力及图形处理能力的提高,也将概念设计中的交互性提升至新高度。如今在主流的建模程序中(如SOLIDWORKS、Autodesk Inventor、PTC Creo和Siemens PLM Software的NX等),用户已能够很快对CAD建模结果进行渲染,以照片级写实的模

https://static001.geekbang.org/infoq/2b/2bb5e70b7a6033d81483173a5f400ba4.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

服务器 CPU 和普通 CPU 有什么区别?常用的服务器有六大区别

用户头像
Finovy Cloud
2022-05-13

其实现在很多人都听说或者接触过服务器,众所周知,服务器是网络中的重要设备,要接受少至几十人、多至成千上万人的访问,因此对服务器具有大数据量的快速吞吐、超强的稳定性、长时间运行等严格要求。

https://static001.geekbang.org/infoq/6a/6a404457d25a0129f55bf607e0c6f455.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

深度学习|AI 芯片:上游产业率先爆发

用户头像
Finovy Cloud
2022-05-12

深度学习要求极高的并行计算能力,大数据、算力、训练方法等领域的突破使AI芯片作为上游产业率先爆发。

https://static001.geekbang.org/infoq/54/54c44d437cb1d87f469179ed9592ba70.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

GPU 分类和应用现状分析

用户头像
Finovy Cloud
2022-05-11

GPU最初用在PC和移动端上运行绘图运算工作的微处理器,与CPU集成以集成显卡(核显)的形态发挥功能。NVIDIA于2007年率先推出独立GPU(独显),使其作为“协处理器”在PC和服务器端负责加速计算,承接CPU计算密集部分的工作负载,同时由CPU继续运行其余程序代

https://static001.geekbang.org/infoq/32/321c37eaebc39e7e33b2acaeda02072d.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

【ELT.ZIP】OpenHarmony 啃论文俱乐部——点燃主缓存压缩技术火花

用户头像
ELT.ZIP
2022-04-30

本文出自ELT.ZIP团队,ELT<=>Elite(精英),.ZIP为压缩格式,ELT.ZIP即压缩精英。

gpu_gpu技术文章_InfoQ写作社区