gpu
0 人感兴趣 · 58 次引用
- 最新
- 推荐
保姆教程 | 用 GPU 云主机搭建 AI 大语言模型并用 Flask 封装成 API,实现用户与模型对话 | 京东云技术团队
在本文中,我们将以chatglm-6b为例详细介绍GPU云主机搭建AI大语言模型的过程,并使用Flask构建前端界面与该模型进行对话。
Milvus 2.3 Massively Accelerates AI-Powered Applications With NVIDIA GPU Support
NVIDIA GTC 2023—March 21, 2023—Zilliz[1], the inventor of the open-source vector database Milvus, today announced the beta launch of Milvus 2.3, featuring NVIDIA GPU support for greater flexibility and dramatic improvements in real-time
喜马拉雅基于阿里云机器学习平台 PAI-HybridBackend 的深度学习模型训练优化实践
喜马拉雅AI云借助阿里云提供的HybridBackend开源框架,实现了其推荐模型在 GPU 上的高效训练。
vivo 推荐业务 x DeepRec:全链路优化实践
DeepRec提供大量的解决方案帮助vivo用户快速实施GPU推理,便于业务快速构建推荐服务及算法策略高效迭代。
GPU 和显卡是什么关系?
在没有GPU之前,基本上所有的任务都是交给CPU来做的。有GPU之后,二者就进行了分工,CPU负责逻辑性强的事物处理和串行计算,GPU则专注于执行高度线程化的并行处理任务(大规模计算任务)。
“云上生长”网络研讨会|使用 GPU 和 VPU 等异构硬件加速视频转码
随着 AI 技术的成熟,以及云游戏、直播等新应用的普及,流量的形式已经从文字、图形、图像转变为音频、视频等流媒体。
一块 GPU 训练 TB 级推荐模型不是梦,OneEmbedding 性能一骑绝尘
针对现代推荐系统的种种痛点,OneFlow 团队推出了一款高性能、可扩展、灵活度高的推荐系统组件 OneEmbedding。它的使用方式和通用深度学习框架一样简单,性能却远超通用框架,甚至超过了 NVIDIA HugeCTR 这样为推荐场景定制开发的系统。
GPU 加速 Pinterest 推荐模型,参数量增加 100 倍,用户活跃度提高 16%
将基于CPU模型服务转换成基于GPU服务的过程很复杂,但这是我们在Pinterest使用最先进推荐模型的一个必要步骤。我们能够以适当的成本提供大100倍的推荐模型,这为我们的机器学习工程师给Pinner解锁更相关和响应更迅速的推荐内容提供了基础。
云 GPU 如何安装和启动 VNC 远程桌面服务?
大家桌面安装后,启动VNC服务,可通过VNC来连接实例桌面,平台已提供了Ubuntu的xfce4桌面安装文档,大家参照步骤进行安装及使用即可。
kubernetes GPU 的困境和破局
随着人工智能与机器学习技术的快速发展,在 Kubernetes 上运行模型训练、图像处理类程序的需求日益增加,而实现这类需求的基础,就是 Kubernetes 对 GPU 等硬件加速设备的支持与管理。
十分钟生成影视级室内设计效果,红星美凯龙设计云如何升级传统家居行业
依托于阿里云强大的弹性云上GPU算力,红星美凯龙可以为客户提供快速的、高质量的渲染,实现秒级的门店快速设计。
大模型训练难于上青天?效率超群、易用的“李白”模型库来了
大模型对显存的需求增长远超过 GPU 显存增长的速度,根据 OpenAI 的报告,模型大小的增长速度是每 3.5 月翻一倍,而 GPU 显存则需要 18 个月才能翻倍。受限于 GPU 显存,单个 GPU 无法再容纳大规模模型参数。
GPU 管线概述
顶点着色器是流水线的第一个阶段,它的输入来自于CPU。顶点着色器的处理单位是顶点,也就是说输入进来的每个顶点都会调用一次顶点着色器。
国产 CPU 产业链的逻辑架构
服务器的逻辑架构主要包含:处理器(GPU、CPU、DPU等)、存储器、I/O接口以及SSD、BMC、主板、电源等。
什么是显卡?GPU 服务器到底有什么作用?
通常在CAD软件中,工作站计算能力及图形处理能力的提高,也将概念设计中的交互性提升至新高度。如今在主流的建模程序中(如SOLIDWORKS、Autodesk Inventor、PTC Creo和Siemens PLM Software的NX等),用户已能够很快对CAD建模结果进行渲染,以照片级写实的模
服务器 CPU 和普通 CPU 有什么区别?常用的服务器有六大区别
其实现在很多人都听说或者接触过服务器,众所周知,服务器是网络中的重要设备,要接受少至几十人、多至成千上万人的访问,因此对服务器具有大数据量的快速吞吐、超强的稳定性、长时间运行等严格要求。
深度学习|AI 芯片:上游产业率先爆发
深度学习要求极高的并行计算能力,大数据、算力、训练方法等领域的突破使AI芯片作为上游产业率先爆发。
GPU 分类和应用现状分析
GPU最初用在PC和移动端上运行绘图运算工作的微处理器,与CPU集成以集成显卡(核显)的形态发挥功能。NVIDIA于2007年率先推出独立GPU(独显),使其作为“协处理器”在PC和服务器端负责加速计算,承接CPU计算密集部分的工作负载,同时由CPU继续运行其余程序代
【ELT.ZIP】OpenHarmony 啃论文俱乐部——点燃主缓存压缩技术火花
本文出自ELT.ZIP团队,ELT<=>Elite(精英),.ZIP为压缩格式,ELT.ZIP即压缩精英。