文章 2024-11-27 来自:开发者社区

【AI系统】GPU 工作原理

前面的文章对 AI 计算体系和 AI 芯片基础进行讲解,在 AI 芯片基础中关于通用图形处理器 GPU 只是简单地讲解了主要概念,将从 GPU 硬件基础和英伟达 GPU 架构两个方面讲解 GPU 的工作原理。英伟达 GPU 有着很长的发展历史,整体架构从 Fermi 到 Blankwell 架构演变了非常多代,其中和 AI 特别相关的就有 ...

【AI系统】GPU 工作原理
阿里云文档 2024-05-09

AI通信加速库DeepNCCL的架构、性能以及优化原理

DeepNCCL是为阿里云神龙异构产品开发的一种用于多GPU互联的AI通信加速库,在AI分布式训练或多卡推理任务中用于提升通信效率。本文主要介绍DeepNCCL的架构、优化原理和性能说明。

文章 2024-02-04 来自:开发者社区

【GPU】GPU CUDA 编程的基本原理是什么?

【GPU】GPU CUDA 编程的基本原理是什么? 作者:董鑫 想学好 CUDA 编程, 第一步就是要理解 GPU 的硬件结构, 说到底, CUDA 的作用就是最大程度压榨出 NVIDIA GPU 的计算资源. 想要从零理解起来, 还有有些难度. 这里希望能够用最简单的方式把一些最基本的内容讲清楚. 所以, 本文以易懂性为主, 牺牲了一些完全准确性....

文章 2022-08-09 来自:开发者社区

GPU架构及异构计算介绍GPU架构以及异构计算的基本原理

一篇文章理解CUDA架构、编程与进阶使用一、CUDA架构二、CUDA编程基础1.矩阵加法2.矩阵乘法三、CUDA进阶 I——利用共享内存加速访存1.CUDA内存读写速度比较2.申请共享内存四、CUDA进阶 II——利用stream加速大批量文件IO读写耗时1. 认识CUDA stream2. CUDA stream API介绍五、CUDA进阶 III——调用cuBLAS库API进行矩阵计算本文章....

GPU架构及异构计算介绍GPU架构以及异构计算的基本原理
文章 2022-06-11 来自:开发者社区

Android GPU呈现模式原理及卡顿掉帧浅析

APP开发中,卡顿绝对优化的大头,Google为了帮助开发者更好的定位问题,提供了不少工具,如Systrace、GPU呈现模式分析工具、Android Studio自带的CPU Profiler等,主要是辅助定位哪段代码、哪块逻辑比较耗时,影响UI渲染,导致了卡顿。拿Profile GPU Rendering工具而言,它用一种很直观的方式呈现可能超时的节点,该工具及其原理也是本文的重点:CPU ....

Android GPU呈现模式原理及卡顿掉帧浅析
文章 2021-06-01 来自:开发者社区

NVIDIA GPU Operator分析六:NVIDIA GPU Operator原理分析

背景我们知道,如果在Kubernetes中支持GPU设备调度,需要做如下的工作:节点上安装nvidia驱动节点上安装nvidia-docker集群部署gpu device plugin,用于为调度到该节点的pod分配GPU设备。除此之外,如果你需要监控集群GPU资源使用情况,你可能还需要安装DCCM export...

NVIDIA GPU Operator分析六:NVIDIA GPU Operator原理分析
问答 2021-03-23 来自:开发者社区

ECI GPU 的基本实现原理以及容器启动流程是什么样的?

ECI GPU 的基本实现原理以及容器启动流程是什么样的?

文章 2020-03-26 来自:开发者社区

GPU服务器计算原理

图形处理器(英语:Graphics Processing Unit,缩写:GPU),又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上图像运算工作的微处理器。 用途是将计算机系统所需要的显示信息进行转换驱动,并向显示器提供行扫描信号,控制显示器的正确显示,是连接显示器和个人电脑主板的重要元件,也是“人机对话”的重要设备之一。显卡作为....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云服务器ECS

云服务器ECS是一种安全可靠、弹性可伸缩的IaaS级云计算服务。在这里你可以获取最新的ECS产品资讯、最前沿的技术交流以及优惠活动等信息,加速自己的技术成长。

+关注