阿里云文档 2025-04-14

如何在GPU硬件上使用PAI-Blade量化优化

PAI-Blade支持TensorFlow和PyTorch模型在GPU硬件、端侧设备的INT8量化。本文主要介绍在GPU硬件上,如何使用PAI-Blade量化优化。

文章 2024-08-29 来自:开发者社区

GPU 加速与 PyTorch:最大化硬件性能提升训练速度

摘要 GPU(图形处理单元)因其并行计算能力而成为深度学习领域的重要组成部分。本文将介绍如何利用PyTorch来高效地利用GPU进行深度学习模型的训练,从而最大化训练速度。我们将讨论如何配置环境、选择合适的硬件、编写高效的代码以及利用高级特性来提高性能。 1. 引言 深度学习模型的训练过程通常需要大量的计算资源。GPU因其高度并行化的架构而成为加速这些计...

文章 2024-03-06 来自:开发者社区

GPU 硬件与 CUDA 程序开发工具

GPU 硬件简介 从十多年前起,GPU 的浮点数运算峰值就比同时期的 CPU 高一个量级;GPU 的内存带宽峰值也比同时期的 CPU 高一个量级。 CPU 和 GPU 的显著区别是:一个典型的 CPU 拥有少数几个快速的计算核心,而一个典型的 GPU 拥有几百到几千个不那么快速的计算核心。CPU 中有更多的晶体管用于数据缓存和流程控制,但 GPU 中有更多的晶体管用于算术逻辑单元...

GPU 硬件与 CUDA 程序开发工具
文章 2024-02-04 来自:开发者社区

【GPU】GPU 硬件与 CUDA 程序开发工具

GPU 硬件与 CUDA 程序开发工具 笔记内容来自:《CUDA 编程:基础与实践》—樊哲勇 著 GPU 硬件简介 GPU 是英文 graphics processing unit 的首字母缩写,意为图形处理器。GPU 也常被称为显卡(graphics card)...

【GPU】GPU 硬件与 CUDA 程序开发工具
文章 2024-02-04 来自:开发者社区

【GPU】深入理解GPU硬件架构及运行机制

深入理解GPU硬件架构及运行机制 作者:Tim在路上 曾看到有一篇名为《The evolution of a GPU: from gaming to computing》的文章。 这篇文...

【GPU】深入理解GPU硬件架构及运行机制
文章 2024-01-05 来自:开发者社区

龚大视频学习笔记:上帝视角看GPU(3):部署到硬件

前言前几天我们过了一遍,现在的GPU在逻辑上应该包含哪些功能模块?当然要直接设计成硬件,必然会遇到很多问题,成本,性能,功耗,性能等。下面就来探讨一下这些问题的解决方法,回到最基本的图形流水线,这是我的第一个带有基本的可编程流水线CPU的显卡。2003年的geforce fx 5600。在硬件上他有两个vertex shader单元,四个pixel shader单元,所以当顶点和像素的工作量是1....

龚大视频学习笔记:上帝视角看GPU(3):部署到硬件
文章 2022-08-09 来自:开发者社区

GPU架构及异构计算介绍GPU硬件平台

第四章 硬件实现更多精彩内容,请扫描下方二维码或者访问https://developer.nvidia.com/zh-cn/developer-program 来加入NVIDIA开发者计划NVIDIA GPU 架构围绕可扩展的多线程流式多处理器 (SM: Streaming Multiprocessors) 阵列构建。当主机 CPU 上的 CUDA 程序调用内核网格时,网格的块被枚举并分发到具有....

GPU架构及异构计算介绍GPU硬件平台
文章 2021-11-09 来自:开发者社区

如何用 GPU硬件层加速优化Android系统的游戏流畅度

作为一款VR实时操作游戏App,我们需要根据重力感应系统,实时监控手机的角度,并渲染出相应位置的VR图像,因此在不同 Android 设备之间,由于使用的芯片组和不同架构的GPU,游戏性能会因此受到影响。举例来说:游戏在 Galaxy S20+ 上可能以 60fps 的速度渲染,但它在HUAWEI P50 Pro上的表现可能与前者大相径庭。 由于新版本的手机具有良好的配置,而游戏需要考虑基于底层....

如何用 GPU硬件层加速优化Android系统的游戏流畅度
文章 2018-02-05 来自:开发者社区

重磅译制 | 更新:牛津大学xDeepMind自然语言处理 第6讲(下)NLP硬件和软件-英伟达GPU

牛津大学Deep NLP是一门关于自然语言处理(NLP)的高阶课程。课程由牛津大学和谷歌DeepMind(AlphaGo的开发机构)联合开设,是牛津大学计算机系2017年春季学期最新课程。由Phil Blunsom主讲,同时邀请到多位来自DeepMind和NVIDIA的业界讲师来做客座讲座。 大数据文摘已联系课程主讲人取得翻译授权,并联合北京邮电大学模式识别实验室组织了视频汉化,免费发布。 课程....

文章 2017-08-02 来自:开发者社区

深度学习的三种硬件方案 ASICs、FPGAs 和 GPU,开发者需要知道什么?

今年三月 AlphaGo 和李世石的“世纪之战”炒红了深度学习—— AlphaGo 采用了人工神经网络技术,充分挖掘了深度学习的潜力。简单来说,深度学习是一个包含了许多层级数据处理的神经网络,以自动化方式组合起来解决问题。 人机大战之前,相当多的人并不看好 AlphaGo,包括许多围棋、AI 业内人士 。但公众并不清楚的是:当时谷歌手中握着一张王牌——AlphaGo 的计算设备搭载了特制硬件,一....

深度学习的三种硬件方案 ASICs、FPGAs 和 GPU,开发者需要知道什么?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云服务器ECS

做技术先进、性能优异、稳如磐石的弹性计算!

+关注