文章 2024-09-09 来自:开发者社区

CUDA统一内存:简化GPU编程的内存管理

CUDA统一内存:简化GPU编程的内存管理 在现代GPU编程中,内存管理一直是开发者面临的一个重要挑战。特别是在使用NVIDIA CUDA进行高性能计算时,如何在CPU和GPU之间高效地传输数据、以及如何管理这些数据的生命周期,都是影响程序性能和易用性的关键因素。为了简化这一过程,NVIDIA引入了统一内存(Unified Memory)的概念,它在CUDA 6.0及以后的版本中得到了支持...

CUDA统一内存:简化GPU编程的内存管理
文章 2024-03-06 来自:开发者社区

上帝视角看GPU(5):图形流水线里的不可编程单元

前几期我们过了一遍GPU的软硬栈。这次我们将深入GPU图形流水线的一些细节,看看那些不可编程的模块是怎么工作的。 对于GPU的图形流水线来说,最核心最重要的一个组件就是光栅化器。 它的存在,直接决定了GPU在实时渲染...

上帝视角看GPU(5):图形流水线里的不可编程单元
文章 2024-02-04 来自:开发者社区

【GPU】GPU CUDA 编程的基本原理是什么?

【GPU】GPU CUDA 编程的基本原理是什么? 作者:董鑫 想学好 CUDA 编程, 第一步就是要理解 GPU 的硬件结构, 说到底, CUDA 的作用就是最大程度压榨出 NVIDIA GPU 的计算资源. 想要从零理解起来, 还有有些难度. 这里希望能够用最简单的方式把一些最基本的内容讲清楚. 所以, 本文以易懂性为主, 牺牲了一些完全准确性....

文章 2023-12-08 来自:开发者社区

探索AIGC未来:CPU源码优化、多GPU编程与中国算力瓶颈与发展

★人工智能;大数据技术;AIGC;Turbo;DALL·E 3;多模态大模型;MLLM;LLM;Agent;Llama2;国产GPU芯片;GPU;CPU;高性能计算机;边缘计算;大模型显存占用;5G;深度学习;A100;H100;A800;H800;L40s;Intel;英伟达;算力近年来,AIGC的技术取得了长足的进步,其中最为重要的技术之一是基于源代码的CPU调优,可以有效地提高人工智能模型....

探索AIGC未来:CPU源码优化、多GPU编程与中国算力瓶颈与发展
问答 2021-10-22 来自:开发者社区

并行编程为什么要使用GPU编程?

并行编程为什么要使用GPU编程?

文章 2019-11-16 来自:开发者社区

带你读《基于CUDA的GPU并行程序开发指南》之一:CPU并行编程概述

高性能计算技术丛书点击查看第二章点击查看第三章基于CUDA的GPU并行程序开发指南GPU Parallel Program Development Using CUDA [美]托尔加·索亚塔(Tolga Soyata) 著唐 杰 译 第1章 CPU并行编程概述本书是一本适用于自学GPU和CUDA编程的教科书,我可以想象当读者发现第1章叫“CPU并行编程概述”时的惊讶。我们的想法是,本书希望读者.....

文章 2019-02-18 来自:开发者社区

GPU编程(五): 利用好shared memory

目录 前言 CPU矩阵转置 GPU实现 简单移植 单block tile 利用率计算 shared memory 最后 前言 之前在第三章对比过CPU和GPU, 差距非常大. 这一次来看看GPU自身的优化, 主要是shared memory的用法. CPU矩阵转置 矩阵转置不是什么复杂的事情. 用CPU实现是很简单的: #include <stdio.h> #in...

GPU编程(五): 利用好shared memory
文章 2019-02-17 来自:开发者社区

GPU编程(四): 并行规约优化

目录 前言 cuda-gdb 未优化并行规约 优化后并行规约 结果分析 最后 前言 之前第三篇也看到了, 并行方面GPU真的是无往不利, 现在再看下第二个例子, 并行规约. 通过这次的例子会发现, 需要了解GPU架构, 然后写出与之对应的算法的, 两者结合才能得到令人惊叹的结果. 这次也会简要介绍下cuda-gdb的用法, 其实和gdb用法几乎一样, 也就是多了个cuda命令. cu...

GPU编程(四): 并行规约优化
文章 2018-10-23 来自:开发者社区

GPU编程(二): GPU架构了解一下!

目录 前言 GPU架构 GPU处理单元 概念GPU GPU线程与SM GPU线程 SM 加法 统一内存 乘法 最后 前言 在实际CUDA编程之前, 先来了解下GPU的结构. 和CPU相比显得粗暴又强大(手动滑稽). GPU架构 GPU处理单元 从这张GPU概念内核图开始讲起, 会发现和CPU内核是不同的, 少了三级缓存, 分支预测等等. 但是增加了ALU的数量, 扩大了...

GPU编程(二): GPU架构了解一下!
文章 2018-10-19 来自:开发者社区

GPU编程(一): Ubuntu下的CUDA8.0环境搭建

目录 前言 开发环境一览 显卡驱动安装 下载驱动 禁用nouveau 安装驱动 安装CUDA8.0 第一个CUDA程序 向世界问好 最后 前言 在Linux下安装驱动真的不是一件简单的事情, 尤其是显卡驱动, 一失败直接进不去系统都是很可能的. 我在经历了无数折磨之后终于搭起了CUDA编程环境. 我是很心水老黄的, 但是, 我还是想说"So, Nvidia: FUCK YOU!"(...

GPU编程(一): Ubuntu下的CUDA8.0环境搭建

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云服务器ECS

做技术先进、性能优异、稳如磐石的弹性计算!

+关注