文章 2018-04-18 来自:开发者社区

英伟达CEO黄仁勋:GPU是AI时代利器,发布全球首款可编程AI引擎

我们看到已经脱下显卡厂商标签的英伟达,在人工智能的路上走得越来越远。 9月26日,英伟达于北京召开的GTC 大会中国站正式开幕,英伟达创始人兼CEO黄仁勋用了两小时的时间系统的介绍了英伟达的人工智能生态发展。 在主题为《AI Trends, Challenges and Opportunities》的演讲中,黄仁勋表示人工智能无处不在,摩尔定律已经终结,而深...

英伟达CEO黄仁勋:GPU是AI时代利器,发布全球首款可编程AI引擎
文章 2018-03-06 来自:开发者社区

GPU编程之进击的优化系列三--基于GPU的稀疏直接求解器

第三章 基于GPU的大规模稀疏矩阵直接求解器 3.0 简介 3.1 基于quotient graph的符号分析 3.1.1 顶点重排序 3.1.2 构建消去树 3.1.3 寻找超结点 3.1.4 符号分解 3.2 多波前法 3.3 超节点方法 3.4 多波前+超节点方法的并行分解算法 小结 参考资料 第三章 基于GPU的稀疏直接求解器 前言     本章可能是所有章节中最难得了...

文章 2018-03-06 来自:开发者社区

GPU编程之进击的优化系列一设备微架

第一章设备微架构 1.0CUDA设备 1.0.0 核心微架构 1.0.1 指令编码格式 1.0.2 寄存器文件结构 1.0.3 指令流水线 1.0.4 Pascal架构(待续) 1.1 GCN设备 1.1.0 核心微架构 1.1.1 指令编码格式 1.1.2 寄存器文件结构 1.1.3 指令流水线 1.2 GPU设备上的条件分支 第一章     设备微架构 ...

文章 2018-03-06 来自:开发者社区

GPU编程之进击的优化系列四--GPU编程优化技术总结

第四章 GPU编程优化技术总结 4.1.0 CUDA设备上的优化技术 4.1.1 访存优化 4.1.2 指令优化 4.1.3 内核调用优化 4.2.0 GCN设备上的优化技术 4.2.1 访存优化 4.2.2 指令优化 4.2.3 内核调用优化 4.3 构建性能可移植的程序 第四章 GPU编程优化技术总结 我们在两个章节分别讲述针对CUDA和GCN这两大目前主流的GPU并行计算的设备。但是诸如合....

文章 2018-02-10 来自:开发者社区

GPU 编程入门到精通之 第一个 GPU 程序

GPU 编程入门到精通之 第一个 GPU 程序http://www.bieryun.com/1139.html 博主由于工作当中的需要,开始学习 GPU 上面的编程,主要涉及到的是基于 GPU 的深度学习方面的知识,鉴于之前没有接触过 GPU 编程,因此在这里特地学习一下 GPU 上面的编程。有志同道合的小伙伴,欢迎一起交流和学习,。使用的是自己的老古董笔记本上面的 Geforce 10...

文章 2017-07-03 来自:开发者社区

《CUDA C编程权威指南》——1.3 用GPU输出Hello World

本节书摘来自华章计算机《CUDA C编程权威指南》一书中的第1章,第1.3节,作者 [美] 马克斯·格罗斯曼(Max Grossman),译 颜成钢 殷建 李亮,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.3 用GPU输出Hello World 学习一个新编程语言的最好方法就是使用这种新语言来编写程序。在本节,你将开始编写在GPU上运行的第一个内核代码。像其他任何编程语言一样编写....

问答 2017-06-23 来自:开发者社区

【教程免费下载】 多核与GPU编程: 工具、方法及实践

前言        多核架构出现在21世纪的第一个10年里,给并行计算带来了勃勃生机。新平台需要新方法来进行软件开发,其中一个新方法就是把工具和工作站网络时代的惯例同新兴软件平台(如CUDA)相结合。        为满足这种需求,本书将介绍目前主流的工具和技术,不仅是各自独立的...

文章 2017-05-02 来自:开发者社区

《多核与GPU编程:工具、方法及实践》----2.2 PCAM方法学

本节书摘来自华章出版社《多核与GPU编程:工具、方法及实践》一书中的第2章,第2.2节, 作 者 Multicore and GPU Programming: An Integrated Approach[阿联酋]杰拉西莫斯·巴拉斯(Gerassimos Barlas) 著,张云泉 贾海鹏 李士刚 袁良 等译, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.2 PCAM方法学 ...

文章 2017-05-02 来自:开发者社区

《多核与GPU编程:工具、方法及实践》----第2章 多核和并行程序设计 2.1 引言

本节书摘来自华章出版社《多核与GPU编程:工具、方法及实践》一书中的第2章,第2.1节, 作 者 Multicore and GPU Programming: An Integrated Approach[阿联酋]杰拉西莫斯·巴拉斯(Gerassimos Barlas) 著,张云泉 贾海鹏 李士刚 袁良 等译, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 第2章 多核和并行程序设...

文章 2017-05-02 来自:开发者社区

《多核与GPU编程:工具、方法及实践》----1.5 并行程序性能的预测与测量

本节书摘来自华章出版社《多核与GPU编程:工具、方法及实践》一书中的第1章,第1.5节, 作 者 Multicore and GPU Programming: An Integrated Approach[阿联酋]杰拉西莫斯·巴拉斯(Gerassimos Barlas) 著,张云泉 贾海鹏 李士刚 袁良 等译, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.5 并行程序性能的预...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云服务器ECS

做技术先进、性能优异、稳如磐石的弹性计算!

+关注