文章 2021-12-05 来自:开发者社区

如何让Transformer在GPU上跑得更快?快手:需要GPU底层优化

背景从 Google 在 2017 年发表著名的「Attention is all you need」文章开始,Transformer 架构就开始攻占 AI 的多个领域:不仅成为自然语言处理(NLP)和语音等很多 AI 应用的默认核心架构,同时也成功跨界到计算机视觉方向,在超分辨率、图像识别和物体检测中取得 state-of-the-art 的性能。然而,Transformer 架构对计算和存储....

如何让Transformer在GPU上跑得更快?快手:需要GPU底层优化
文章 2021-11-09 来自:开发者社区

如何用 GPU硬件层加速优化Android系统的游戏流畅度

作为一款VR实时操作游戏App,我们需要根据重力感应系统,实时监控手机的角度,并渲染出相应位置的VR图像,因此在不同 Android 设备之间,由于使用的芯片组和不同架构的GPU,游戏性能会因此受到影响。举例来说:游戏在 Galaxy S20+ 上可能以 60fps 的速度渲染,但它在HUAWEI P50 Pro上的表现可能与前者大相径庭。 由于新版本的手机具有良好的配置,而游戏需要考虑基于底层....

如何用 GPU硬件层加速优化Android系统的游戏流畅度
文章 2020-08-13 来自:开发者社区

ACK实现GPU成本优化最佳实践

直达最佳实践:【ACK实现GPU成本优化最佳实践】最佳实践频道:【点击查看更多上云最佳实践】 这里有丰富的企业上云最佳实践,从典型场景入门,提供一系列项目实践方案,降低企业上云门槛的同时满足您的需求! 场景描述 利用阿里云容器服务ACK部署GPU集群之后,出于成本优化的考虑,对于集群中GPU利用率不高的应用,比如推理的应用,建议利用阿里云cGPU技术将一定数量的应用跑到一块GPU卡上,以提高...

ACK实现GPU成本优化最佳实践
文章 2019-02-17 来自:开发者社区

GPU编程(四): 并行规约优化

目录 前言 cuda-gdb 未优化并行规约 优化后并行规约 结果分析 最后 前言 之前第三篇也看到了, 并行方面GPU真的是无往不利, 现在再看下第二个例子, 并行规约. 通过这次的例子会发现, 需要了解GPU架构, 然后写出与之对应的算法的, 两者结合才能得到令人惊叹的结果. 这次也会简要介绍下cuda-gdb的用法, 其实和gdb用法几乎一样, 也就是多了个cuda命令. cu...

GPU编程(四): 并行规约优化
文章 2018-10-31 来自:开发者社区

阿里云超算集谛优化GPU异构并行性能:GROMACS

作者:慕笛“集谛”是一款内置于阿里云弹性高性能计算(Elastic High Performance Computing,E-HPC)的云上性能监控与分析引擎,支持集群资源利用情况的实时监控和用户作业运行情况的在线分析。对于采用GPU加速的异构计算应用场景,“集谛”除了监控节点host端资源外还能监控GPU device端的资源利用情况,给出GPU利用率、显存利用率和PCI-E数据传输带宽等性能....

阿里云超算集谛优化GPU异构并行性能:GROMACS
文章 2018-10-31 来自:开发者社区

FFmpeg在Intel GPU上的硬件加速与优化

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/83572780 ...

文章 2018-05-07 来自:开发者社区

GPU高级调试与优化

点击关注异步图书,置顶公众号 每天与你分享IT好书 技术干货 职场知识 ​ GPU的历史很短,只有十几年。但它发展迅猛,凭借强大的并行计算能力和高效率的固定硬件单元,在人工智能、区块链、虚拟和增强现实(VR/AR)、3D游戏和建模、视频编解码等领域大显身手。而且这种趋势还在延续,基于GPU的应用和创新势头正猛。 但是从系统架构来看,针对GPU的架构转型还在进行过程中,目前GPU依然还处于外设...

文章 2018-04-10 来自:开发者社区

AI开发者福音!国内首个基于NGC的GPU优化容器已在阿里云正式推出

NGC容器可以接入NVIDIA优化的深度学习软件、HPC应用、NVIDIA HPC 可视化工具和合作伙伴的应用。阿里云成为中国首家与NGC GPU加速的容器合作的云厂商。 目前从事人工智能业务的工程师全球数量超过百万,对于最新的深度学习框架以及便利的开发环境需求强烈。过去,安装驱动、编译库文件等软件集成工作费时费力,阿里云上的GPU计算平台联同NGC将为开发者节省大量准备开发环境的的时间。...

文章 2018-04-02 来自:开发者社区

AI开发者福音!阿里云推出国内首个基于英伟达NGC的GPU优化容器

阿里云推出国内首个基于英伟达NGC的GPU优化容器 3月28日,在2018云栖大会·深圳峰会上,阿里云宣布与英伟达GPU 云 合作 (NGC),开发者可以在云市场下载NVIDIA GPU 云镜像和运行NGC 容器,来使用阿里云上的NVIDIA GPU计算平台。NGC容器可以接入NVIDIA 优化的深度学习软件,HPC应用,NVIDIA HPC 可视化工具和合作伙伴的应用。.阿里云成为中国...

文章 2018-03-26 来自:开发者社区

阿里巴巴机器翻译团队:将TVM引入TensorFlow中以优化GPU上的神经机器翻译

译者注:TVM 是由华盛顿大学在读博士陈天奇等人提出的深度学习自动代码生成方法,该技术能够自动为大多数计算硬件生成可部署优化代码,其性能可与当前最有供应商提供的优化计算库相比,且可以适应新型专用加速器后端。项目链接:https://github.com/dmlc/tvm 作者: 这是阿里巴巴集团机器翻译团队和PAI-Blade团队贡献的博客。 背景: 神经机器翻译(NMT)是自动翻译的端到端方法....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云服务器ECS

做技术先进、性能优异、稳如磐石的弹性计算!

+关注