【Hello AI】计算优化编译器AIACC-AGSpeed
AIACC-AGSpeed(AIACC 2.0-AIACC Graph Speeding)是阿里云推出的一个基于PyTorch深度学习框架研发的计算优化编译器,用于优化PyTorch深度学习模型在阿里云GPU异构计算实例上的计算性能,相比原始的神龙AI加速引擎AIACC,AIACC-AGSpeed是AIACC 2.0产品的实现,是完全独立的产品形态,可以实现无感的计算优化功能。AIACC-AGS....

【Hello AI】AIACC-ACSpeed-AI分布式训练通信优化库
AIACC-ACSpeed(AIACC 2.0-AIACC Communication Speeding)是阿里云推出的AI分布式训练通信优化库AIACC-Training 2.0版本。相比较于分布式训练AIACC-Training 1.5版本,AIACC-ACSpeed基于模块化的解耦优化设计方案,实现了分布式训练在兼容性、适用性和性能加速等方面的升级。本文主要分为产品介绍、功使用说明、优化原....

AI+组合优化 |机器学习顶会ICLR/ICML/NeurIPS'23最新进展-MIP求解篇(附原文源码)
ICLR、NIPS和ICML是人工智能领域的三个顶级学术会议,以下是它们的介绍: ICLR (International Conference on Learning Representations) 是一个聚焦于深度学习和表示学习领域的国际性学术会议,由深度学习三巨头之中的Yoshua Bengio和Yann LeCun牵头创办,2013...
与AI对话的艺术:如何优化Prompt以获得更好的响应反馈
前言在当今数字化时代,人工智能系统已经成为我们生活的一部分。我们可以在智能助手、聊天机器人、搜索引擎等各种场合与AI进行对话。然而,要获得有益的回应,我们需要学会与AI进行有效的沟通,这就涉及到如何编写好的Prompt。与AI对话时,Prompt是一种指导工具,帮助AI理解我们的需求和问题。因此,编写清晰、明了和具体的Prompt非常重要。在本文中,我们将探讨如何创建好的Prompt,以确保我们....

技术改变AI发展:RDMA能优化吗?GDR性能提升方案(GPU底层技术系列二)
背景GPUDirect RDMA 是 Kepler 级 GPU 和 CUDA 5.0 中引入的一项技术,可以让使用pcie标准的gpu和第三方设备进行直接的数据交换,而不涉及CPU。传统上,当数据需要在 GPU 和另一个设备之间传输时,数据必须通过 CPU,从而导致潜在的瓶颈并增加延迟。使用 GPUDirect,网络适配器和存储驱动器可以直接读写 GPU 内存,减少不必要的内存消耗,减少 CPU....

技术改变AI发展:CUDA Graph优化的底层原理分析(GPU底层技术系列一)
CUDA 异步执行模型对于GPU运算集中的AI应用场景,为了提升系统的性能,最大化地利用GPU资源是一个重要的优化方向。比较常用的方式是尽量将GPU运算转换为异步操作,CPU侧负责任务提交,保证有足够的cuda kernel发送到GPU,GPU按照CUDA Stream流队列中的Kernel顺序执行。只要这中间不存在同步操作,GPU完全可以不用等待,顺序地将所有的kernel执行完,然后再通知C....

AI芯片设计与优化:算力提升、能耗降低与硬件加速器的发展趋势
人工智能(Artificial Intelligence,AI)技术的快速发展和广泛应用,对计算机硬件提出了更高的要求。在AI应用中,AI芯片扮演着关键角色,它们能够提供强大的计算能力、节能的性能和高效的运行速度。本文将详细介绍AI芯片设计与优化中的算力提升、能耗降低以及硬件加速器的发展趋势,并分析其对AI技术发展的影响。 1. 算力提升 AI应用对大量的计算资源有着巨大需求,因此提高芯...

AI绘画专栏之 SDXL 4G显存就能跑SDXL ?SD1.7或将对F8优化merge(46)
关于SDXL的生态目前还未完全稳定,但是不得不提到的就是SDXL的在VAE,CLIP,UNET三大组件的巨大提升,其101亿的参数量是原本SD的N倍,那么对于SDXL的生态介绍我们再次重复一遍。4G的显存都能跑SDXL意味着将来大模型Lora将降低其大小,炼丹炉压力更小~ 添加描述SDXL为什么强?0.1参数训练量为101亿 ...
Anolis OS 23 基于 AMD 实例的 AI 推理优化实践 | 龙蜥技术
编者按:龙蜥操作系统 Anolis OS 23 是龙蜥社区基于操作系统分层分类理论,面向上游原生社区独立选型,全面支持智算的首款国内发行版,为开发人员提供了强大的 AI 开发平台,通过支持龙蜥生态软件仓库(EPAO),Anolis OS 23 实现了对主流 AI 框架的全面支持,使得 AI 开发更加便捷高效。本文将基于 AMD 实例介绍 Anolis OS 23 针对 AI 推理应用进行的专门优....

阿里语音AI的录音文件识别服务我加了热词之后,没什么效果。针对专业名词,还有什么优化方案吗?
阿里语音AI的录音文件识别服务我加了热词之后,没什么效果。针对专业名词,还有什么优化方案吗?
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
AI更多优化相关
产品推荐
人工智能平台PAI
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。
+关注