文章 2024-03-15 来自:开发者社区

倚天产品介绍|倚天性能优化—YCL AI计算库在resnet50上的优化

1. 背景介绍    英特尔第四代至强可扩展处理器(代号Sapphire Rapids,简称SPR)上引入了全新的加速引擎AMX(Advanced Matrix Extensions),通过指令集层面的支持来显著加速深度学习算法中的Tensor计算。AMX针对广泛的硬件和软件优化,进一步增强了前一代矢量神经网络指令VNNI和BF16,推出了AMX_INT8和AMX_...

倚天产品介绍|倚天性能优化—YCL AI计算库在resnet50上的优化
文章 2024-03-11 来自:开发者社区

倚天使用|倚天性能优化—YCL AI计算库在resnet50上的优化

背景介绍 将多核多线程程序从x86架构的CPU迁移到Arm架构的CPU上往往会面临弱内存序问题。这个问题是迁移过程中的重大阻碍,也是很多业务方斟酌是否应该迁移到Arm机器上的一个关注焦点。因此如何正确且高效地解决这个问题意义重大,关乎Arm和倚天的生态建设。 有许多团队曾经遇到过此类问题,给业务稳定性带来隐患。 倚天团队针对弱内存序问题追本溯源,提供一个可以从根本上能够解...

倚天使用|倚天性能优化—YCL AI计算库在resnet50上的优化
阿里云文档 2023-09-13

如何使用Blade优化基于TensorFlow的ResNet50模型_人工智能平台 PAI(PAI)

ResNet50作为一个广泛应用的经典结构网络,其优化在多种推理部署场景中都具有很高的实用价值。本文介绍如何使用Blade优化基于TensorFlow的ResNet50模型。

文章 2023-08-30 来自:开发者社区

倚天性能优化—YCL AI计算库在resnet50上的优化

1. 背景介绍    英特尔第四代至强可扩展处理器(代号Sapphire Rapids,简称SPR)上引入了全新的加速引擎AMX(Advanced Matrix Extensions),通过指令集层面的支持来显著加速深度学习算法中的Tensor计算。AMX针对广泛的硬件和软件优化,进一步增强了前一代矢量神经网络指令VNNI和BF16,推出了AMX_INT8和AMX_BF16指....

倚天性能优化—YCL AI计算库在resnet50上的优化
文章 2018-06-07 来自:开发者社区

看照片挑民宿:Airbnb如何重新训练ResNet50,实现房间图片分类优化

走进Aribnb位于旧金山总部的办公楼,你会看到一个个装修各异的会议室。这些会议室正是Airbnb形形色色民宿的缩影。 Airbnb为数百万的民宿提供了一个平台,也因此囊获了一大批民俗房间细节照片和用户数据。 坐拥百万级别的用户数据,Airbnb的数据团队可谓将数据的价值发挥地淋漓尽致。传统的推荐系统、广告系统自是不用说,深度学习的应用更是让Airbnb的数据有了前所未有的价值。 今天,文摘菌就....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。