文章 2023-05-15 来自:开发者社区

兼容PyTorch,25倍性能加速,国产框架OneFlow「超速」了(2)

2.4 静态编译优化做到以上优化后,GPU 利用率已经能比较稳定的保持在 90%,一般来说,已经没有太大优化空间了。但是,OneFlow nn.Graph 下还有一些自动的编译优化技术可以尝试。比如利用自动混合精度做低精度计算、利用算子融合来减少访存开销等,这里最终带来了 64% 的加速,速度到了原来最好性能的 1.56 倍。此前示例中提到的 _config_graph 函数就是在配置这些优化选....

文章 2023-05-15 来自:开发者社区

兼容PyTorch,25倍性能加速,国产框架OneFlow「超速」了(1)

要想炼丹爽得飞起,就要选择一个顺手的炉子。作为 AI 工程师日常必不可缺的「炼丹炉」,「PyTorch 还是 TensorFlow?」已成为知乎、Reddit 等炼丹师出没之地每年都会讨论的热门话题。业界流传一种说法:PyTorch 适合学术界,TensorFlow 适合工业界。毕竟,PyTorch 是用户最喜欢的框架,API 非常友好,Eager 模式让模型搭建和调试过程变得更加容易,不过,它....

兼容PyTorch,25倍性能加速,国产框架OneFlow「超速」了(1)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

相关镜像