文章 2024-06-11 来自:开发者社区

人工智能平台PAI操作报错合集之带有all reduce 的算子是trace不出来的,结果会错,怎么才可以绕过去

问题一:机器学习PAI这个错误有空能帮忙看下吗? 机器学习PAI这个错误有空能帮忙看下吗?INFO: Found 7 targets... ERROR: /root/.cache/bazel/_bazel_root/2f9436f914163304d24e844a3ddc3a23/external/tensorrt/BUILD:18:11: Middleman _mid...

人工智能平台PAI操作报错合集之带有all reduce 的算子是trace不出来的,结果会错,怎么才可以绕过去
问答 2024-03-26 来自:开发者社区

我们这边用的 tensorflow 官方的机器学习PAI,目前没有加载,这是对已有算子的重写吗?

我们这边用的 tensorflow 官方的机器学习PAI,目前没有加载,没有出问题,这是对已有算子的重写吗?

问答 2024-03-26 来自:开发者社区

机器学习PAI easyrec 源码里面有加载算子库这些是 easyrec 自定义的算子吗?

机器学习PAI easyrec 源码里面有加载算子库 libembed_op.so、libembed_op.so这些是 easyrec 自定义的算子吗?推理的时候需要加载这些算子库码?

问答 2024-01-15 来自:开发者社区

有方式获取到机器学习PAI每个算子执行的状态吗?

有方式获取到机器学习PAI每个算子执行的状态吗?我在webui 上配置好了一套流程,然后提交到flink 上运行,有办法获取到各个节点的执行状态吗?就是这个文档说的这个功能

问答 2023-12-24 来自:开发者社区

机器学习PAI现在带有all reduce 的算子是trace不出来的?结果会错?有办法绕过去吗?

机器学习PAI现在带有all reduce 的算子是trace不出来的?结果会错?有办法绕过去吗? 如果只想融合下算子 ,除了aot autograd,还有其他方式吗?

问答 2023-08-20 来自:开发者社区

在机器学习PAI中jupyter中运行udf自定义的算子时会报错 这个问题该怎么处理?

如图,请问我用镜像启动了jupyter notebook和flink 在机器学习PAI中jupyter中运行udf自定义的算子时会报错 这个问题该怎么处理?这是报错信息

问答 2023-08-08 来自:开发者社区

机器学习PAI你们有试过把resnet也放到张量切分里面吗?我自己尝试的时候发现里面的卷积算子某一层

机器学习PAI你们有试过把resnet也放到张量切分里面吗?我自己尝试的时候发现里面的卷积算子某一层的输出会对应不上下一层的输入,刚好几路张量并行就差几倍

问答 2023-07-22 来自:开发者社区

请教一下机器学习PAI,我想把FastNN库里的bert改成算子拆分并行,有相关文档吗,我在模型定?

问题1:请教一下机器学习PAI,我想把FastNN库里的bert改成算子拆分并行,有相关文档吗,我在模型定义前加上了split的上下文,但是没有效果怎么办?问题2:我尝试跨节点跑张量切分的策略,发现节点之间不会互相传输算子互相放置,是因为epl目前还不支持吗?

问答 2023-06-05 来自:开发者社区

在机器学习PAI有个算子处理数据不均衡,请问这是什么原因呢?

在机器学习PAI有个算子处理数据不均衡,请问这是什么原因呢?

问答 2023-04-15 来自:开发者社区

请教一下机器学习PAI的问题,如何在baldeDISC设置某些算子不被替换

请教一下,如何在baldeDISC设置某些算子不被替换

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注