云原生AI解决方案
利用阿里云容器服务(ACK)全面支持GPU和CPU异构资源集群统一管理和调度,与阿里云其他资源服务深度整合,支持机器学习计算的完整生命周期,提供低门槛、开放、高效的深度学习解决方案。
方案架构
简单开放
支持主流框架(如Tensorflow、PyTorch,Keras、caffe、MXNet等)和多种环境,屏蔽底层差异并承担非算法相关工作,提供全生命周期方案与一站式管控。
高效可靠
极致弹性,提升异构资源使用效率;快速按需构建,加速重复性模型开发;支持多维度监控报警、异常发现与自动修复。
深度整合
基于大规模GPU集群部署运维经验,充分利用阿里云计算资源(如ECS、 EGS)与数据服务能力(如OSS、NAS、CPFS、EMR等),提供端到端的最佳实践。
轻松集成
支持深度学习能力一键服务化发布,与云上应用的轻松集成。