阿里云文档 2025-04-18

如何使用分布式训练框架StarServer进行分布式训练

分布式训练框架用于加速模型训练、处理海量数据并提高系统稳定性和资源利用率。它通过将模型分布在多个计算节点上实现并行计算,从而缩短训练时间,适应大数据集和大模型的训练需求。本文介绍如何使用分布式训练框架StarServer进行分布式训练。

文章 2024-06-21 来自:开发者社区

分布式系统详解--框架(Zookeeper-简介和集群搭建)

分布式系统详解--框架(Zookeeper-简介和集群搭建) 一、Zookeeper简介 1.1 Zookeeper是什么?        Zookeeper是一个集中式服务,用于维护配置信息,命名提供分布式同步和提供组服务。所有这些类型的服务都已分布式应用程序的某种形式使用。每次实施他们都需要做很多工作来修复不可避免的错误和竞争...

分布式系统详解--框架(Zookeeper-简介和集群搭建)
文章 2024-06-21 来自:开发者社区

分布式系统详解--框架(Hadoop-集群搭建)

 分布式系统详解--框架(Hadoop-集群搭建)       前面的文章也简单介绍了,hadoop的环境搭建分为三种,单机版,伪分布式,全分布式。这篇文章为介绍hadoop的全分布式的架构搭建。 ...

分布式系统详解--框架(Hadoop-集群搭建)
文章 2024-06-11 来自:开发者社区

Python 分布式计算框架 PP (Parallel Python):集群模式下的实践探索

该文章是我在2016年发布在某sdn上的,搬运过来。 背景介绍 在现代计算领域,随着硬件性能的提升,特别是多核处理器和大规模集群的普及,分布式计算成为提高程序效率和处理大规模数据的关键手段。Parallel Python(简称PP)作为一款轻量级的分布式计算框架,旨在简化Python代码在SMP系统(多处理器或多核心)和集群环境中的并行执行。尽管网络上不乏关于PP单机多...

阿里云文档 2024-01-30

如何使用分布式通信框架gRPC++进行分布式训练

使用DLC进行深度学习训练时,您可以使用gRPC++分布式训练,从而加速模型训练。本文介绍如何开启分布式通信框架gRPC++。

阿里云文档 2023-12-26

如何在SpringBoot框架下使用消息队列收发消息

本文介绍如何在 SpringBoot 框架下用 SOFAStack 消息队列收发消息。

阿里云文档 2023-09-03

Spring框架存在远程命令执行漏洞攻击风险通告和解决方案_企业级分布式应用服务(EDAS)

本文介绍Spring框架存在远程命令执行漏洞攻击风险以及如何解决。

阿里云文档 2023-04-17

如何在ECS中创建和部署Java微服务框架的应用

在EDAS的ECS集群中,可以创建和部署基于Java微服务框架开发的应用。

文章 2023-01-03 来自:开发者社区

分布式服务器框架之Server.Common中通过Xml配置渠道、服务器集群、热更新信息代码解析Xml缓存进内存

服务器的配置分了三个文件:分别是ChannelConfig.xml、HotFixConfig.xml、ServerConfig.xml。ChannelConfig.xml 标签中的属性        ChannelId:            渠道IdInnerVersion:   &am...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云分布式应用服务

企业级分布式应用服务 EDAS(Enterprise Distributed Application Service)是应用全生命周期管理和监控的一站式PaaS平台,支持部署于 Kubernetes/ECS,无侵入支持Java/Go/Python/PHP/.NetCore 等多语言应用的发布运行和服务治理 ,Java支持Spring Cloud、Apache Dubbo近五年所有版本,多语言应用一键开启Service Mesh。

+关注