阿里云加密服务支持国密算法证书和国密SSL协议,支持通过GVSM或EVSM产生和存储SSL证书私钥,提升系统的安全性。您可以使用加密服务和配套接口TASSL实现Nginx SSL卸载。本文介绍如何在阿里云ECS上借助加密服务进行SSL的安全卸载。支持的密码...
本文介绍什么是流量镜像,以及如何基于集群内服务层使用流量镜像。什么是流量镜像?微服务能够帮助用户快速地开发和部署应用,但版本变更中也存在一定风险。服务网格 ASM提供流量镜像(Traffic Mirroring)的功能,也称影子流量(Traffic ...
本文介绍什么是流量镜像,以及如何基于集群内服务层使用流量镜像。什么是流量镜像?微服务能够帮助用户快速地开发和部署应用,但版本变更中也存在一定风险。服务网格 ASM提供流量镜像(Traffic Mirroring)的功能,也称影子流量(Traffic ...
1.2 为基线应用开通微服务治理功能 重要 全链路灰度为MSE微服务治理专业版功能,链路中所有涉及应用(包括Java服务网关应用)均需开启微服务治理功能才能使用。在 应用列表 页面,单击应用名称,在左侧导航栏选择 微服务治理 应用概览,...
Knative会管理不同Revision(修订版本)之间的流量分配。您可以在控制台为不同Revision设定版本对应的流量比例,然后不断调整流量...相关文档 您可以基于流量请求数实现Knative服务的自动扩缩容,请参见 基于流量请求数实现服务自动扩缩容。
Knative会管理不同Revision(修订版本)之间的流量分配。您可以在控制台为不同Revision设定版本对应的流量比例,然后不断调整流量...相关文档 您可以基于流量请求数实现Knative服务的自动扩缩容,请参见 基于流量请求数实现服务自动扩缩容。
Knative会管理不同Revision(修订版本)之间的流量分配。您可以在控制台为不同Revision设定版本对应的流量比例,然后不断调整流量...相关文档 您可以基于流量请求数实现Knative服务的自动扩缩容,请参见 基于流量请求数实现服务自动扩缩容。
本文主要介绍如何配置基于API服务网关的全链路灰度,并实现端到端的灰度部署。名词解释 云原生API网关:云原生API网关是兼容K8s Ingress标准的下一代网关产品,将传统的API网关、流量网关、微服务网关、安全网关功能合并,支持ACK容器服务...
本教程演示如何使用向量检索服务(DashVector),结合 大模型服务平台百炼 上的 Embedding API,来从0到1构建基于文本索引的构建+向量检索基础上的语义搜索能力。具体来说,我们将基于QQ 浏览器搜索标题语料库(QBQTC:QQ Browser Query ...
借助ASM网关,您可以配置带有mTLS安全机制的gRPC服务,确保仅授权的客户端能够访问,并在整个数据传输过程中实施端到端加密和双向身份验证,有效防止信息被窃听、篡改及非法访问。前提条件 创建ASM企业版实例。具体操作,请参见 创建ASM...
借助ASM网关,您可以配置带有mTLS安全机制的gRPC服务,确保仅授权的客户端能够访问,并在整个数据传输过程中实施端到端加密和双向身份验证,有效防止信息被窃听、篡改及非法访问。前提条件 创建ASM企业版实例。具体操作,请参见 创建ASM...
当您在进行应用迭代升级时面临新版本兼容性和稳定性挑战时,可以在Knative on ASM中基于流量灰度发布服务。创建Knative服务时,系统会自动创建第一个修订版本Revision,随着服务配置的每次更新变化,Knative都会自动生成新的修订版本,并...
本文介绍如何在 容器服务 Kubernetes 版 集群部署gRPC应用,并使用云原生网关实现gRPC服务的路由转发。前提条件 创建MSE云原生网关。创建ACK托管集群。步骤一:使用容器服务部署gRPC应用 应用部署的具体操作,请参见 创建无状态工作负载...
说明 阿里云也为您提供了关系型数据库RDS服务,RDS MySQL是基于阿里巴巴MySQL源码分支的在线数据库服务,已默认支持16KB原子写,可以获得更高性能,如果您想要了解更多RDS MySQL信息,请参见 写优化。背景信息 MySQL参数 MySQL拥有数百个...
当您遇到因业务流量波动导致的服务性能不稳定或资源浪费问题时,可以基于流量请求数实现服务自动扩缩容。通过监控和分析实时流量数据动态调整服务实例数,既能保障高峰期的服务质量和用户体验,又能有效节约闲置资源,在降低成本的同时提高...
阿里云 容器服务 Serverless 版 支持的服务发现功能是基于阿里云专有网络VPC(Virtual Private Cloud)环境的私有域名解析和管理服务,目前支持Intranet service、Headless service、ClusterIP service。前提条件 已在 云解析DNS控制台 中...
阿里云 容器服务 Serverless 版 支持的服务发现功能是基于阿里云专有网络VPC(Virtual Private Cloud)环境的私有域名解析和管理服务,目前支持Intranet service、Headless service、ClusterIP service。前提条件 已在 云解析DNS控制台 中...
ASM为用户提供了可控的网络环境(集群内)SMC优化能力,能够自动优化服务网格Pod间的流量,用户无需关心具体的SMC配置。前提条件 已添加集群到ASM实例。使用限制 节点使用支持配置eRDMA的ECS实例。详细信息,请参见 在企业级实例上使用...
本文介绍如何在 容器服务 Kubernetes 版 集群部署gRPC应用,并使用云原生API网关实现gRPC服务的路由转发。前提条件 已完成ACK集群创建,具体操作,请参见 创建ACK托管集群。已完成云原生API网关创建,具体操作,请参见 创建网关。步骤一:...
借助ACK云原生AI套件提供的Arena命令行工具和AI负载调度,您可以在Kubernetes集群中高效地部署...提交GPU共享模型推理任务 容器化弹性推理 基于ECI或ECS运行弹性推理服务,满足弹性伸缩需求,降低成本。基于ECI的弹性推理 基于ECS的弹性推理
您可以利用Fluid显著提升模型加载速度,从而优化推理服务的性能,特别是对于基于KServe的推理服务而言。详细内容,请参见 使用Fluid实现模型加速。灰度发布 在生产环境中应用发布更新是最为常见的操作,为了保证业务平稳、降低变更风险,...
KServe是一个基于Kubernetes的机器学习模型服务框架,支持以Kubernetes CRD的形式将单个或多个经过训练的模型(例如TFServing、TorchServe、Triton等推理服务器)部署到模型服务运行时,使得模型的部署、更新和扩展变得更加简单快捷。...
阿里云内容安全图片审核 增强版 推出基于通义定制审核大模型的图片检测服务,能够全方位识别图片中的色情、性感、涉政、暴恐、违禁、宗教、引流广告、不良等违规内容。本文介绍如何使用图片审核大模型服务。重要 阿里云内容安全图片审核大...
KServe是一个基于Kubernetes的机器学习模型服务框架,支持以Kubernetes CRD的形式将单个或多个经过训练的模型(例如TFServing、TorchServe、Triton等推理服务器)部署到模型服务运行时,使得模型的部署、更新和扩展变得更加简单快捷。...
本文介绍如何通过 SAE 控制台,为应用配置基于K8s ServiceName的服务访问。背景信息 在分布式微服务框架下,当服务上下线变更时,通过服务注册与服务发现功能,实现服务端和调用端的正常通信。服务注册:针对服务端。服务实例把自身的服务...
本文介绍如何通过 SAE 控制台,为应用配置基于K8s ServiceName的服务访问。背景信息 在分布式微服务框架下,当服务上下线变更时,通过服务注册与服务发现功能,实现服务端和调用端的正常通信。服务注册:针对服务端。服务实例把自身的服务...
DataScience集群的KubeFlow服务内置了SeldonCore组件,可以为模型提供在线服务,基于Kubernetes,您无需关心在线服务的运维工作。您可以根据提供的dsdemo代码,将Tensorflow,Pytorch和Python等模型部署到Seldon中。前提条件 已创建...
您可以基于Knative使用InferenceService来部署模型,以获得基于RPS、并发数、CPU/GPU指标自动弹性,没有业务流量时缩容至零、便捷的多版本管理等能力。前提条件 已部署KServe组件,请参见 部署KServe组件。步骤一:部署InferenceService...
本文介绍基于ECI和FaaS构建游戏战斗结算服务的背景信息、架构图及操作参考链接。背景信息 在游戏行业的很多游戏类型中,尤其是SLG,为了防止客户端作弊,在每局战斗之后,在客户端预判玩家胜利的情况下,需要服务端来进行战斗数据的结算,...
用户可以在机器学习平台PAI上训练召回模型并预测...服务类型选择“X2I召回”配置服务基础信息 配置数据,选择我们刚才准备好的数据及过滤规则 配置完成并上线 进入服务管理,可以看到我们刚才创建的召回服务,等待其发布完成,就可以使用了。
本文介绍“基于NVIDIA NIM快速部署LLM模型推理服务”的使用文档。概述 NVIDIA NIM 是 NVIDIA AI Enterprise 的一部分,是一套易于使用的预构建容器工具,目的是帮助企业加速生成式 AI 的部署。它支持各种 AI 模型,可确保利用行业标准 API ...
基于并发数弹性为例,Pod数计算方式如为:Pod数=并发请求总数/(Pod最大并发数*目标使用率)例如,如果服务中Pod最大并发数设置为10,目标使用率设置为0.7,此时如果接收到了100个并发请求,则Autoscaler就会创建15个Pod(即100/(0.7*10)≈...
本文以CentOS 7.6系统镜像为例,介绍如何快速配置Apache服务。说明 更多搭建网站和部署开发环境的最佳实践,请参见 最佳实践概览。步骤一:创建轻量应用服务器 登录 轻量应用服务器管理控制台。在左侧导航栏,单击 服务器。在页面左上角,...
基于并发数弹性为例,Pod数计算方式如为:Pod数=并发请求总数/(Pod最大并发数*目标使用率)例如,如果服务中Pod最大并发数设置为10,目标使用率设置为0.7,此时如果接收到了100个并发请求,则Autoscaler就会创建15个Pod(即100/(0.7*10)≈...
基于并发数弹性为例,Pod数计算方式如为:Pod数=并发请求总数/(Pod最大并发数*目标使用率)例如,如果服务中Pod最大并发数设置为10,目标使用率设置为0.7,此时如果接收到了100个并发请求,则Autoscaler就会创建15个Pod(即100/(0.7*10)≈...
本文介绍如何基于TairSearch构建一个实时的股票K线指标服务。背景信息 投资者在进行股票投资活动前,通常需要借助股票行情数据进行分析、判断。在众多股票行情指标中,K线是基础指标,也是核心指标,K线可以演绎出多种其他指标。K线由开盘...
数据湖架构验证 如果您正在构建或已经拥有基于阿里云OSS的数据湖架构,并且想验证其在复杂查询处理、ETL作业、数据仓库性能等方面的效率,可以通过在EMR集群上运行TPC-DS来获得客观、标准化的结果。了解性能表现 当您进行集群扩容、硬件...
阿里云Kubernetes集群的虚拟节点已经支持服务发现功能,目前支持Intranet service、Headless service、ClusterIP service。前提条件 需要先开通云解析PrivateZone,在 云解析DNS控制台 中开通。您在Kubernetes集群创建一个虚拟节点,请参见...
在Kubernetes集群外部访问WebSocket服务时,云原生网关承担了请求接收和转发的角色,根据预定的路由规则将请求分发到相应的后端服务。本文介绍了如何在 容器服务 Kubernetes 版 集群部署WebSocket应用,并通过云原生网关进行流量转发。前提...