客户案例 > 案例详情

敦煌智旅基于阿里云 Serverless 应用引擎,运维提效 60%

客户介绍

敦煌智旅是一家致力于智慧旅游大数据和旅游行业应用系统创新与研发的新型互联网企业。公司依托“旅游+互联网+金融”的模式,以信息化建设为抓手,整合旅游产业链资源、经营落地游客,推动目的地商业繁荣,构建大旅游生态圈。在文旅行业的数字化转型新浪潮中,敦煌智旅迅速抓住机会,开启了“智旅云平台”之路。

业务挑战

敦煌智旅的平台从一开始就构建在阿里云的 ECS 上。近几年来公司业务不断扩张,已经与多个旅游景区展开合作,也包含了很多大型景区合作,比如月牙泉和黄河石林等。然而,业务规模的扩大同时,也暴露出原有平台的诸多不足。主要存在以下三个方面的挑战:

  • 流量跨度大,资源预留难度大

    在节假日期间,例如五一或国庆节,游客量会迎来高峰,一天内的接待量可能突破十万级。平常的时候,游客数量可能只有一两万。高峰与淡季的流量差异极大,导致对资源的需求波动也很大,甚至达到了十倍以上。在过去,为了应对节假日的高峰,敦煌智旅的技术团队会提前准备多台服务器来支持比如下单系统这样的核心业务,等流量高峰过后再释放这些服务器资源。这种方式处理效率很低,每次业务高峰期时,都需要手动配置服务器的预留。

  • 运维工作繁重且效率低下

    由于智旅云平台的业务持续拓展和更新,系统发版操作也变得频繁。当前系统使用了多个 ECS 节点,每次发布更新时,需要登录到每台服务器上单独发布,这不仅增加了工作量,而且还出现过漏发的情况。研发团队在这种情况下还需要承担一部分运维工作,整体的工作效率非常低。

  • 服务器资源利用率不足

    当系统部署在 ECS 上时,在流量较低的时段,CPU 利用率只有百分之十几,甚至个位数,造成了极大的浪费。

因此,提升运维效率和资源利用率,以及系统的弹性能力成为敦煌智旅技术团队的当务之急。

阿里云的解决方案

敦煌智旅决定把新平台部署在阿里云 Serverless 应用引擎(SAE)上。SAE 提供了一个开箱即用的 Serverless PaaS 平台,提供了微服务、监控等能力,帮助敦煌智旅很好地解决了发版困难、运维困难、弹性能力不足和资源利用率低等痛点问题。

基于 SAE 实现高效发版

SAE 支持应用一键部署,秒级完成从源代码仓库或 War、Jar 代码包部署 SAE 应用,并支持自动 CD。同时也提供应用模板、CLI 命令行工具、组件库、成本管家等能力,实现快速高效地交付应用程序。SAE 帮助敦煌智旅解决了发版效率低、发版过程繁琐的困难。

以前每次发布新版本时,都需要在 ECS 上逐一部署,每发一个新版本耗时整整 1 天,还需要几个技术人员时刻监控新版本的运行状态。一旦发现 bug,还需立即从每台 ECS 上手动下线新版本。这一过程不仅繁琐,还可能导致业务受损。

现在每次发版的时候,只需要将打包好的镜像直接部署到 SAE 上,半天就能发布一个新版本。如果有问题,在控制台上一键回滚到老版本即可,之前要一个团队完成的工作,现在一个人就可以完成,不仅提升了人效,也彻底避免了之前漏发的情况。

服务发现

与此同时,SAE 具备无侵入微服务治理的能力,支持 Spring Cloud、Dubbo 零代码改造迁移至 SAE,提供服务注册&发现、环境隔离、配置管理、限流降级、应用无损上下线、服务鉴权、全链路灰度等能力。敦煌智旅基于 SAE 网关和内置的 Nacos 能力实现微服务的服务发现。

敦煌之旅技术团队表示“我们之前的那些部署在 ECS 上的老系统,经常需要给每一个应用改 IP 地址,效率非常低,还经常漏改和改错。SAE 内置的 Nacos 用起来非常方便,再也不用针对每一个应用改 IP 地址了,而且我们本来的框架就是用的微服务,SAE 和我们的原始架构非常的适配。”

监控与日志采集

敦煌智旅还基于 SAE 集成的监控告警能力实现了日常开发过程中的监控和日志采集,利用监控和持久化日志就能迅速且准确地定位问题。SAE 基于 EBPF 技术提供无侵入的应用监控和告警能力,支持任意语言和任意框架,提供七层入口流量监控,也提供 Java 应用级别&链路级别的监控。

自适应弹性

SAE 提供自适应弹性的能力,能实现百毫秒级弹性伸缩,可根据流量自适应调整应用实例;支持白屏化配置多种弹性策略,以及如 QPS、RT、TCP 连接数等弹性指标。

利用 SAE 的指标弹性策略,敦煌智旅现在在每次节假日或周末的时候都能根据流量峰值自动进行弹性扩容,就不再需要提前预估流量峰值来预留机器,避免了高峰期资源不够、低谷期浪费情况的出现。

敦煌之旅技术团队表示“使用 SAE 之前,我们在节假日前都要自己提前扩容,需要预估流量,提前几个小时备好几台机器,并安排 3 个同学值班,等流量洪峰过去之后再立刻缩容,避免资源浪费。但经常预估没那么准确,老系统有业务受损的情况。用了 SAE 之后,完全满足了我们的弹性需求,只需要提前在控制台上配置好指标弹性策略,根本不用提前多开 ECS 部署业务,也不用同学值班,用 SAE 的自适应弹性就能轻松应对流量洪峰,在流量低谷期自动缩容,完全不用我们担心。”

业务价值

“新平台的所有业务都部署在 SAE 上了,相比于老的平台,在平时开发工作、发版需求和应对弹性能力上都更灵活了,新平台的诉求都能满足。”

  • 运维提效,效率提升 50% 至 60%

    通过阿里云 Serverless 应用引擎 SAE,在每一次发布新版本的时候,开发运维同学不再需要逐一部署每一台服务器,发包更方便了,新增节点也更方便了,大大简化了原本繁杂的部署工作。研发运维同学能更多地专注于业务本身,过去可能需要一整天才能完成的版本发布和部署,现在缩短至半天内便可顺利完成,运维效率得到了极大提升。

  • 无需提前预留资源,轻松应对 10 倍流量洪峰

    基于 Serverless 应用引擎 SAE,在每一次节假日之前,不需要再提前准备服务器节点,借助 SAE 强大的弹性能力,在流量高峰期前只需事先设定好弹性伸缩策略,系统就会自动根据实际流量进行资源的快速伸缩,就能轻松应对周末和节假日高于平时 10 倍的流量峰值。敦煌智旅不但保障了用户体验,同时也实现了资源的高效利用,从而显著提升了弹性效率,大大提升了服务的可靠性。

  • 成本更优,降本成为意外之喜

    基于 Serverless 应用引擎 SAE,敦煌智旅不用再担心为了扛住流量洪峰预留的资源在流量低谷期的时候浪费,原来在高峰期预留的资源,在低谷期有 80% 都是浪费的。现在应用部署在 SAE 上,在流量高峰期过后,SAE 会自动帮助缩容,能保证资源在低谷期基本不浪费。

使用的阿里云产品
免费试用