云数据库 SelectDB 版

云原生数据仓库 SelectDB 在阿里云上的全托管服务,致力于为客户提供极致性能、简单易用的数据分析服务。

产品简介

云数据库 SelectDB 版是新一代云原生数据仓库 SelectDB 在阿里云上的全托管服务,聚焦于满足企业级大数据分析需求,广泛应用于实时报表分析、即席多维分析、日志检索分析、数据联邦与查询加速等场景,致力于为客户提供极致性能、简单易用的数据分析服务。

产品优势
产品功能
产品选型
入门与试用
快速上手
  • 01准备环境及资源

    1

    在本地机器安装 MySQL 客户端

    2

    创建云数据库 SelectDB 版试用实例

  • 02数据库配置

    1

    初始化数据库账号 admin 密码

    2

    添加 IP 白名单并开通公网

  • 03连接实例并试用

    1

    连接云数据库 SelectDB 版实例

    2

    创建数据库并读写数据

技术解决方案
在线高并发报表与分析

传统解决方案面临的挑战包括数据从产生到可见的延时高(小时级),查询响应速度慢并发低(仅支持数十并发),同时易发生数据丢失或重复,服务可用性差等问题。使用 SelectDB 处理在线高并发报表,可以获得实时、快速、稳定、高可用的服务。

实时数据写入

支持 100万行/秒的实时写入,也支持流式的从 OLTP 数据库和 Kafka 同步数据。支持数据更新,关系数据库中某些数据,例如订单状态等,可以实时地反映到数仓中,及时生成有关订单状态等信息的分析报告。

亚秒级查询响应

存储和计算引擎全链路向量化,实现数量级的查询加速。强一致聚合物化视图,自动使用预聚合结果,满足亚秒级聚合统计查询。

高并发

采用分区分桶将单个查询分发到单台机器处理,使用跳数索引(Zonemap, Bloomfilter)和点查索引(主键、倒排)减少读取数据量,提升并发查询能力。通过点查行存,减少 IOPS 压力,支撑单机上万 QPS 的高并发点查。

用户画像与行为分析

传统解决方案面临的挑战包括计算分析过程复杂,难以实时响应查询;表结构不灵活,不适应灵活的业务变化;同时,当用户数据发生变化时,原有数据无法实时更新。基于 SelectDB 建设 CDP 数仓平台分层,可以实现个性化、精细化的运营,以更加灵活的方式触达用户,提升用户的体验。

丰富的数据集成方式

支持将在线业务库(例如 MySQL、Oracle 等)的增量数据通过 CDC 工具同步到 SelectDB,前端埋点数据通过 Kafka 进行实时消费并写入 SelectDB。SelectDB 提供 Flink CDC 和高频小批量导入功能,确保数据流的延时低至分钟级甚至秒级。

低成本的数据存储

上游多个数据源将数据写入消息队列,支持用 ETL 或 ELT 模式在 Flink 实时计算层对 SelectDB 中持久化的数据进行轻量级清洗和建模。云数据库 SelectDB 版基于对象存储实现了低成本、高可用的数据存储。

广泛的服务与应用

SelectDB 支持标准 MySQL 协议,支持 ANSI SQL,方便对接下游的服务与应用层。通过圈选和打标,可以对外提供推荐、投放和查询的接口服务,在应用系统中,可以实现人群画像分析,拉取人群包后根据用户全域 OnelD 进行广告的精准推送服务。

日志存储与分析

面对庞大的日志数量,日志场景需要同时实现高吞吐写入和实时可见性,降低存储成本成为一个挑战。此外,日志场景往往还需要快速的文本检索能力,以便按关键字进行匹配查询,以满足故障排查等场景的快速响应需求。SelectDB利用存储计算分离、列式存储、高压缩比算法等能力,可实现海量日志的实时查询、低成本存储、高效处理。

海量数据实时写入

为日志场景优化的高性能倒排索引,写入速度是 ES 倒排索引的 4 倍。服务端 group commit 机制,保证秒级实时可见前提下写入吞吐到 GB/s。

高性价比存储

采用列式存储、精简倒排索引、高压缩比压缩,存储空间占用仅需 ES 的 1/5。采用冷热分离,单位存储空间成本仅需 ES 的1/3,整体成本 1/15。

高效处理业务场景

通过分区分桶、时间段筛选,大幅缩小查询的数据范围。通过倒排索引,按检索词快速定位到匹配的日志行,避免大批量扫描,达到秒级响应。

统一数据分析

传统的大数据平台解决方案包含多种组件,以及多个数据湖查询引擎和数据仓库系统。这些组件的组合可以满足客户的复杂大数据分析需求,包括 ETL、在线报表、即席分析和日志分析等。然而,这种解决方案存在复杂性高、性价比低、实时性差和开放性弱等问题。SelectDB可以通过 SQL 请求实现增量式导入数据湖中的数据,同时通过一套数据仓库系统即可满足 ETL、在线报表、日志分析等多种场景需求。

丰富的数据集成方式

SelectDB 支持传统的基于 Spark 和 Flink 的 ETL,同时还提供一种轻量级的 ELT,在数据集成方面只涉及数据的抽取和导入,而不做数据转化处理。依托 SelectDB 带来处理能力的提升,数据的转化处理可以完全放到数仓中执行,不再需要 Spark 和 Flink 的支持。

极高的性价比,降本增效

云数据库 SelectDB 版实现了存算分离、冷热分层、弹性扩缩容等特性,可以实现极低的使用成本。此外,云数据库 SelectDB 版原生构建在云上,即开即用,可视化管控平台界面和 OpenAPI 可以一键式或自动化完成部署、运维操作,大幅增强运维效率。

单一数仓,支持多种分析负载

SelectDB 使用标准 MySQL 协议,支持 BI、数据工程、科学等应用的分析,可与 dbt 配合进行仓内数据转化,提供并发读取、增量数据导入导出机制等功能,可轻松处理各种复杂负载。

产品定价

云数据库 SelectDB 版基于资源加增值服务进行定价和计费,定价对象包括:集群计算资源、集群缓存空间、实例存储大小。由于各地域经济发展水平可能不一致,因此部署到不同地域,价格可能有所不同。

计费方式

云数据库 SelectDB 版提供灵活的计费方式,帮您节省使用成本。

  • 包年包月(预付费)

    定义包年包月也称为预付费,即在新建数据库实例和集群时提前支付期望使用时长的费用。

    适用场景适合长期需求,购买时长越长,折扣越多。支持包年包月的定价对象是集群计算资源和集群缓存空间。

    计费方式转换包年包月集群可随实例变更为按量付费集群。

  • 按量付费(后付费)

    定义按量付费是一种先使用后付费的计费方式。阿里云自动每小时按用量从用户账号中扣除费用。

    适用场景适合短期需求,用完可立即释放实例,节省费用。支持按量付费的定价对象有集群计算资源、集群缓存空间、实例存储大小。

    计费方式转换按量付费实例可整体变更为混合付费实例(集群都转为包年包月,存储仍按量付费)。

安全合规

  • 安全体系

    安全体系

    • 专有网络实例部署到专有网络(VPC),安全性高于传统的经典网络。

    • 访问控制通过设置 IP 白名单,可以为实例提供更高安全等级保护。

  • 资源隔离

    资源隔离

    • 分层隔离支持在阿里云账号、VPC、子网、实例、集群等多层级进行网络或资源隔离,避免相互之间影响,可以独立稳定运行。

  • 监控告警

    监控告警

    • 监控信息提供多维度、可视化、实时的基础资源监控和查询性能监控信息。用户可以随时查看多达 18 项监控指标的历史数据曲线,用以辅助排查定位问题或优化配置。

    • 告警方式用户可以设置阈值告警规则,随时随地接收告警电话、短信或邮件,及时掌握数仓运行的异常状态,快速响应处理解决,避免或减少负面影响。

常见问题
Q:阿里云数据库 SelectDB 版 与自建 Apache Doris 数据库对比,有哪些优势?
A:1)云数据库 SelectDB 版支持存算分离,多集群共享存储,存储成本降低90%。2)云数据库 SelectDB 版基于缓存和对象存储对数据进行冷热分层,存储成本低。3)云数据库 SelectDB 版只需配置BE(B......查看详情
Q:为什么包年包月实例还会产生后付费账单?
A:创建 SelectDB 实例时,支付的包年包月费用为预留计算资源和预留缓存空间的费用。在实例使用过程中,会产生数据占用存储资源且存储大小弹性变化。弹性存储大小默认按量付费,即先使用再按实......查看详情
Q:云数据库 SelectDB 版可以应用在哪些场景?
A:云数据库 SelectDB 版主要可以应用于四种场景:1)在线高并发报表与分析。2)用户画像与行为分析。3)日志存储与分析。4)统一数据分析。查看详情
社区
技术交流
内容分类: