文章 2025-01-04 来自:开发者社区

odps测试表及大量数据构建测试

创建表CREATE TABLE IF NOT EXISTS demo ( id INT NOT NUll, floatvector ARRAY, int8col TINYINT, int16col INT, int32col INT, floatcol FLOAT, doublecol DOUBLE, varcharcol STRING, boolcol BOOLEAN, bfloat16vec....

文章 2024-10-18 来自:开发者社区

大数据体系知识学习(一):PySpark和Hadoop环境的搭建与测试

1. 相关知识学习 1.1 Spark的基本介绍 Apache Spark是一个开源的大数据处理框架,使用内存计算方式加速大数据处理。Spark的主要优点包括高速批量处理、交互式查询、实时流处理以及机器学习等功能。**Spark由Scala语言实现,是一种面向对象、函数式编程语言,支持多种编程语言,如Scala、Java、Python和R等,可以运行在Hadoop集群上或者独立运行。**Spar....

大数据体系知识学习(一):PySpark和Hadoop环境的搭建与测试
文章 2024-10-15 来自:开发者社区

大数据-171 Elasticsearch ES-Head 与 Kibana 配置 使用 测试

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完) HDFS(已更完) MapReduce(已更完) Hive(已更完) Flume(已更完) Sqoop(已更完) Zookeeper(已更完) HBase(已更完) Redis (已更完) Kafka(已更完) ...

大数据-171 Elasticsearch ES-Head 与 Kibana 配置 使用 测试
文章 2024-10-15 来自:开发者社区

大数据-170 Elasticsearch 云服务器三节点集群搭建 测试运行

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完) HDFS(已更完) MapReduce(已更完) Hive(已更完) Flume(已更完) Sqoop(已更完) Zookeeper(已更完) HBase(已更完) Redis (已更完) Kafka(已更完) ...

大数据-170 Elasticsearch 云服务器三节点集群搭建 测试运行
文章 2024-10-15 来自:开发者社区

大数据-159 Apache Kylin 构建Cube 准备和测试数据(一)

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完) HDFS(已更完) MapReduce(已更完) Hive(已更完) Flume(已更完) Sqoop(已更完) Zookeeper(已更完) HBase(已更完) Redis (已更完) Kafka(已更完) ...

大数据-159 Apache Kylin 构建Cube 准备和测试数据(一)
文章 2024-10-15 来自:开发者社区

大数据-159 Apache Kylin 构建Cube 准备和测试数据(二)

接上篇:https://developer.aliyun.com/article/1623254?spm=a2c6h.13148508.setting.18.66e24f0etlssu8 dim_product_data # 设置参数 output_file = 'dim_pro...

大数据-159 Apache Kylin 构建Cube 准备和测试数据(二)
文章 2024-10-14 来自:开发者社区

大数据-146 Apache Kudu 安装运行 Dockerfile 模拟集群 启动测试

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完) HDFS(已更完) MapReduce(已更完) Hive(已更完) Flume(已更完) Sqoop(已更完) Zookeeper(已更完) HBase(已更完) Redis (已更完) Kafka(已更完) ...

大数据-146 Apache Kudu 安装运行 Dockerfile 模拟集群 启动测试
文章 2024-10-14 来自:开发者社区

大数据-135 - ClickHouse 集群 - 数据类型 实际测试

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完) HDFS(已更完) MapReduce(已更完) Hive(已更完) Flume(已更完) Sqoop(已更完) Zookeeper(已更完) HBase(已更完) Redis (已更完) Kafka(已更完) ...

大数据-135 - ClickHouse 集群 - 数据类型 实际测试
文章 2024-10-14 来自:开发者社区

大数据-123 - Flink 并行度 相关概念 全局、作业、算子、Slot并行度 Flink并行度设置与测试

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完) HDFS(已更完) MapReduce(已更完) Hive(已更完) Flume(已更完) Sqoop(已更完) Zookeeper(已更完) HBase(已更完) Redis (已更完) Kafka(已更完) ...

大数据-123 - Flink 并行度 相关概念 全局、作业、算子、Slot并行度 Flink并行度设置与测试
文章 2024-10-14 来自:开发者社区

大数据-122 - Flink Time Watermark Java代码测试实现Tumbling Window

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完) HDFS(已更完) MapReduce(已更完) Hive(已更完) Flume(已更完) Sqoop(已更完) Zookeeper(已更完) HBase(已更完) Redis (已更完) Kafka(已更完) ...

大数据-122 - Flink Time Watermark Java代码测试实现Tumbling Window

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

大数据计算 MaxCompute

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

+关注