文章 2017-05-02 来自:开发者社区

Apache Kylin权威指南2.4 构建Cube

2.4 构建Cube 本节将快速介绍构建Cube相关的操作说明和设置,因受到篇幅的限制,许多具体内容无法深入展开,读者可以从后续的第3章和第4章中获得更详细的介绍。 新创建的Cube只有定义,而没有计算的数据,它的状态是“DISABLED”,是不会被查询引擎挑中的。要想让Cube有数据,还需要对它进行构建。Cube的构建方式通常有两种:全量构建和增量构建;两者的构建步骤是完全一样的,区别只在于.....

文章 2017-02-19 来自:开发者社区

【Spark Summit East 2017】使用Spark MLlib和Apache Solr构建实时实体类型识别系统

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps。 本讲义出自Khalifeh Aljadda在Spark Summit East 2017上的演讲,由于实体查询系统中的查询一般比较短,所以由于缺少上.....

文章 2017-01-29 来自:开发者社区

Apache Kylin Cube 的构建过程

1、 Cube的物理模型                         Cube物理模型 如上图所示,一个常用的3维立方体,包含:时间、地点、产品。假如data cell 中存放的是产量,则我们可以根据时间、地点、产品来确定产量,同时也可以根据时间、地点来确定所有产品的总产量等。 Apache Kylin就将所有(时间、地点、产品)的各种组合实现算出来,data cell 中存放度量,其...

Apache Kylin Cube 的构建过程
文章 2016-07-26 来自:开发者社区

Apache Kylin1.5.2.1之订单案例详细构建流程

一.Hive订单数据仓库构建 1. 创建事实表并插入数据 DROP TABLE IF EXISTS default.fact_order ; create table default.fact_order ( time_key string, product_key string, salesperson_key string, custom_key string, quantity_o...

文章 2016-06-07 来自:开发者社区

【译】使用Apache Kafka构建流式数据平台(1)

前言:前段时间接触过一个流式计算的任务,使用了阿里巴巴集团的JStorm,发现这个领域值得探索,就发现了这篇文章——Putting Apache Kafka To Use: A Practical Guide to Building a Stream Data Platform(Part 1)。在读的过程中半总结半翻译,形成本文,跟大家分享。 最近你可能听说很多技术名词,例如“流式处理”、“事件....

【译】使用Apache Kafka构建流式数据平台(1)
文章 2014-12-09 来自:开发者社区

手动利用Apache Ant构建部署自己的Java项目

虽然Eclipse从3.0开始已经继承了Ant插件,大家的项目可以自动构建 部署,此篇文章看也没多大用处,但是手动去自己使用以下 Ant来构建自己的Java项目也是一件有意义的事情,虽然现在已经没用人用Javac Java命令行的方式 来搞程序。。。。 Ant是Apache基金项目下的一个工具,在Apache官方给出的解释 是   &nb...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注
相关镜像