MaxCompute 2.0新特性 新实战-云栖社区-阿里

《海量日志数据分析与应用》之数据加工:用户画像 本文对数据仓库分层设计、及对用户画像特性进行提取进行了深度分析与思考。了解详情 MaxCompute如何处理非结构化数据 本文介绍了一种外部表的功能,支持旨在提供...
来自: 阿里云 > 网站

共享单车骑行分析-阿里大学-官方网站,生态下的...

快速、完全托管的TB/PB级数据仓库解决方案,向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全。了解更多 学员动态 将夜1993 ...
来自: 阿里云 > 网站

零基础入门学习Python-阿里大学-官方网站,生态下...

快速、完全托管的TB/PB级数据仓库解决方案,向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全。了解更多 资源编排ROS 是一种...
来自: 阿里云 > 网站

云数据库新人专场

MySQL年付低至19.9,其它热门产品1元起购!
广告

机器学习业务实践之路-阿里大学-官方网站,生态下...

快速、完全托管的TB/PB级数据仓库解决方案,向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全。了解更多 服务器 ECS ...
来自: 阿里云 > 网站

解读基于数加的大数据仓库解决方案

2016云栖大会首日,袋鼠CTO宁海元为我们讲解了基于数加的大数据仓库解决方案。他从企业的数据仓库现状谈起,提出在数据日益增长的今天,集中式架构已不满足数据的存储需求。接着,介绍了数加平台并分析其优势;...
来自: 阿里云 > 网站

深入阿里云大数据IDE–MaxCompute Studio

他们也会使用数加平台,也就是阿里巴巴统一的计算引擎——MaxCompute,在MaxCompute之其实存在一个统一的数据仓库,这个数据仓库中包含了阿里巴巴全部的数据,各个事业部都可以利用数加平台进行数据应用的开发。...
来自: 阿里云 > 网站

大数据环境下该如何优雅地设计数据分层

话说,单纯用用阿里MaxCompute、数据开发套件、流计算、DataX、Hadoop、Spark、Flume处理处理数据,其实只是学会几种新的工具,这是搞工具的,只是在数据仓库中etl中的一部分。当然,技术的更新往往能领到一个...
来自: 阿里云 > 网站

互联工厂大数据云平台打造中国版CPS

本文从智能制造带来的机遇和挑战开始谈起,进而对互联工厂进行定位,并讲解了互联工厂的特点,接着重点说明了工业大数据下的互联工厂模型及应用场景,最后简要介绍了立体仓库货位优化控制系统。以下内容根据演讲PPT...
来自: 阿里云 > 网站

阿里数加平台助力大数据普惠

MaxCompute主要服务于批量结构化数据的存储和计算,可以提供海量数据仓库的解决方案以及针对数据的分析建模服务,其的全部能力均已通过API的形式对外提供,当数据需要存储、处理时,仅需调用相应的API即可得到...
来自: 阿里云 > 网站

阿里云大数据MaxCompute计算资源分布以及LogView分析...

数据计算服务(MaxCompute,原名ODPS)是一种快速、完全托管的PB/EB级数据仓库解决方案,具备万台服务器扩展能力和跨地域容灾能力,是阿里巴巴内部核心数据平台,支撑每日百万级作业规模。MaxCompute向用户提供了...
来自: 阿里云 > 网站

开源大数据周刊-第34期

HybridDB(ApsaraDB HybridDB)是一款在线MPP规模并行处理数据仓库的服务。它基于 Pivotal 公司的开源数据库项目 Greenplum Database 开发,并由阿里云数据库团队在云计算架构下深度扩展。[轻量级规模机器学习算...
来自: 阿里云 > 网站

数据科学与大数据分析——数据的发现 分析 可视化与...

warehouses)在最初可能只是针对特定的目的和业务需求而设计,但随着时间的推移,部门数据仓库内的数据越来越多,其中一些数据可能被强制转换成现有的模式,以启用商业智能并创建OLAP数据库进行分析和报告。...
来自: 阿里云 > 网站

《万物互联》——2.8 理解大数据

as a Service,DBaaS)”能力的公司,通常都是基于数据仓库。已经有很多选择,包括Amazon Redshift、来自Hortonworks的Enterprise Hadoop以及Cloudera Enterprise。这些数据库管理和自动化服务缓解了公司安装、...
来自: 阿里云 > 网站

云栖大会揭秘阿里数加 MaxCompute

阿里数加MaxCompute(原名ODPS)是一种快速、完全托管的TB/PB级数据仓库解决方案。与传统 Hadoop 相比,MaxCompute 向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算...
来自: 阿里云 > 网站

阿里技术系列直播:异构计算、函数计算、自研数据库...

云数据库POLARDB,时代从此划分 移动云,一站式移动研发解决方案 通过MaxCompute Studio实践数据时代的DevOps 详谈阿里巴巴窄带高清2.0 敏捷进化,遇见未来:容器技术加速企业IT转型|云数据库SQL SERVER 2016和新...
来自: 阿里云 > 网站

20+覆盖容器技术、智能工业、大数据、开源数据库等...

陈俊从智能制造带来的机遇和挑战开始谈起,进而对互联工厂进行定位,并讲解了互联工厂的特点,接着重点说明了工业大数据下的互联工厂模型及应用场景,最后简要介绍了立体仓库货位优化控制系统。点击下载讲义 2.王...
来自: 阿里云 > 网站

年薪至少20万,大数据人才到底为什么值钱?

其次要对架构有一定的掌握,比如说,数据仓库的架构,数据挖掘模型的架构,数据存储的架构,网络的架构,等等。除了掌握这些,一些操作系统的底层内容。也就是一些硬件属性也要有一定了解。比如说存储的选择,操作...
来自: 阿里云 > 网站

《拥抱机器人时代——Servo杂志中文...——4.8 理解大数据

as a Service,DBaaS)”能力的公司,通常都是基于数据仓库。已经有很多选择,包括Amazon Redshift、来自Hortonworks的Enterprise Hadoop以及Cloudera Enterprise。这些数据库管理和自动化服务缓解了公司安装、...
来自: 阿里云 > 网站

大数据精准营销必读的“三步曲”及“两误区

大体我们有两种选择:一种是将实体数据从数据仓库复制、替换到数据湖泊(hub),另一种是在结构搭建数据湖泊(hub)(虚拟数据仓库的一种变体)。来自物联网的结构化的数据:物联网中的传感器以及其他设备产生的...
来自: 阿里云 > 网站

职场思考-大数据人才到底值钱在什么地方?

其次要对架构有一定的掌握,比如说,数据仓库的架构,数据挖掘模型的架构,数据存储的架构,网络的架构,等等。除了掌握这些,一些操作系统的底层内容。也就是一些硬件属性也要有一定了解。比如说存储的选择,操作...
来自: 阿里云 > 网站

从BAT看企业构建大数据体系的六层级

很多公司的数据无法有效利用,就是缺乏统一规范,产品数据上报任由开发按照自己的理解和习惯上报,没有标准化的SDK和上报协议,并且数据散落在各个部门产品的服务器,无法构建结构化的数据仓库。做数据平台的架构,...
来自: 阿里云 > 网站

从BAT看企业构建大数据体系的六层级

很多公司的数据无法有效利用,就是缺乏统一规范,产品数据上报任由开发按照自己的理解和习惯上报,没有标准化的SDK和上报协议,并且数据散落在各个部门产品的服务器,无法构建结构化的数据仓库。做数据平台的架构,...
来自: 阿里云 > 网站

动辄数百TB级数据的分析平台 海量并发无压力

Redshift Redshift:提供基于的全托管的PB级高速数据仓库,用现有BI工具分析海量数据。随着诸葛io的客户越来越多,Greenplum的方案已不再适合SaaS服务,因为它虽然查询性能很好,可一旦海量并发时便遇到性能瓶颈。...
来自: 阿里云 > 网站

动辄数百TB级数据的分析平台 海量并发无压力

Redshift Redshift:提供基于的全托管的PB级高速数据仓库,用现有BI工具分析海量数据。随着诸葛io的客户越来越多,Greenplum的方案已不再适合SaaS服务,因为它虽然查询性能很好,可一旦海量并发时便遇到性能瓶颈。...
来自: 阿里云 > 网站

【精彩回顾】第五届中国大数据应用论坛隆重举行

他说:所有的搜索行为都是基于数据给予我们最精准的推荐,数据存放要达到两个要求,一是数据存放的地方要被网络随时随地调用,数据仓库要有不同形式的网络结构;二是所有的数据必须要在不同的存放地点有副本存在,...
来自: 阿里云 > 网站

1小时掌握大数据分析技能,就是这么简单

通过本认证学习,学员可掌握数据仓库元数据的应用及核查方法,通过记录核查表,利用元数据,分析数据产生问题的原因,制定解决方案,提升数据质量。学习地址:https://edu.aliyun.com/certification/cldd28 场景6:...
来自: 阿里云 > 网站

《企业大数据系统构建实战:技术、架构、实施与应用》...

曾参与企业级项目包括大型电商网站的BI系统、数据仓库数据系统等设计和研发项目,以及金融银行类企业风险及异常交易分析项目。实施中型企业数据项目包括居然之家、中国银联、华农保险、中国电信等超过50家客户...
来自: 阿里云 > 网站

Teradata扩展数据湖搭建能力

数据仓库研究院(TDWI)数据管理研究负责人Philip Russom博士表示:“许多企业正在尝试部署Apache Spark,通常会结合数据湖使用,希望能发挥其在流数据、查询和分析的优势。但用户很快意识到,Spark并不容易使用,...
来自: 阿里云 > 网站

【云栖大会】畅聊阿里云数加平台

宁海元:基于数加的大数据仓库解决方案 杭州玳数科技有限公司CTO宁海元介绍了如何基于数加平台,收集整合各种数据,构建企业级的数据仓库,帮助企业实时监控设备状态、运行轨迹,以及提高精细化的运营效率等。孙庆平...
来自: 阿里云 > 网站

开源大数据技术专场(上午):Spark、HBase、JStorm...

SQL,性能接近MPP数据仓库,一切基于优化(Catalyst),新硬件的支持(比如:内存、GPU),更加友好的支持显然更为重要。天梧:HBase的一些实践与探索 阿里巴巴中间件技术部高级技术专家 天梧 时至今日,数据...
来自: 阿里云 > 网站

从底层到应用,那些数据人的必备技能

至少在以下几点,我觉得数据仓库人员应该要做好: a、数据字典的完整性,用的人都希望能够清晰的知道这个字段的逻辑是什么。字段要保持很好的一致性,不要同样一个字段在不同表里有不同的定义。b、核心流程的稳定...
来自: 阿里云 > 网站

创建企业级品质数据湖 Spark没那么简单

数据仓库研究院(TDWI)数据管理研究负责人Philip Russom博士表示:“许多企业正在尝试部署Apache Spark,通常会结合数据湖使用,希望能发挥其在流数据、查询和分析的优势。但用户很快意识到,Spark并不容易使用,...
来自: 阿里云 > 网站

动辄数百TB级数据的分析平台 海量并发无压力

Redshift Redshift:提供基于的全托管的PB级高速数据仓库,用现有BI工具分析海量数据。随着诸葛io的客户越来越多,Greenplum的方案已不再适合SaaS服务,因为它虽然查询性能很好,可一旦海量并发时便遇到性能瓶颈。...
来自: 阿里云 > 网站

大数据工程师练成记之首重:知识体系一览!

数据工程师要做的可视化可不单单是表格数据展示,还有将数据从数据仓库中抽取得到实时呈现和展示。FineReport是国内数一数二的报表工具,功能之强大已经完全覆盖掉部分企业日常办公数据呈现的需求,与excel不同...
来自: 阿里云 > 网站

开源大数据技术专场(下午):Databricks、Intel、阿里...

支持的MetaService,使安全和易用性进一步增强,Hadoop也对OSS小文件和数据仓库做了针对性的优化,使其在读写的性能表现不俗,几乎与HDFS相当,同时Hadoop+OSS的价格又低于传统的Hadoop+HDFS,只有合理组合才能...
来自: 阿里云 > 网站

创业公司如何做数据分析(二)运营数据系统

作为系列文章的第二篇,本文将首先来探讨应用层中的运营数据系统,因为运营...创业公司如何做数据分析(四)ELK日志系统 创业公司如何做数据分析(五)微信分享追踪系统 创业公司如何做数据分析(六)数据仓库的建设
来自: 阿里云 > 网站

数据挖掘与数据化运营实战

在本书的编写过程中,得到了淘宝网的商品推荐高级算法工程师陈凡(微博地址为hppt:/weibo.com/bicloud)和阿里巴巴B2B的数据仓库专家蒿亮(微博地址为http://weibo.com/airjam;E-mail:airjam.hao@gmail.com)热情...
来自: 阿里云 > 网站

解析阿里容器服务

应用镜像化部署,在容器集群中加入两台云服务器和一个负载均衡,并通过云数据库 RDS 版提供数据存储,最后选择 WordPress 等容器镜像。2)持续集成系统构建,在阿里云容器 Hub 创建一个自动构建类型的镜像仓库,选择...
来自: 阿里云 > 网站

《Spark与Hadoop大数据分析》一一2.1 Apache Hadoop...

数据仓库转移到Hadoop:将数据转移到执行提取、转换和加载(Extract,Transform,and Load,ETL)任务的 Hadoop。数据模式会频繁更改。解决方案:用 Sqoop 将数据导入为支持模式演进、占用更少存储空间和 ETL 任务...
来自: 阿里云 > 网站

数据分析师的基本素养——论如何成为一名数据科学家 ...

例如,对于计算机科学专业来说,尽管学习规模分布式数据库与算法很重要,但是学习人机界面交互和用户体验设计似乎没有那么的必要,类似的还有单一类型存储、操作系统以及通信网络等等。同样地,有些统计学课程...
来自: 阿里云 > 网站

精彩回顾|DB&DI 数据智能技术研讨沙龙(杭州站)顺利...

张 辉(士诚)·阿里*演讲主题:如何构建数据仓库?[image](https://yqfile.alicdn.com/7647d581093a655d854745ffc5773ec3dabeb813.png) 崔 京(乙休)·阿里*演讲主题:MySQL数据库的一致性和可靠性思考 [image...
来自: 阿里云 > 网站

神州数码与IBM携手共建解决方案演示中心

数据仓库、数据库、数据集成、业务流程管理等组件构成的IBM数据分析平台,更是将数据融入企业内部,赋予企业业务创新与管理转型的动力。神州数码IBM业务本部软件事业部总经理王炜先生表示:“IBM一直是我们的...
来自: 阿里云 > 网站

一文读懂数据可视化

很多数据可视化工具都支持团队协作数据、数据仓库、文本等多种方式,并能够通过互联网进行展现。数据可视化主要通过编程和非编程两类工具实现。主流编程工具包括以下三种类型:从艺术的角度创作的数据可视化,比较...
来自: 阿里云 > 网站

数据分析侠A的成长故事

通过几个月的学习,以及请教数据仓库的同学,同学A终于明白了每天的数据都在里面,他们都是什么产生,这为同学A在以后的数据底层表熟悉打下了坚实的基础。2015.8.25更新-就这样同学A折腾了数据库折腾了几个月,...
来自: 阿里云 > 网站

【独家】一文读懂数据可视化

很多数据可视化工具都支持团队协作数据、数据仓库、文本等多种方式,并能够通过互联网进行展现。数据可视化主要通过编程和非编程两类工具实现。主流编程工具包括以下三种类型:从艺术的角度创作的数据可视化,比较...
来自: 阿里云 > 网站

重磅:如何不花钱就成为数据科学家?

甚至于,某些人眼中的可视化控制面板,在另一些人看来只是永无止境的ETL(Extract-Transform-Load,数据仓库技术&)过程。在我看来,数据科学家是一类比数据创造者少一些对科学的理解,比数据生成者少一点对数据的...
来自: 阿里云 > 网站

不止是冰山一角——阿里效团队规模代码构建技术...

第三,数据不能持久化,目前Jenkins的数据是通过文本的方式保存的,而且量很,不利于数据维护和后续的数据分析;第四,执行机掉线没有报警功能,不会及时通知管理员及时处理;第五,数据反馈机制比较单一,Jenkins...
来自: 阿里云 > 网站

数据库选型十八摸 之 PostgreSQL-致 架构师、开发者

另外,PostgreSQL这个数据库这些年的发展非常的迅猛,虽然国内还跟不国外的节奏,但是相信国人逐渐会融合进去。所以我专门针对PostgreSQL提炼了它的一些应用场景(普通的应用场景就不举例了),希望对你的选型可以...
来自: 阿里云 > 网站

ElasticSearch大数据分布式弹性搜索引擎使用

从ELK这种系统层的工具到电商平台的核心业务交易系统的设计都需要它来支撑实时大数据搜索分析。比如,商品中心的千万的sku需要实时搜索,再到海量的在线订单实时查询都需要用到搜索。在一些DevOps的工具中都需要es...
来自: 阿里云 > 网站

全球最热门的NoSQL系统——MongoDB技术实践与探索

本次专题在运维,建模,原理都有覆盖,既有MongoDB官方中华区首席架构师带来的MongoDB高级设计模式讲解,又有阿里云数据库组技术专家对MongoDB疑难杂症的分析和优化;此外,演讲嘉宾都是社区里的先锋军,会将最...
来自: 阿里云 > 网站

DOCKER简明教程:通过容器连接REDIS数据

Docker镜像仓库简介 大家可以在Docker Hub里搜索到目前所有的主流应用和服务的镜像,像Python语言、MySQL数据库等等镜像在Docker Hub里面都有。而且Docker Hub里面的镜像数量非常多,不管我们搜什么关键词,都能搜...
来自: 阿里云 > 网站

吉特仓库管理系统-基本问题解答

哪里修改数据连接 这个是所有开发者中问的最多的问题,基本加我QQ问我问题的基本也就是这个了。数据库配置不是在web.config 中, 请各位不要被web.config中的连接误导了,这是由于新建项目自动生成的代码。数据库配置...
来自: 阿里云 > 网站

ElasticSearch大数据分布式弹性搜索引擎使用—从0到1

从ELK这种系统层的工具到电商平台的核心业务交易系统的设计都需要它来支撑实时大数据搜索分析。比如,商品中心的千万的sku需要实时搜索,再到海量的在线订单实时查询都需要用到搜索。在一些DevOps的工具中都需要es...
来自: 阿里云 > 网站

MaxCompute百问集锦(持续更新20171011)

数据计算服务(MaxCompute,原名 ODPS)是一种快速、完全托管的 GB/TB/PB 级数据仓库解决方案。MaxCompute 向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,...
来自: 阿里云 > 网站

从Docker的转变,谈容器生态与微服务的发展

公司的好处有人力和财力,而且Docker的商务版(DDC)未来要放在国内公有云上,阿里有这样的基础设施,可以在初期承受大量客户免费试用的投入,在IaaS公有生产级别也更可靠。当然,有人欢喜有人忧,此番合作还意味...
来自: 阿里云 > 网站

《开源容器OpenShift:构建基于Kubernetes的企业...

这些主机可以是物理机或虚拟机,同时可以运行在私有、公有,或混合云上。在OpenShift的集群成员有两种角色。Master节点:即主控节点。集群内的管理组件均运行于Master节点之。Master节点负责管理和维护...
来自: 阿里云 > 网站

《Hive编程指南》一第1章 基础知识

因为大多数的数据仓库应用程序是使用基于SQL的关系型数据库实现的,所以Hive降低了将这些应用程序移植到Hadoop的障碍。用户如果懂得SQL,那么学习使用Hive将会很容易。如果没有Hive,那么这些用户就需要去重新学习...
来自: 阿里云 > 网站

公开课视频+文字转录()|AI 研习社

另外,本质来讲它还有一个功能:管理数据服务的云数据。因为我们既然需要快速的查找数据,那么对于数据湖来讲,我们的数据(元数据)是不是需要被管理起来?比如说,如果我们提供的是一个数据平台,从数据通道进来...
来自: 阿里云 > 网站

《深入理解Hadoop(原书第2版)》——导读

第10章,讲解Hive框架,这是一个基于MapReduce的数据仓库框架。第11章,讲解Pig和Crunch框架。这些框架可以帮助使用者在Hadoop平台构建数据处理管道。第12章,讲解HCatalog框架。该框架帮助企业用户可以像访问数据...
来自: 阿里云 > 网站

企业应用如何解决Multi-Cloud的基础设施管理及应用...

通过下面的模形我们可以看到企业选择Multi-Cloud的因素及应用部署策略,包括7个主要因素:计算平台数据中心的访问速度/服务的性能/可用性、计算平台的成本、计算平台的安全性、客户服务质量、本地化、计算...
来自: 阿里云 > 网站

30分钟带你快速入门MySQL教程

成功登陆到MySQL数据库中之后,我们首先就来看一下,MySQL数据库中有多少个数据库(你可以理解为,MySQL数据库是一个大仓库,然后这个大仓库下面有多个小的仓库,我们就在这些小仓库中存放我们的数据),我们进行...
来自: 阿里云 > 网站

基于Docker的SaaS解决方案

阿里曾经遇到过这样一个客户,该客户是海外一个规模较的开发商,他们所有的应用都是运行在云上的虚机镜像,同时这些应用是由多种语言开发而成,并且通过自动化运维脚本在云上完成运维工作。当将这一套配置全部...
来自: 阿里云 > 网站

莫源:像搭积木一样玩转Docker的持续交付

图展示的是阿里云容器服务和周边的生态,图中左边和右边都是阿里云的IaaS层服务,如云数据库、缓存服务等,如果想在容器内使用数据库,是可以使用阿里云提供的云数据库去做;如果想用消息队列,也可以找到对应的云...
来自: 阿里云 > 网站

规模代码构建技术实践

效持续集成持续交付专场直播中,阿里技术专家何卫龙为大家带来了《规模代码构建技术实践》的分享。本次分享主要从持续集成的背景,持续集成平台的演进过程,以及如何进行规模持续集成构建三部分展开,内容...
来自: 阿里云 > 网站

演讲实录丨马迁 智慧教育的发展和分步实施

在右边可以看到我们有几个想解决的问题,基本我们觉得,通过这个大数据项目可能会有一些成果。围绕着这几个领域,那第一个是学习路径的描述,这个特别是泛指在微课以及练习。刚才我们有一位专家也谈到可汗学院,那...
来自: 阿里云 > 网站

服务机器人市场大热 安防如何切入

巡逻机器人的其中一个核心能力就是以机器视觉为核心的观察判别能力,安防企业将自身深度积累的高清视频监控技术、图像增强现实技术、人脸识别技术、车牌识别技术以及计算平台和大数据分析处理能力,来快速构建机器...
来自: 阿里云 > 网站

HIVE 新特性 ACID 初试

操作,这显然很不方便,尤其是在构建数据仓库的过程中,一个比较常见的例子是维度表经常需要更新某列,在 Hive 中需要更新历史所有数据,这显然是不合理的。在 Hive 0.14 版本,支持了行级别的 ACID 与 Transactions...
来自: 阿里云 > 网站

SQL Server 2016 列存储技术做实时分析

数据仓库的特点是:数据形态固定,几乎或者很少发生数据变更,统计查询分析读取数据量。传统的RDBMS分析模型图,如下图展示(图片直接截取自微软的培训材料): [01.png]...
来自: 阿里云 > 网站

Docker技术入门与实战(第2版)导读

5.2 时速镜像市场&47 5.3 搭建本地私有仓库&48 5.4 本章小结&50 第6章 Docker数据管理&51 6.1 数据卷&51 6.2 数据卷容器&52 6.3 利用数据卷容器来迁移数据&53 6.4 本章小结&54 第7章 端口映射与容器互联&...
来自: 阿里云 > 网站

中小企业Docker实战:那些年我们踩过的五个坑

转发到应用之后,应用的若干个服务对应的若干个容器链接阿里云数据库或自荐的数据库。云服务器ECS:https://www.aliyun.com/product/ecs 容器服务:https://www.aliyun.com/product/containerservice 我们面临的...
来自: 阿里云 > 网站

《深入理解Hadoop(原书第2版)》——第2章 Hadoop中...

Hive可以把海量数据集放入数据仓库中,用户可以编写类似SQL语句的Hive查询语句来查找数据。Hive引擎把Hive查询语句透明地转换为底层MapReduce任务来执行。高级用户可以使用Java语言来编写用户自定义函数(UDF)。...
来自: 阿里云 > 网站

聊一聊双十一背后的技术-物流,动态路径规划

如果基数非常庞大,可以选择基于PostgreSQL的Greenplum数据仓库,进行文本分析与机器学习(支持MADlib库,支持R)。Greenplum支持文本分析,支持地理位置信息处理,支持MADlib机器学习库,还支持R语言自定义函数,...
来自: 阿里云 > 网站

PostgreSQL修炼之道:从小工到专家

第三方开源软件及架构篇讲解了与PostgreSQL数据库配套使用的一些常用的开源软件及架构设计方面的内容,通过阅读此篇,可以开阔大家的眼界,提高数据库架构设计能力。本书中有大量的例子,读者边阅读此书边按例子进行...
来自: 阿里云 > 网站

TensorFlow在工程项目中的应用 公开课视频+文字转录...

本周四,雷锋网 AI 研习社邀请了跨国 IT 巨头 ThoughtWorks 的资深数据架构师白发川,主讲线公开课,为大家讲解&TensorFlow 在工程项目中的应用。讲师 白发川:自我介绍一下,我是 ThoughtWorks 白发川,之前一直...
来自: 阿里云 > 网站

《新编计算机科学概论》一导读

着重阐述数据库方法的基本概念、原理,结合关系数据库介绍了SQL基本情况,介绍了数据挖掘技术和数据仓库的基本原理。第8章 软件工程 本章讨论规模化软件开发的方法。包括软件过程、需求分析、软件工程方法、软件...
来自: 阿里云 > 网站

三个词,让你看懂马云、刘强东力推的“新零售”

大数据:收集、整理、分析大量的数据,尤其是消费者数据,以提供各项生产、销售、服务相关优化决策的依据。这部分在文章后面会更加详细讲解计算:个体或者单个企业,不需要太多投入自己搭建大型计算机等设备,就...
来自: 阿里云 > 网站

PgSQL·GIS应用·物流,动态路径规划

如果基数非常庞大,可以选择基于PostgreSQL的Greenplum数据仓库,进行文本分析与机器学习(支持MADlib库,支持R)。Greenplum支持文本分析,支持地理位置信息处理,支持MADlib机器学习库,还支持R语言自定义函数,...
来自: 阿里云 > 网站

ROS 中使用 Chef 部署应用

本文将以部署 WordPress 为例,讲解如何通过 ROS 去构建一个高可用的 Web Server 环境,最后通过执行 Chef 的 Recipe 在高可用的 Web Server 基础设施环境中安装配置 WordPress。通过最终的这个 ROS模板,你可以简洁...
来自: 阿里云 > 网站

mongoDB BI 分析利器-PostgreSQL FDW(MongoDB ...

for Greenplum 云数据仓库》https://yq.aliyun.com/articles/57604 *《Greenplum 数据分布黄金法则 论分布列与分区的选择》https://yq.aliyun.com/articles/57822 *《阿里云ApsaraDB RDS用户- OLAP最佳实践》...
来自: 阿里云 > 网站

2016NEC创新解决方案展聚焦智慧城市建设

同时针对传统商户拥抱大数据的现状,基于大数据下的社区购物系统,NEC专为社区打造POS系统,商户可以在微信等移动端营销,为用户提供更好的购物体验。NEC的智能酒店解决方案,可以为酒店提供管理系统、One Box...
来自: 阿里云 > 网站

基于Docker的mysql mha 的集群环境构建实践

安装配置安装工作在第一版中都是在宿主机完成由于时间关系就不在这里展开,很简单,相信大家都知道配置,如果大家有兴趣,我可以再后面讲解整个完整配置过程,至此我们3个节点的主从数据库通过容器构建完成了。...
来自: 阿里云 > 网站

Docker技术入门与实战(第2版).

44 第5章 访问Docker仓库&45 5.1 Docker Hub公共镜像市场&45 5.2 时速镜像市场&47 5.3 搭建本地私有仓库 48 5.4 本章小结&50 第6章 Docker数据管理&51 6.1 数据卷&51 6.2 数据卷容器&52 6.3 利用数据卷...
来自: 阿里云 > 网站

《循序渐进学Spark》Spark架构与集群环境

6.Spark SQL Shark是构建在Spark和Hive基础之数据仓库。它提供了能够查询Hive中所存储数据的一套SQL接口,兼容现有的Hive QL语法。熟悉Hive QL或者SQL的用户可以基于Shark进行快速的Ad-Hoc、Reporting等类型的...
来自: 阿里云 > 网站

React+Redux打造“NEWS EARLY”单页应用 一步步让你...

侧边栏组件 routerWrap:路由相关组件 骨架构建 我认为,redux之所以学习曲线陡,很程度就在于数据流的贯通。“组件触发(dispatch)各种action,单向数据流流向reducer,reducer是一个纯函数(函数式编程思想),...
来自: 阿里云 > 网站

一颗被冷冻了五年的头颅被它一眼认出 计算机视觉识别...

大数据文摘今日推荐“每日人物(ID:meirirenwu)”的一篇文章,它讲述了人工智能和计算机视觉识别是如何影响我们的生活。浙江一处殡仪馆内,有一颗冷冻了5年的头颅。谁也不知道这个生命有过怎样的故事,死者身体的...
来自: 阿里云 > 网站

京东资深前端架构师分享前端工程化在电商首页中的实践

分享问答 问:公共模块是自己搭建的,还是基于私有的npm仓库?刘威:自己搭建的,只需在linux配置好一台FTP服务器,通过FTP服务器储存,下载,以及分配相关用户权限;有好的模块可以发布,开发项目时候看到已有...
来自: 阿里云 > 网站

MySQL系列教程(五)

一个融合内存缓存技术、Nosql技术、HDFS数据的新型SQL Server 结合传统数据库和新型分布式数据仓库的新一代企业级数据库产品 一个新颖的数据库中间件产品 目标 低成本的将现有的单机数据库和应用平滑迁移到“”...
来自: 阿里云 > 网站

【SQL】Oracle SQL monitor

SQL的性能问题,而是为了加快DBA优化数据仓库类SQL的效率,这些SQL是偏OLAP系统的,特点是并发量低、运行时间久、SQL复杂度高。满足以下条件的任意SQL都会被SQL MONITORING监控到:如果串行执行的SQL,消耗的CPU时间...
来自: 阿里云 > 网站

作为一个新手的Oracle(DBA)学习笔记

Oracle数据库笔记 Jack Chaing 作者QQ595696297 交流群 127591054 祝大家学习进步。如果大家想看Word版本的可以去下载:Word排版比较清晰一些。http://download.csdn.net/detail/jack__chiang/9810532 此笔记是作者...
来自: 阿里云 > 网站

【软妹带你学技术】十一份Docker福利包疯狂砸来,看官...

kernel,各发行版本都会做相应包装、优化和简化,但是基本内核版本不会有太差异。根据我的经验,推荐使用ubuntu或者centos。Ubuntu的优点是: 1.内核更新及时;2.软件安装和更新方便;3.GUI简单实用 CentOS就是...
来自: 阿里云 > 网站

传统企业应用容器化的痛点、坑和解决之道

应该说这几年,计算这个领域可以说是精彩纷呈,基本每年都有1-2个技术的热点,计算、大数据、容器。从去年开始容器上升到一个非常高的热点了,在这方面做研究的,新的产品出来非常快。从我这边来看,容器不光...
来自: 阿里云 > 网站

深入理解Spark:核心思想与源码分析

感谢周亮、澄苍、民瞻、石申、清无、少侠、征宇、三步、谢衣、晓五、法星、曦轩、九翎、峰阅、丁卯、阿末、紫丞、海炎、涵康、飏、孟天、零一、六仙、知、井凡、隆君、太奇、晨炫、既望、宝升、都灵、鬼厉、归钟...
来自: 阿里云 > 网站

固若金汤-PostgreSQL pgcrypto加密插件

数据仓库是企业数据的集散地,数据安全不容忽视,特别是云上的用户更是如此。https://www.aliyun.com/product/gpdb?spm=5176.7960203.237031.39.3aCwlI ### 创建pgcrypto扩展包 ``` pg92@db-172-16-3-40->psql-h ...
来自: 阿里云 > 网站

《面向机器智能的TensorFlow实践》引言

在看似无限的存储能力的支持下,开发者们为数据仓库选择了一种“更多即是更好”的方法,存储着从他们的产品和客户那里收集到的以拍字节(PB)为单位计的海量数据。与此同时,计算机的性能也在持续提升。虽然CPU的...
来自: 阿里云 > 网站

中国电信基于Mesos+Docker的运维自动化在CDN中的实践

本文讲的是中国电信基于Mesos+Docker的运维自动化在CDN中的实践【编者的话】本次分享将讲解容器技术在CDN系统中的应用,包括应用的容器化,使用Mesos、Marathon、ZooKeeper对线业务的快速部署、升级、回滚以及...
来自: 阿里云 > 网站

中国电信基于Mesos+Docker的运维自动化在CDN中的实践

本文讲的是中国电信基于Mesos+Docker的运维自动化在CDN中的实践【编者的话】本次分享将讲解容器技术在CDN系统中的应用,包括应用的容器化,使用Mesos、Marathon、ZooKeeper对线业务的快速部署、升级、回滚以及...
来自: 阿里云 > 网站

Oracle AWR报告详细分析(文档 ID 1523048.1)

wait time(不包含空闲等待)(非后台进程)说白了就是db time就是记录的服务器花在数据库运算(非后台进程)和等待(非空闲等待)的时间 DB time=cpu time+all of nonidle wait event time 在79分钟里(其间收集了3次...
来自: 阿里云 > 网站

etcd:从应用场景到实现原理的全方位解读

因为每个对等服务节点都存有完整的数据,所以用户的访问流量就可以分流到不同的机器。etcd本身分布式架构存储的信息访问支持负载均衡。etcd集群化以后,每个etcd的核心节点都可以处 理用户的请求。所以,把数据...
来自: 阿里云 > 网站

Google Interview University-坚持完成这套学习手册,...

抽认卡页面的代码仓库 我的抽认卡数据库:有一点需要记住的是,我做事有点过头,以至于把卡片都覆盖到所有的东西。从汇编语言和 Python 的细枝末节,乃至到机器学习和统计都被覆盖到卡片。而这种做法,对于 ...
来自: 阿里云 > 网站

《Puppet实战手册》——导读

第4章处理一些系统管理员最常见的任务,包括管理配置文件、使用Augeas、从代码片段和模板生成文件、管理第三方软件仓库、使用GnuPG加密Puppet中的机密数据,以及从源代码构建软件包。第5章阐释了什么是虚拟资源,...
来自: 阿里云 > 网站
< 1 >
共有1页 跳转至: GO

你可能感兴趣

热门推荐

小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化