《数据科学与大数据分析——数据的发现 分析 可视化与表示》一1.4 大数据分析案例

基于MapReduce 计算范式的系统,被用于处理各种不同结构的 数据。对于很多需要涉及大量或者难以操作的非传统结构 数据 数据项目来说,Hadoop是一种理想的技术框架。Hadoop的主要优点之一是采用 分布式文件系统,这意味着它可以使用 分布式集群服务器和商用 ...
来自: 开发者社区 > 博客 作者: 异步社区 浏览:234 回复:0

大数据取舍之道、大数据营销、大数据时代、互联网大规模数据挖掘与分布式处理等书籍

帖隐藏的内容需要积分高于 80 才可浏览,您当前积分为 0 《 数据:互联网大规模 数据挖掘 分布式处理》迷你书 数据互联网大规模 数据挖掘 分布式.png (305.09 KB, 下载次数: 2) 下载附件  保存到相册 2014-12-10 23:09 上传 链接:http://pan.baidu.com/s/1i3qtq53 密码:u2ok ...
来自: 开发者社区 > 论坛 作者: sunlidalianmei 浏览:334 回复:9

《数据科学与大数据分析——数据的发现 分析 可视化与表示》一2.8 案例研究:全球创新网络和分析(GINA)

本节书摘来自异步社区《 数据科学 数据分析—— 数据的发现 分析 可视化 表示》一书中的第2章,第2.8节,作者【美】EMC Education Services(EMC教育服务团队),更多章节内容可以访问云栖社区“异步 ...
来自: 开发者社区 > 博客 作者: 异步社区 浏览:286 回复:0
推荐

DataWorks新用户首月0.4折

历经阿里巴巴11年数据中台最佳实践沉淀,为您全方位提升数据开发和治理体验
广告

《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一一1.3 数据清洗和建立用于分析的数据表示

本节书摘来自华章计算机《 数据科学R语言实践:面向 计算推理 问题求解的 案例研究法》一书中的第1章,第1.3节,作者:[美] 德博拉·诺兰(Deborah Nolan)  邓肯·坦普·朗(Duncan ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:213 回复:0

《精通CFD工程仿真与案例实战---FLUENT GAMBIT ICEM CFD Tecplot》——1.6 显示计算结果与分析结果数据

###1.6 显示 计算结果 分析结果 数据精通CFD工程仿真 案例实战---FLUENT GAMBIT ICEM CFD Tecplot####1.6.1 显示速度的云图(1)进行Display / Graphics and Animations ...
来自: 开发者社区 > 博客 作者: 异步社区 浏览:122 回复:0

《深入理解大数据:大数据处理与编程实践》一一第3章 大数据存储——分布式文件系统HDFS

###第3章 数据存储—— 分布式文件系统HDFS 数据处理面临的第一个问题是,如何有效存储规模巨大的 数据?对于 数据处理应用来说,依靠集中式的物理服务器来保存 数据是不现实的,容量也好, 数据传输速度也好,都会成为瓶颈。要实现 ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:247 回复:0

《精通CFD工程仿真与案例实战---FLUENT GAMBIT ICEM CFD Tecplot(第2版)》——1.6 显示计算结果与分析结果数据

”公众号查看。###1.6 显示 计算结果 分析结果 数据**1.6.1 显示速度的云图**(1)进行Display / Graphics and Animations操作,在Graphics and Animations设置面板内(见图1 ...
来自: 开发者社区 > 博客 作者: 异步社区 浏览:161 回复:0

大数据一定是基于分布式计算的吗_关于大数据基础服务的问题

数据一定是基于 分布式 计算的吗_关于 数据基础服务的问题 ...
来自: 开发者社区 > 问答 作者: 知与谁同 浏览:7 回复:1

《Storm技术内幕与大数据实践》一第9章 大数据应用案例

本节书摘来异步社区《Storm技术内幕 数据实践》一书中的第9章,第9.1节,作者: 陈敏敏 , 黄奉线 , 王新春责编: 杨海玲,更多章节内容可以访问云栖社区“异步社区”公众号查看。###第9章 数据应用 案例 ...
来自: 开发者社区 > 博客 作者: 异步社区 浏览:226 回复:0

如何有效的结合分布式传感器网络、compressive sensing和云计算,实现高效的数据海与云计算互应用?

如何有效的结合 分布式传感器网络、compressive sensing和云 计算,实现高效的 数据计算互应用? ...
来自: 开发者社区 > 论坛 作者: olivia217 浏览:237 回复:1

大数据与机器学习:实践方法与行业案例.1.2数据平台

这两个问题。&图1-8  数据平台的基础: 分布式 分布式 扩展性密不可分,当存储和 计算能力不足时,显而易见的方案就是增加集群中的机器,在存储价格和CPU价格日益下降而人力成本日益上涨的今天,这比从优化传统数据库系统着手要简单高效,且成本更 ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:505 回复:0

大数据与机器学习:实践方法与行业案例.2.2 数据缓冲区

统一管理和分发。比如,在一个多部门、跨地域的企业中,不同地区、不同部门的 数据文件之间的交互,如果没有 数据缓冲区的统一收集 分发,那将会形成一个复杂的交叉网络。表2-2列举了 数据缓冲区的一些主要优点,本书主要专注于系统解耦,并基于 数据缓冲区完成原始 数据的 ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:736 回复:0

大数据与机器学习:实践方法与行业案例1.1 数据的基本形态

,数据库领域的专业术语简直让人抓狂,非要搞得那么高深吗? 可不必。 数据科学家是 数据的应用者,以最 限度来提炼 数据价值为目的,不必像 数据仓库开发者那样对 数据的存储、结构以及 数据仓库的内生技术一清二楚,但应该站在找到 数据、拼接 数据、使用 数据的角度,大体了解 数据的 ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:383 回复:0

《大数据云计算时代 数据中心经典案例赏析》——第 1 章 ACT公司

本节书摘来自异步社区《 数据计算时代 数据中心经典 案例赏析》一书中的第1章,作者: 【美】Douglas Alger 更多章节内容可以访问云栖社区“异步社区”公众号查看。###第 1 章 ACT公司基本信息 ...
来自: 开发者社区 > 博客 作者: 异步社区 浏览:270 回复:0

大数据与机器学习:实践方法与行业案例.2.1 数据闭环

。—赫伯特·西蒙 数据存在于生产环境、 数据缓冲区以及分析环境的各个节点中,并且由各种技术手段支撑着 数据的存储和 计算。通常,在企业中,生产环境由开发部门负责,而分析环境和 数据缓冲区则由 数据部门负责,物理环境分离以及管理上的隔离会让人们产生一 ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:439 回复:0

大数据与机器学习:实践方法与行业案例.1.1 数据的基本形态

数据 平台篇(Data & Infrastructures)迟序之数,非出神怪,有形可检,有数可推。—祖冲之数学是知识的工具,亦是其他知识工具的泉源。所有研究顺序和度量的科学均和数学有关。—笛卡 ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:313 回复:0

《大数据云计算时代 数据中心经典案例赏析》——导读

。15年前我开始从事 数据中心的工作,先是负责采购设备和盘点硬件,最后是为思科设计和管理各种专业的 计算环境。这些年来,我还造访过上百个其他的 数据中心,在条件允许的情况下拜访它们的设计者和管理者,并 他们交流。 数据中心的人员都尽可能地将相同的物理设备放在地面 ...
来自: 开发者社区 > 博客 作者: 异步社区 浏览:191 回复:0

大数据与机器学习:实践方法与行业案例.3.1 数据缓冲区的基本规则

第3章实战:打造 数据闭环道生一,一生二,二生三,三生万物。万物负阴而抱阳,冲气以为和。—老子《道德经》你不能两次踏进同一条河流,因为新的水不断地流过你的身旁。—柏拉图《泰阿泰德》前面两章已经介绍了 数据闭环的 ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:356 回复:0

《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一一2.3 数据清洗和变量格式化

本节书摘来自华章计算机《 数据科学R语言实践:面向 计算推理 问题求解的 案例研究法》一书中的第2章,第2.3节,作者:[美] 德博拉·诺兰(Deborah Nolan)  邓肯·坦普·朗(Duncan Temple ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:266 回复:0

《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一一1.2 原始数据

本节书摘来自华章计算机《 数据科学R语言实践:面向 计算推理 问题求解的 案例研究法》一书中的第1章,第1.2节,作者:[美] 德博拉·诺兰(Deborah Nolan)  邓肯·坦普·朗(Duncan Temple ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:191 回复:0

大数据与机器学习:实践方法与行业案例1.1 数据的基本形态

,数据库领域的专业术语简直让人抓狂,非要搞得那么高深吗? 可不必。 数据科学家是 数据的应用者,以最 限度来提炼 数据价值为目的,不必像 数据仓库开发者那样对 数据的存储、结构以及 数据仓库的内生技术一清二楚,但应该站在找到 数据、拼接 数据、使用 数据的角度,大体了解 数据的 ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:383 回复:0

2017杭州·云栖大会---大数据workshop:《云数据·大计算:海量日志数据分析与应用》之《数据采集:日志数据上传》篇

数据workshop:《云 数据· 计算:海量日志 数据分析 应用》之《 数据采集:日志 数据上传》篇实验背景介绍了解更多2017杭州·云栖大会 TechInsight & Workshop.本手册为云栖 ...
来自: 开发者社区 > 博客 作者: 祁然 浏览:551 回复:1

大数据workshop:《云数据·大计算:海量日志数据分析与应用》之《数据采集:日志数据上传》篇

本手册为云栖大会Workshop《云 计算· 数据:海量日志 数据分析 应用》的《 数据采集:日志 数据上传》篇而准备。主要为保障各位学员在workshop当天能够顺畅进行动手实操,那么本节为学员掌握阿里云 数据采集的操作和使用。## 数据 ...
来自: 开发者社区 > 博客 作者: 祎休 浏览:2929 回复:1

【转载】大数据workshop:《云数据·大计算:海量日志数据分析与应用》之《数据采集:日志数据上传》篇

本手册为云栖大会Workshop《云 计算· 数据:海量日志 数据分析 应用》的《 数据采集:日志 数据上传》篇而准备。主要为保障各位学员在workshop当天能够顺畅进行动手实操,那么本节为学员掌握阿里云 数据采集的操作和使用。 原 ...
来自: 开发者社区 > 博客 作者: frenchfry516 浏览:27 回复:0

大数据与机器学习:实践方法与行业案例导读

,有的讲解理论,有的介绍方法,有的传播理念。但是, 数据从业人员(如 数据工程师、 数据分析师、业务分析师、算法设计师等)应该掌握哪些知识 技能,如何应用 数据解决现实的业务问题呢?恐怕最能给出答案的还是实际的 数据从业者。为此,三位作者基于近10年的 数据分析 应用 ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:594 回复:0

大数据workshop:《云数据·大计算:海量日志数据分析与应用》之《数据分析展现:可视化报表及嵌入应用》篇

本手册为云栖大会Workshop《云 计算· 数据:海量日志 数据分析 应用》的《 数据分析展现:可视化报表及嵌入应用》篇而准备。主要阐述如何使用Quick BI制作报表,将前面几个实验处理分析得来的 数据进行有效的展现和洞察。## 数据 ...
来自: 开发者社区 > 博客 作者: 祎休 浏览:2005 回复:1

【教程免费下载】大数据与机器学习:实践方法与行业案例

介绍方法,有的传播理念。但是, 数据从业人员(如 数据工程师、 数据分析师、业务分析师、算法设计师等)应该掌握哪些知识 技能,如何应用 数据解决现实的业务问题呢?恐怕最能给出答案的还是实际的 数据从业者。为此,三位作者基于近10年的 数据分析 应用经验,融合各自在商业 ...
来自: 开发者社区 > 论坛 作者: 知与谁同 浏览:594 回复:0

大数据与机器学习:实践方法与行业案例.3.3 自动加载程序的数据库设计

载配置信息表用于存储 数据文件到对应的数据库表的加载方式等相关信息,通过主键id file_settings表中的load_config_id关联,主要内容如表3-5所示。表3-5 加载配置信息表(load_config)字 段 数据类型 注 释 ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:405 回复:0

大数据与机器学习:实践方法与行业案例3.4 自动加载程序的多线程实现

”(全量)加载方式,则先将历史 数据删除,然后将新的 数据文件复制到hdfs目录即可。3.4.4 LoadToOracleLoadToOracle是自动加载程序在Oracle数据库上的实现。 Hive 数据仓库的不同之处在于,Oracle数据库(以及 ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:609 回复:0

PgSQL · 应用案例 · HTAP视角,数据与计算的生态融合

;availableGB',available) $$ language plpythonu; 使用pl编程后, 数据 计算水乳交融,效率 增。再通过 CPU多核并行、向量 计算、JIT、GPU、FPGA等手段扩展单体 计算能力。通过 ...
来自: 开发者社区 > 博客 作者: 技术小能手 浏览:53 回复:0

大数据与机器学习:实践方法与行业案例.2.6 本章小结

数据缓冲区,可以实现系统解耦,让 数据闭环具备良好的扩展性,让公司组织间职责更加分明,使 数据环境更加安全等。 数据缓冲区中涉及的 数据批量导出/导入技术,需要使用到各个RDMS系统的批量操作命令。另外在 数据平台中,需要使用hadoop shell和hive ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:352 回复:0

什么是HADOOP、产生背景、在大数据、云计算中的位置和关系、国内外HADOOP应用案例介绍、就业方向、生态圈以及各组成部分的简介(学习资料中的文档材料)

独立项目HADOOP,到2008年1月,HADOOP成为Apache顶级项目,迎来了它的快速发展期。3. 1.3 HADOOP在 数据、云 计算中的位置和关系1.        ...
来自: 开发者社区 > 博客 作者: 涂作权 浏览:463 回复:0

《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一一1.4 信号强度的分析

本节书摘来自华章计算机《 数据科学R语言实践:面向 计算推理 问题求解的 案例研究法》一书中的第1章,第1.4节,作者:[美] 德博拉·诺兰(Deborah Nolan)  邓肯·坦普·朗(Duncan ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:162 回复:0

《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一一2.7 从网上抓取比赛结果

本节书摘来自华章计算机《 数据科学R语言实践:面向 计算推理 问题求解的 案例研究法》一书中的第2章,第2.7节,作者:[美] 德博拉·诺兰(Deborah Nolan)  邓肯·坦普·朗(Duncan Temple ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:312 回复:0

《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一一2.8 练习题

本节书摘来自华章计算机《 数据科学R语言实践:面向 计算推理 问题求解的 案例研究法》一书中的第2章,第2.8节,作者:[美] 德博拉·诺兰(Deborah Nolan)  邓肯·坦普·朗(Duncan ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:339 回复:0

《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一一2.1 引言

本节书摘来自华章计算机《 数据科学R语言实践:面向 计算推理 问题求解的 案例研究法》一书中的第2章,第2.1节,作者:[美] 德博拉·诺兰(Deborah Nolan)  邓肯·坦普·朗(Duncan ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:302 回复:0

《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一一 1.1 引言

本节书摘来自华章计算机《 数据科学R语言实践:面向 计算推理 问题求解的 案例研究法》一书中的第1章,第1.1节,作者:[美] 德博拉·诺兰(Deborah Nolan)  邓肯·坦普·朗(Duncan ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:219 回复:0

《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一一导读

过于简单或者过于复杂,因而不得不放弃。在进行完 数据处理后,有些问题确实成为有趣的统计问题或 数据分析问题,而有些问题则不适宜用来讲解那些我们希望学生关注的 计算和统计相关的主题。我们希望本书及其 案例研究在将有趣的问题整合到面向 数据科学技能的统计课程和 计算课程的 ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:279 回复:0

《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一一2.2 将比赛结果表读入R中

本节书摘来自华章计算机《 数据科学R语言实践:面向 计算推理 问题求解的 案例研究法》一书中的第2章,第2.2节,作者:[美] 德博拉·诺兰(Deborah Nolan)  邓肯·坦普·朗(Duncan Temple ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:254 回复:0

《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一一2.6 对个人跑步时间的变化进行建模

本节书摘来自华章计算机《 数据科学R语言实践:面向 计算推理 问题求解的 案例研究法》一书中的第2章,第2.6节,作者:[美] 德博拉·诺兰(Deborah Nolan)  邓肯·坦普·朗(Duncan Temple ...
来自: 开发者社区 > 博客 作者: 华章计算机 浏览:233 回复:0

学习云计算从入门到实践,一大波视频干货拿走不谢!(文末有彩蛋)

什么是云计算?从业者应该如何入门云计算?企业如何选择阿里云云产品来支持自己的业务形态?看行业大咖如何利用云产品来整合及优化自己的架构?超过三十节课,数十位阿里专家倾情奉献,一一为您解答! 十节课,轻松入门云计算 课程简介:从分布式调度、存储、数据库到分布式系统架构,十节课轻松了解云计算 适合对象...

菜鸟学Linux 第105篇笔记 海量存储解决

菜鸟学Linux 第105篇笔记 海量存储解决 内容总览 大数据带来的挑战 传统存储SAN 分布式存储 多线程与进程执行模式 计算机五大部件变化 分布式系统的难点 分布式文件系统设计目标 分布式事务的模型及规范 CAP, BASE,  集群内数据一致性算法实施过程案例 分...

阿里云边缘计算荣获《2020分布式云与云边协同十佳实践案例》

随着5G商用周期的开始与新基建的发展,5G+边缘计算带动并赋能数字化行业,逐渐形成了预期可观的产业规模。5G周期内,直接和间接带动产业规模就高达万亿级,在如此巨大的市场规模下,会有越来越多的行业具备数字化转型的技术支撑,中心云与边缘侧的协同,将为产业前行提供更好的助推力,满足更广连接、更低时延、更...

DTCC 2020 | 阿里云李飞飞:云原生分布式数据库与数据仓库系统点亮数据上云之路

云计算时代,云原生分布式数据库和数据仓库开始崛起,提供弹性扩展、高可用、分布式等特性。 数据库将面临怎样的变革?云原生数据库与数据仓库有哪些独特优势?在日前的 DTCC 2020大会上,阿里巴巴集团副总裁、阿里云数据库产品事业部总裁、ACM杰出科学家李飞飞就《云原生分布式数据库与数据仓库系统点亮数...

Hadoop高级培训课程大纲-管理员版

一、课程概述 本次培训课程主要面向大数据系统管理人员和开发设计人员,基于开源社区大数据应用最活跃的Hadoop和HBase技术框架。围绕分布式文件存储(HDFS)、分布式并行计算(Map/Recue)和非关系型数据库(NoSql)三个大数据核心应用展开,旨在帮助培训对象建立起完整的大数据理论基础框...

大数据时代数据库-云HBase架构&生态&实践

2018第九届中国数据库技术大会,阿里云高级技术专家、架构师封神(曹龙)带来题为大数据时代数据库-云HBase架构&生态&实践的演讲。主要内容有三个方面:首先介绍了业务挑战带来的架构演进,其次分析了ApsaraDB HBase及生态,最后分享了大数据数据库的实际案例。数十款阿里云产...

全球分布式云大会上,阿里云边缘计算又获奖啦!

12月17日,全球分布式云大会在深圳隆重召开。本次大会揭晓了“边缘计算领导力企业TOP5”系列奖项,其中,阿里云凭借在商业创新、技术实力、产品服务等多方面领先优势,入选“边缘计算领导力企业TOP5”。 此前,在行业标准方面,阿里云边缘计算就已联合中国电子技术标准化研究院发布了《边缘云计算技术及标准...

流式计算

从spark 说起,谈谈“流式”计算的理解 spark是一个大数据分布式的计算框架,有一些并行计算的基础会更容易理解分布式计算框架的概念。对比并行计算,谈三个概念: 并行计算 Map Reduce 算子 RDD数据结构 并行计算 spark的任务分为1个driver、多个executo...

上云,让业务尽情拥抱互联网:阿里云在企业专有云与混合云最佳实践

摘要:本文的整理自2017云栖大会-南京峰会上阿里云企业业务事业部云计算专家赵圣强的分享讲义,讲义中主要分享了中大型企业对云计算诸多需求的深刻理解以及基于阿里云构建企业云的全方位解决方案,并根据实际案例分享了企业基于阿里云带来价值分析的相关内容。 在2017云栖大会-南京峰会上,阿里云存储服务高...

Hadoop高级培训课程大纲-开发者版

一、课程概述 本次培训课程主要面向大数据系统管理人员和开发设计人员,基于开源社区大数据应用最活跃的Hadoop和HBase技术框架,围绕分布式文件存储(HDFS)、分布式并行计算(Map/Recue)和非关系型数据库(NoSql)三个大数据核心应用展开,旨在帮助培训对象建立起完整的大数据理论基础框...
< 1 2 3 4 ... 6146 >
共有6146页 跳转至: GO
产品推荐
云服务器 云原生分布式数据库PolarDB-X 大数据计算服务ODPS 商标 SSL证书 对象存储 短信服务 云桌面
这些文档可能帮助您
PolarDB-X 2.0定价 重置实例登录密码 ECS入门概述 安装并配置客户端 什么是MaxCompute 建站零基础入门

新品推荐

你可能感兴趣

热门推荐

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折