文章 2017-11-13 来自:开发者社区

关于在真实物理机器上用cloudermanger或ambari搭建大数据集群注意事项总结、经验和感悟心得(图文详解)

真实物理机器搭建   不能上述虚拟机里创建用户方式了。要如下操作:   ubuntu和windows一样,可以任意创建或者删除新的用户,windows下比较简单,ubuntu下需要使用命令,不过操作起来不是很繁琐,所以我尽量写的详细一些。           如何创建ubuntu新用户?比如我这里创建bigdata用户(root用户执行)...

关于在真实物理机器上用cloudermanger或ambari搭建大数据集群注意事项总结、经验和感悟心得(图文详解)
文章 2017-10-01 来自:开发者社区

机器理解大数据秘密:聚类算法深度剖析

在理解大数据方面,聚类是一种很常用的基本方法。近日,数据科学家兼程序员 Peter Gleeson 在 freeCodeCamp 发布了一篇深度讲解文章,对一些聚类算法进行了基础介绍,并通过简单而详细的例证对其工作过程进行了解释说明。 看看下面这张图,有各种各样的虫子和蜗牛,你试试将它们分成不同的组别? 不是很难吧,先从找出其中的蜘蛛开始吧! 完成了吗?尽管这里并不一定有所谓的「正确答案」,...

文章 2017-09-15 来自:开发者社区

让机器读懂用户——大数据中的用户画像

让机器读懂用户——大数据中的用户画像 摘要: 用户画像(persona)的概念最早由交互设计之父Alan Cooper提出:“Personas are a concrete representation of target users.” 是指真实用户的虚拟代表,是建立在一系列属性数据之上的目标用户模型。随着互联网的发展,现在我们说的用户画像又包含了新的内涵——通常用户画像是根据用户人口学特征.....

让机器读懂用户——大数据中的用户画像
问答 2017-09-11 来自:开发者社区

有几台机器,想通过cloudera安装大数据集群,不知道每台机器都需要安装那些服务

机器的配置如下图所示。哪位大神能给出一份安装规划清单?下图是要安装的服务:

问答 2017-07-13 来自:开发者社区

大数据计算服务MaxCompute(按量付费) 默认只有华东2 区域, 我们的ECS机器都是 华东1 的,能和 MaxCompute 互通吗?

大数据计算服务MaxCompute(按量付费) 默认只有华东2 区域, 我们的ECS机器都是 华东1 的,能和 MaxCompute 互通吗?

问答 2017-05-19 来自:开发者社区

大数据开发套件中的调度如果起作用了,等待任务变少了。我想知道一下,如何确认调度是否起作用了,任务被调度到哪台机器上执行了。可否告知一下确认方法。谢谢!

大数据开发套件中的调度如果起作用了,等待任务变少了。我想知道一下,如何确认调度是否起作用了,任务被调度到哪台机器上执行了。可否告知一下确认方法。谢谢!

文章 2017-05-02 来自:开发者社区

吴恩达:大数据终将帮助机器拥有自主智慧

网易科技讯 8月30日消息,福布斯网站对加盟百度人工智能实验室的吴恩达进行了专访。文章指出,招纳吴恩达,体现了百度希望通过研发世界一流技术,将自身打造为世界前列的创新型公司的愿景。在以下访谈中,吴恩达透露了他将如何帮助百度实现这一愿景。 以下为文章主要内容: 今年5月百度在硅谷创立了人工智能实验室,并将吴恩达纳入麾下,任命为百度首席科学家。作为斯坦福大学计算机科学教授,吴恩达曾是Google .....

文章 2017-05-01 来自:开发者社区

机器理解大数据的秘密:聚类算法深度详解

看看下面这张图,有各种各样的虫子和蜗牛,你试试将它们分成不同的组别? 不是很难吧,先从找出其中的蜘蛛开始吧! 完成了吗?尽管这里并不一定有所谓的「正确答案」,但一般来说我们可以将这些虫子分成四组:蜘蛛、蜗牛、蝴蝶/飞蛾、蜜蜂/黄蜂。 很简单吧?即使虫子数量再多一倍你也能把它们分清楚,对吗?你只需要一点时间以及对昆虫学的热情就够了——其实就算有成千上万只虫子你也能将它们分开。 但对于一...

机器理解大数据的秘密:聚类算法深度详解
文章 2017-04-03 来自:开发者社区

师北宸:小机器成就大数据

“数据是下一代设计。不考虑数据的产品将被被时代所淘汰。”帮助客户检测与分析移动与web用户数据与行为的Mixpanel公司CEO Suhail Doshi如是说道。Mixpanel是硅谷最成功创业孵化器Y Combinator的2009年夏季毕业生,并于去年获得安德森·霍洛维兹(Andreessen Horowitz)领投的超过1000万美元的A轮投资,在Mixpanel官网最显眼处,写着:“A....

文章 2016-05-05 来自:开发者社区

大数据架构-使用HBase和Solr将存储与索引放在不同的机器上

大数据架构-使用HBase和Solr将存储与索引放在不同的机器上 摘要HBase可以通过协处理器Coprocessor的方式向Solr发出请求Solr对于接收到的数据可以做相关的同步增、删、改索引的操作这样就可以同时使用HBase存储量大和Solr检索性能高的优点了更何况HBase和Solr都可以集群。这对海量数据存储、检索提供了一种方式将存储与索引放在不同的机器上是大数据架构的必须品。 ...

大数据架构-使用HBase和Solr将存储与索引放在不同的机器上

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

阿里巴巴大数据计算

阿里大数据官方技术圈

+关注