文章 2017-07-03 来自:开发者社区

《Hadoop与大数据挖掘》——2.6 TF-IDF算法原理及Hadoop MapReduce实现

本节书摘来自华章计算机《Hadoop与大数据挖掘》一书中的第2章,第2.6节,作者 张良均 樊哲 位文超 刘名军 许国杰 周龙 焦正升,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.6 TF-IDF算法原理及Hadoop MapReduce实现 2.6.1 TF-IDF算法原理 原理:在一份给定的文件里,词频(Term Frequency,TF)指的是某一个给定的词语在该文件中出现....

问答 2017-06-27 来自:开发者社区

Maxcompute的数据上传下载工具Tunnel 和 DataX3.0 ,问题:1:它们在数据传输时,数据是否加密,解密处理? 2:加密的算法是什么?

Maxcompute的数据上传下载工具Tunnel 和 DataX3.0 ,问题:1:它们在数据传输时,数据是否加密,解密处理? 2:加密的算法是什么?

问答 2017-06-26 来自:开发者社区

请问MaxCompute > 快速开始 > 编写 UDF ,如果用java编写UDF,能不能把调用python或者js的jar也放到我这个UDFjar中,实现我的代码调用python文件执行python中的算法。

请问MaxCompute > 快速开始 > 编写 UDF ,如果用java编写UDF,能不能把调用python或者js的jar也放到我这个UDFjar中,实现我的代码调用python文件执行python中的算法。

文章 2017-06-26 来自:开发者社区

《Hadoop与大数据挖掘》一2.5 K-Means算法原理及Hadoop MapReduce实现

本节书摘来华章计算机《Hadoop与大数据挖掘》一书中的第2章 ,第2.5节,张良均 樊 哲 位文超 刘名军 许国杰 周 龙 焦正升 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.5 K-Means算法原理及Hadoop MapReduce实现 2.5.1 K-Means算法原理K-Means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表。它是将数据点到原型的某种距....

文章 2017-06-21 来自:开发者社区

《大数据算法》一2.5 串相等判定算法

本节书摘来华章计算机《大数据算法》一书中的第2章 ,第2.5节,王宏志 编著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.5 串相等判定算法 本节讨论一个通信亚线性算法问题,因为在很多情况下,数据传输时间和数据量大致成正比,因而将通信亚线性算法归到本章讨论。在现实中会有这样的问题,假设A公司总部有一个庞大的数据库,而在分公司B处保存这个数据库的副本,为了数据库的一致性,要定期地....

文章 2017-06-21 来自:开发者社区

《大数据算法》一1.3 大数据算法设计与分析

本节书摘来华章计算机《大数据算法》一书中的第1章 ,第1.3节,王宏志 编著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.3 大数据算法设计与分析 本节对大数据算法设计与分析进行概述,蜻蜓点水地罗列一些技术,具体的技术将在后面的章节详细讲授。 1.3.1 大数据算法设计技术 1.精确算法设计方法精确算法设计技术就是传统算法设计与分析课里讲授的算法,例如贪心法、分治法、动态规划、....

文章 2017-06-21 来自:开发者社区

《大数据算法》一1.2 大数据算法

本节书摘来华章计算机《大数据算法》一书中的第1章 ,第1.2节,王宏志 编著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.2 大数据算法 这一节我们概述大数据算法。 1.2.1 大数据上求解问题的过程 首先我们看一看在大数据上问题求解的过程。我们面对的是一个计算问题,也就是说我们要用计算机来处理一个问题。拿到一个计算问题之后,首先需要判定这个问题是否可以用计算机进行计算,如果学....

文章 2017-05-31 来自:开发者社区

结合AlphaGo算法和大数据的量化基本面分析法探讨

   ◆ ◆ ◆ 序 本文是以郝伯特·西蒙的过程理性理论结合AlphaGo算法步骤探讨量化基本面分析法的分析方式,而不是讨论如何使用量化基本面分析法预测公司股价。   量化基本面分析法(Quantamental)将量化和基本面两种方法结合起来,是近几年随着市场电子化、大数据、自然语言处理技术快速发展产生的新的基本面分析法。现在已经是DT时代,发挥海...

文章 2017-05-02 来自:开发者社区

高考估分太头疼?大数据算法或成预测成绩新方式

导读:刚刚落幕的高考年复一年的吸引着整个社会的关注,大数据文摘首先预祝每一位考生都发挥出了最好的表现。通过这样的终结考试测试一个学生知识和能力已经成为社会普遍接受的方式。美国高校正在尝试一种新的成绩预测方式,125所学校正悄然采取此项措施,试图利用算法和学生平时表现预测学生成绩。 涵盖数以万计学生上百万个成绩单的数据算法 多年以来,每当学生问起诸如“我会在这门课上得到A吗” 这类问题的时候,...

文章 2017-04-03 来自:开发者社区

翻译这事儿,Google认为算法和大数据比语言学靠谱

我相信你已经能知道 Google 是一家极度看重算法、充满工程师文化的公司,但或许你还是会为此而感到惊奇——他们认为翻译是一个数学和统计学方面的问题。最近,位于 Google 总部的 Google Translate 团队正迅速扩张,他们新招了数名德国计算机科学家,但却没有招收一名语言学家。 Google Translate 部门主管 Franz Josef Och 同样也是德国计算机科学家出身....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

阿里巴巴大数据计算

阿里大数据官方技术圈

+关注