文章 2017-07-03 来自:开发者社区

《Scala机器学习》一一1.2 去除分类字段的重复值

本节书摘来自华章计算机《Scala机器学习》一书中的第1章,第1.2节,作者:[美] 亚历克斯·科兹洛夫(Alex Kozlov),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.2 去除分类字段的重复值 请准备好数据集和电脑。为了方便起见,本书已经提供了一些关于点击流(clickstream)数据的样本,它们是经过预处理过的,在https://github.com/alexvk/m....

文章 2017-07-03 来自:开发者社区

《Scala机器学习》一一1.1 Scala入门

本节书摘来自华章计算机《Scala机器学习》一书中的第1章,第1.1节,作者:[美] 亚历克斯·科兹洛夫(Alex Kozlov),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.1 Scala入门 如果已经安装了Scala,可以跳过本节。可以从http://www.scala-lang.org/download/下载最新版本的Scala,本书的Scala版本为2.11.7,操作系统....

文章 2017-07-03 来自:开发者社区

《Scala机器学习》一一2.5 数据驱动系统的基本组件

本节书摘来自华章计算机《Scala机器学习》一书中的第2章,第2.5节,作者:[美] 亚历克斯·科兹洛夫(Alex Kozlov),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.5 数据驱动系统的基本组件 简单地说,一个数据驱动架构包含如下的组件(或者可精简为以下这些组件):数据收集:需要从系统和设备上收集数据。大多数的系统有日志,或者至少可选择将日志写入本地文件系统。一些系统可以....

文章 2017-07-03 来自:开发者社区

《Scala机器学习》一一2.4 不知之不知

本节书摘来自华章计算机《Scala机器学习》一书中的第2章,第2.4节,作者:[美] 亚历克斯·科兹洛夫(Alex Kozlov),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.4 不知之不知 “不知之不知”是出自美国国防部长Donald Rumsfeld,他在美国国防部新闻发布会上回应记者“关于无证据表明伊拉克政府向恐怖组织提供大规模杀伤性武器”的提问时所说的一句话。Nassim....

文章 2017-07-03 来自:开发者社区

《Scala机器学习》一一2.3 探索与利用问题

本节书摘来自华章计算机《Scala机器学习》一书中的第2章,第2.3节,作者:[美] 亚历克斯·科兹洛夫(Alex Kozlov),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.3 探索与利用问题 探索(exploration)与利用(exploitation)的应用很广,从资金分配到研究自动驾驶汽车项目都在使用,但它最初也是源于赌博问题。该问题的经典形式是一个多臂赌博机(老虎机)....

文章 2017-07-03 来自:开发者社区

《Scala机器学习》一一2.2 序贯试验和风险处理

本节书摘来自华章计算机《Scala机器学习》一书中的第2章,第2.2节,作者:[美] 亚历克斯·科兹洛夫(Alex Kozlov),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.2 序贯试验和风险处理 如果风险偏好是为了多赚钱,但不会太在意丢失本金,那会怎么样呢?本节将简单研究为什么人的偏好是不对称的,并且也有科学证据表明:由于进化的原因,这种不对称性在我们的头脑中根深蒂固。不过必....

文章 2017-07-03 来自:开发者社区

《Scala机器学习》一一2.1 影响图

本节书摘来自华章计算机《Scala机器学习》一书中的第2章,第2.1节,作者:[美] 亚历克斯·科兹洛夫(Alex Kozlov),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.1 影响图 决策过程会涉及多个方面,但通常关于不确定条件下做决策的书都会介绍影响图(Influence Diagrams for Team Decision Analysis, Decision Analy....

文章 2017-07-03 来自:开发者社区

《Scala机器学习》一一1.6 相关性的基础

本节书摘来自华章计算机《Scala机器学习》一书中的第1章,第1.6节,作者:[美] 亚历克斯·科兹洛夫(Alex Kozlov),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.6 相关性的基础 读者可能已经注意到,从列联表检测相关性是很难的。检测模式来源于实践,但许多人更擅长于识别可视化的模式。检测行为模式是机器学习的基本目标之一。虽然高级的监督机器学习技术将在第4章和第5章中讨....

文章 2016-12-21 来自:开发者社区

Spark机器学习9· 实时机器学习(scala with sbt)

Spark机器学习 1 在线学习 模型随着接收的新消息,不断更新自己;而不是像离线训练一次次重新训练。 2 Spark Streaming 离散化流(DStream) 输入源:Akka actors、消息队列、Flume、Kafka、…… http://spark.apache.org/docs/latest/streaming-programming-guide.html 类群(line...

文章 2016-12-21 来自:开发者社区

Spark机器学习7·降维模型(scala&python)

Spark机器学习 PCA(主成分分析法,Principal Components Analysis) SVD(奇异值分解法,Singular Value Decomposition) http://vis-www.cs.umass.edu/lfw/lfw-a.tgz 0 运行环境 export SPARK_HOME=/Users/erichan/Garden/spark-1.5.1-bin...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

开发与运维

集结各类场景实战经验,助你开发运维畅行无忧

+关注