文章 2018-02-22 来自:开发者社区

小白学数据:教你用Python实现简单监督学习算法

监督学习作为运用最广泛的机器学习方法,一直以来都是从数据挖掘信息的重要手段。即便是在无监督学习兴起的近日,监督学习也依旧是入门机器学习的钥匙。 这篇监督学习教程适用于刚入门机器学习的小白。 当然了,如果你已经熟练掌握监督学习,也不妨快速浏览这篇教程,检验一下自己的理解程度~ 什么是监督学习? 在监督学习中,我们首先导入包含有训练属性和目标属性的数据集。监督学习算法会从数据集中学习得出训练样本和其....

文章 2018-01-22 来自:开发者社区

还在用PCA降维?快学学大牛最爱的t-SNE算法吧(附Python/R代码)

假设你有一个包含数百个特征(变量)的数据集,却对数据所属的领域几乎没有什么了解。 你需要去识别数据中的隐藏模式,探索和分析数据集。不仅如此,你还必须找出数据中是否存在模式--用以判定数据是有用信号还是噪音? 这是否让你感到不知所措?当我第一次遇到这种情况,我简直全身发麻。想知道如何挖掘一个多维数据集? 这是许多数据科学家经常问的问题之一。 该篇文章中,我将带你通过一个强有力的方式来实现这一点。用....

还在用PCA降维?快学学大牛最爱的t-SNE算法吧(附Python/R代码)
文章 2018-01-18 来自:开发者社区

一文读懂FM算法优势,并用python实现!(附代码)

介绍 我仍然记得第一次遇到点击率预测问题时的情形,在那之前,我一直在学习数据科学,对自己取得的进展很满意,在机器学习黑客马拉松活动中也开始建立了自信,并决定好好迎接不同的挑战。 为了做得更好,我购买了一台内存16GB,i7处理器的机器,但是当我看到数据集的时候却感到非常不安,解压缩之后的数据大概有50GB - 我不知道基于这样的数据集要怎样进行点击率预测。幸运地是,Factorization .....

文章 2018-01-17 来自:开发者社区

Python机器学习:通过scikit-learn实现集成算法

  Python机器学习:通过scikit-learn实现集成算法 有时提高机器学习算法的准确度很困难,本文将通过scikit-learn介绍三种提高算法准确度的集成算法。本文选自《机器学习——Python实践》一书。 在现实生活中,常常采用集体智慧来解决问题。那么在机器学习中,能否将多种机器学习算法组合在一起,使计算出来的结果更好呢?这就是集成算法的思想。集成算法是提高算法准确度的.....

文章 2018-01-11 来自:开发者社区

用 Identity Server 4 (JWKS 端点和 RS256 算法) 来保护 Python web api

[新添加] 本文对应的源码 (多个flow, clients, 调用python api): https://github.com/solenovex/Identity-Server-4-Python-Hug-Api-Jwks 目前正在使用asp.net core 2.0 (主要是web api)做一个项目, 其中一部分功能需要使用js客户端调用python的pandas, 所以需要建立...

文章 2018-01-08 来自:开发者社区

来自小姐姐的入门推荐:7个基本机器学习算法Python实现

本文来自AI新媒体量子位(QbitAI) 有位美女小姐姐,刚刚在GitHub上放出一份福利。 嗯,正经的福利。 她总结了一份基本的机器学习算法,全部以纯Python(版本3.6+)实现。其中包括线性回归等七套算法,具体地址在此: https://github.com/zotroneneis/machine_learning_basics 这7个算法,及代码实现地址: 线性回归,http:...

文章 2017-12-19 来自:开发者社区

八大排序算法python实现

1.冒泡排序 冒泡排序重复地走访过要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。 这个算法的名字由来是因为越大的元素会经由交换慢慢“浮”到数列的顶端,故名。 步骤: 比较相邻的元素。如果第一个比第二个大,就交换他们两个。 对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对。在这一点,最后的元.....

文章 2017-12-12 来自:开发者社区

三种方法实现PCA算法(Python)

  主成分分析,即Principal Component Analysis(PCA),是多元统计中的重要内容,也广泛应用于机器学习和其它领域。它的主要作用是对高维数据进行降维。PCA把原先的n个特征用数目更少的k个特征取代,新特征是旧特征的线性组合,这些线性组合最大化样本方差,尽量使新的k个特征互不相关。关于PCA的更多介绍,请参考:https://en.wikipedia.org/wiki/P....

三种方法实现PCA算法(Python)
文章 2017-12-07 来自:开发者社区

k-means (python)算法

转:http://www.daniweb.com/forums/thread31449.html什么都不说了,直接看代码吧。注解 应该写的比较详细 # liukaiyi   # 注 k-means ,维度类型 - 数值形式 ( 199 或 23.13 ) import ...

k-means (python)算法
文章 2017-11-16 来自:开发者社区

随机森林算法demo python spark

关键参数 最重要的,常常需要调试以提高算法效果的有两个参数:numTrees,maxDepth。 numTrees(决策树的个数):增加决策树的个数会降低预测结果的方差,这样在测试时会有更高的accuracy。训练时间大致与numTrees呈线性增长关系。 maxDepth:是指森林中每一棵决策树最大可能depth,在决策树中提到了这个参数。更深的一棵树意味模型预测更有力,但同时训练时间更长,.....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

智能引擎技术

AI Online Serving,阿里巴巴集团搜推广算法与工程技术的大本营,大数据深度学习时代的创新主场。

+关注