文章 2019-08-04 来自:开发者社区

【Python数据科学手册】专题:支持向量机

支持向量机(support vector machine,SVM)是非常强大、灵活的有监督学习算法,既可用于分类,也可用于回归。在本节中,我们将介绍支持向量机的原理,并用它解决分类问题。首先还是导入需要用的程序库: %matplotlib inline import numpy as np import matplotlib.pyplot as plt from scipy import sta....

文章 2019-08-04 来自:开发者社区

【Python数据科学手册】专题:决策树与随机森林

本文将介绍一种强大的算法——无参数算法随机森林。随机森林是一种集成方法,通过集成多个比较简单的评估器形成累积效果。这种集成方法的学习效果经常出人意料,往往能超过各个组成部分的总和;也就是说,若干评估器的多数投票(majority vote)的最终效果往往优于单个评估器投票的效果!后面将通过示例来演示,首先还是导入标准的程序库: %matplotlib inline import numpy as....

高校精品课-华东师范大学 - Python数据科学基础与实践

101 课时 |
796 人已学 |
免费

Python常用数据科学库

53 课时 |
1581 人已学 |
免费

Python数据科学手册

8 课时 |
433 人已学 |
免费
开发者课程背景图
文章 2019-08-04 来自:开发者社区

【Python数据科学手册】专题:特征工程

本节将介绍特征工程的一些常见示例:表示分类数据的特征、表示文本的特征和表示图像的特征。另外,还会介绍提高模型复杂度的衍生特征和处理缺失数据的填充方法。这个过程通常被称为向量化,因为它把任意格式的数据转换成具有良好特性的向量形式。 1、分类数据 一种常见的非数值数据类型是分类数据。例如,浏览房屋数据的时候,除了看到“房价”(price)和“面积”(rooms)之类的数值特征,还会有“地点”(nei....

文章 2019-08-04 来自:开发者社区

【Python数据科学手册】专题:线性回归

线性回归模型是解决回归任务的好起点。 你可能对线性回归模型最简单的形式(即对数据拟合一条直线)已经很熟悉了,不过经过扩展,这些模型可以对更复杂的数据行为进行建模。 首先导入常用的程序库: %matplotlib inline import matplotlib.pyplot as plt import seaborn as sns; sns.set() import numpy as np 1、....

文章 2019-08-04 来自:开发者社区

【Python数据科学手册】专题:朴素贝叶斯分类

朴素贝叶斯模型是一组非常简单快速的分类算法,通常适用于维度非常高的数据集。因为运行速度快,而且可调参数少,因此非常适合为分类问题提供快速粗糙的基本方案。 1、贝叶斯分类 朴素贝叶斯分类器建立在贝叶斯分类方法的基础上,其数学基础是贝叶斯定理(Bayes’s theorem)——一个描述统计量条件概率关系的公式。在贝叶斯分类中,我们希望确定一个具有某些特征的样本属于某类标签的概率,通常记为P(L|特....

文章 2017-07-03 来自:开发者社区

Python 数据科学手册 5.8 决策树和随机森林

5.8 决策树和随机森林 原文:In-Depth: Decision Trees and Random Forests 译者:飞龙 协议:CC BY-NC-SA 4.0 译文没有得到原作者授权,不保证与原文的意思严格一致。 之前,我们深入研究了简单的生成分类器(见朴素贝叶斯分类)和强大的辨别分类器(参见支持向量机)。 这里我们来看看另一个强大的算法的动机...

文章 2017-07-02 来自:开发者社区

Python 数据科学手册 5.7 支持向量机

5.7 支持向量机 支持向量机(SVM)是一种特别强大且灵活的监督算法,用于分类和回归。 在本节中,我们将探索支持向量机背后的直觉,及其在分类问题中的应用。 我们以标准导入开始: %matplotlib inline import numpy as np import matplotlib.pyplot as plt from scipy import stats # use sea...

文章 2017-07-02 来自:开发者社区

Python 数据科学手册 5.6 线性回归

5.6 线性回归 原文:In Depth: Linear Regression 译者:飞龙 协议:CC BY-NC-SA 4.0 译文没有得到原作者授权,不保证与原文的意思严格一致。 就像朴素贝叶斯(之前在朴素贝叶斯分类中讨论)是分类任务的一个很好的起点,线性回归模型是回归任务的一个很好的起点。 这些模型受欢迎,因为它们可以快速拟合,并且非常可解释。 你...

文章 2017-06-30 来自:开发者社区

Python 数据科学手册 5.1 什么是机器学习

5.1 什么是机器学习 原文:What Is Machine Learning? 译者:飞龙 协议:CC BY-NC-SA 4.0 译文没有得到原作者授权,不保证与原文的意思严格一致。 在我们查看机器学习方法的各种细节之前,先了解什么是机器学习,什么不是。机器学习通常被归类为人工智能的一个子领域,但是我发现分类往往会首先产生误导。机器学习的研究肯定来自于...

文章 2017-06-29 来自:开发者社区

Python 数据科学手册 5.5 朴素贝叶斯分类

5.5 朴素贝叶斯分类 原文:In Depth: Naive Bayes Classification 译者:飞龙 协议:CC BY-NC-SA 4.0 译文没有得到原作者授权,不保证与原文的意思严格一致。 前四节对机器学习概念进行了总体概述。 在本节和随后的一节中,我们将仔细研究几种具体的监督和无监督学习算法,从这里以朴素贝叶斯分类开始。 朴素贝叶斯...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。