文章 2023-12-21 来自:开发者社区

数据分析入门系列教程-EM实战-划分LOL英雄

今天,我们就通过LOL英雄分类的实战,来进一步体会下 EM 聚类的强大之处。数据获取页面分析前面章节,我们实验所用的数据都是直接获取到的,今天我们通过前面学习的爬虫知识,来手动收集我们需要的英雄数据。我们的目标网站是:http://cha.17173.com/lol/首先我们可以看到一个英雄列表页面然后点击每个英雄,又可以跳转至英雄详情页面,就可以看到英雄的初始属性信息了所以我们的爬取流程为:1....

数据分析入门系列教程-EM实战-划分LOL英雄
文章 2023-12-21 来自:开发者社区

数据分析入门系列教程-K-Means实战

上一节我们讲解了 K-Means 算法的原理,并且手动实现了一个 K-Means 算法函数,今天我们一起来完成相关的实战内容。在 Sklearn 中使用 K-MeansSklearn 同样提供了非常完善的 K-Means 算法实现from sklearn.cluster import KMeans kmeans = KMeans()再来看下可以传递给该类的主要参数都有哪些参数解释n_cluste....

数据分析入门系列教程-K-Means实战
文章 2023-12-21 来自:开发者社区

数据分析入门系列教程-SVM实战

上一节我们了解了 SVM 的原理,今天就来带你进行 SVM 的实战。SVM 是有监督的学习模型,就是说我们需要先对数据打上标签,之后通过求解最大分类间隔来求解二分类问题,而对于多分类问题,可以组合多个 SVM 分类器来处理。sklearn 中的 SVM其实在工具 sklearn 中,已经封装了多种 SVM 模型,这里我们重点介绍下 SVC,该模型既可以训练线性可分的数据,也可以训练线性不可分数据....

数据分析入门系列教程-SVM实战
文章 2023-12-21 来自:开发者社区

数据分析入门系列教程-贝叶斯实战

上一节我们学习了朴素贝叶斯的原理,并且手动推导了计算方法,今天我们通过两个真实案例,来看看如何在工作中应用朴素贝叶斯。朴素贝叶斯分类最适合的场景就是文本分类了,无论是情感分析还是文档分类及垃圾邮件识别,都是朴素贝叶斯最为擅长的地方,其也成为了自然语言处理 NLP 方向的重要工具。文本到向量既然说到了 NLP,那么就不得不提及从文本到向量的转换。我们都知道,计算机是比较擅长处理数字类型的数据的,而....

数据分析入门系列教程-贝叶斯实战
文章 2023-12-21 来自:开发者社区

数据分析入门系列教程-决策树实战

在学习了上一节决策树的原理之后,你有没有想动手实践下的冲动呢,今天我们就来用决策树进行项目实战。决策树的应用场景是非常广泛的,在各行各业都有应用,并且有非常良好的表现。金融行业的风险贷款评估,医疗行业的疾病诊断,电商行业的销售预测等等。sklearn 中的决策树首先我们先来了解下如何在 sklearn 中使用决策树模型。在 sklearn 中,可以使用如下方式来构建决策树分类器from skle....

数据分析入门系列教程-决策树实战
文章 2023-12-21 来自:开发者社区

数据分析入门系列教程-KNN实战

上一节我们完成了 KNN 算法理论的学习,同时还手动写了一个简易版的 KNN 分类器。今天我们来进行 KNN 的实战,看看如何通过 KNN 算法来解决生活中的问题。在实战之前,我们先来介绍一个概念-超参数。还记得我们上一节讲到的选择 K 值吗,这里的 K 就是超参。所谓超参数,就是在机器学习算法模型执行之前需要指定的参数。(调参调的就是超参数) 如KNN 算法中的 K。与之相对的概念是模型参数,....

数据分析入门系列教程-KNN实战
文章 2022-05-20 来自:开发者社区

数据分析入门系列教程-K-Means实战

在Sklearn中使用K-MeansSklearn 同样提供了非常完善的 K-Means 算法实现from sklearn.cluster import KMeans kmeans = KMeans()再来看下可以传递给该类的主要参数都有哪些参数解释n_clusters即 K 值,默认为8max_iter最大迭代次数,如果聚类很难收敛的话,可以通过设置该参数来停止算法n_init初始化中心点的运....

数据分析入门系列教程-K-Means实战
文章 2022-05-20 来自:开发者社区

数据分析入门系列教程-SVM实战

sklearn 中的SVM其实在工具 sklearn 中,已经封装了多种 SVM 模型,这里我们重点介绍下 SVC,该模型既可以训练线性可分的数据,也可以训练线性不可分数据。from sklearn.svm import SVC相关参数参数名含义C惩罚系数,默认为1.0。当 C 越大时,分类器的准确性越高,但是泛化能力越低。反之,泛化能力强,但是准确性会降低。kernel核函数类型,默认为 rb....

数据分析入门系列教程-SVM实战
文章 2022-05-20 来自:开发者社区

数据分析入门系列教程-贝叶斯实战

文本到向量既然说到了 NLP,那么就不得不提及从文本到向量的转换。我们都知道,计算机是比较擅长处理数字类型的数据的,而对于字符类型数据往往都需要转换成数字类型,再进行相关运算。在自然语言处理领域同样如此,拿到文本后,我们需要先把文本转化成向量,然后再做处理。为现在较为流行的文本转向量的方式有两种,词袋和词频逆文档。在应用这两种方式的时候,都是需要有一个词典库的。这个就相当于,如果你想分析金融领域....

数据分析入门系列教程-贝叶斯实战
文章 2022-05-20 来自:开发者社区

数据分析入门系列教程-决策树实战

sklearn 中的决策树首先我们先来了解下如何在 sklearn 中使用决策树模型。在 sklearn 中,可以使用如下方式来构建决策树分类器from sklearn.tree import DecisionTreeClassifier clf = DecisionTreeClassifier(criterion='entropy')其中的 criterion 参数,就是决策树算法,可以选择 ....

数据分析入门系列教程-决策树实战

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

友盟+

友盟+,国内领先的第三方全域数据智能服务商。以“数据智能,驱动业务增长”为使命,基于卓越的技术与算法能力,结合实时更新的全域数据资源,覆盖191个行业分类、输出300+应用或行业的分析指标,通过AI赋能的一站式互联网数据产品与服务体系,帮助企业实现深度用户洞察、实时业务决策和持续业务增长。 截至2019年6月已累计为180万移动应用和815万家网站提供近九年的专业数据服务典型客户包括:中国移动、CCTV、人民日报客户端、今日头条、飞常准、喜马拉雅、唱吧、美拍、斗鱼、智慧树等。

+关注