
白话Elasticsearch51-深入聚合数据分析之text field聚合以及fielddata原理
概述继续跟中华石杉老师学习ES,第51篇课程地址: https://www.roncoo.com/view/55官网fielddata: 戳这里示例对于分词的field执行aggregation,报错先构造下模拟索引及数据PUT /artisan_index { "mappings": { "art...

白话Elasticsearch50-深入聚合数据分析之基于doc values正排索引的聚合内部原理
概述继续跟中华石杉老师学习ES,第50篇课程地址: https://www.roncoo.com/view/55思考聚合分析的内部原理是什么?当我们使用比如aggs,term,avg 、max等执行一个聚合操作的时候,内部原理是怎样的呢?用了什么样的数据结构去执行聚合?是不是用的倒排索...

数据分析必学技能:混淆矩阵原理详解,Python调用实战
前言混淆矩阵用来评估分类的准确性。0、混淆矩阵的定义混淆矩阵(Confusion Matrix)是在机器学习中,用于对分类模型的性能进行评估的一种方法。混淆矩阵展示了模型在分类任务中的预测结果与实际标签之间的对应关系。混淆矩阵通常是一个二维矩阵,其中每一行代表着实际标签的类别,每一列代表着预测结果的...

PySpark数据分析基础:PySpark原理详解
前言文章内容紧跟上篇文章:一文速学-PySpark数据分析基础:Spark本地环境部署搭建上文已经把Pyspark的环境已经部署的十分完整了,可以顺利使用spark上任意功能,但是pyspark的原理还未知晓。只有知道原理才能更好的了解程序运行的机制以及后续如果程序出错了我们也能够第一时间反应过来是...

数据分析入门系列教程-EM原理
EM 算法又叫做最大期望算法,英文名称为 Expectation Maximization,也是一种聚类算法。是一种迭代算法,通过寻找最大似然估计值,来确定聚类。什么是最大似然呢,假设我们有 A 和 B 两个参数,虽然我们不知道他们的具体值,但是如果给定了 A,就可以得出 Bÿ...

数据分析入门系列教程-K-Means原理
今天我们来学习 K-Means 算法,这是一种非监督学习。所谓的监督学习和非监督学习的区别就是样本中是否存在标签,对于有标签的样本做分析就是监督学习,而对没有标签的样本做分析就属于非监督学习。K-Means 解决的是聚类的问题,就是把样本根据某些特征,按照某些中心点,聚类在一起,从而达到分类的效果。...

数据分析入门系列教程-SVM原理
SVM原理我们先通过一个分类的例子来看一下 SVM 的定义在一个二维平面上,有实心和空心两组圆点,如果我们想用一条线分开它们,那么其实可以画出无数条这种区分线。而 SVM 就是试图把线放在最佳位置,好让在线的两边到两组圆点边界点的距离尽可能大。体现在图上就是:线 A 正好紧挨实心点的最边界点,线 C...

数据分析入门系列教程-贝叶斯原理
贝叶斯原理在学习朴素贝叶斯原理之前,我们先来了解下什么是贝叶斯原理。其实就像是上面我们提到的生活中的例子一样,贝叶斯原理是建立在主观判断的基础上的。在我们不了解所有的客观事实的情况下,可以先预估计一个值,然后根据实际情况不断的修正这个值。贝叶斯决策原理假如我们现在有一个数据集,它的分类如下:我们现在...

数据分析入门系列教程-决策树原理
决策树原理决策树是通过一系列规则对数据进行分类的过程。它提供一种在什么条件下会得到什么值的类似规则的方法。决策树分为分类树和回归树两种,分类树对离散变量做决策树,回归树对连续变量做决策树。也就是说,决策树既可以用来解决分类问题,也可以解决回归问题。决策树其实是一棵倒树,它的根在最上面,叶子在下面。决...

数据分析入门系列教程-KNN原理
从今天开始,我们就进入正式的算法相关的学习了。在学习算法部分时,我希望你已经完全消化了前面所学习的内容,并能够熟练的掌握相关的知识了。今天,我们来学习 KNN 算法。为什么要从 KNN 算法开始学习呢,因为这个算法是所有机器学习领域的算法中,是最简单,最易理解,最易实现的算法。我们从最...
更新时间 2023-05-27 15:25:30
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。