文章 2024-10-27 来自:开发者社区

机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)

1. 基础算法 常见面试篇 1.1 过拟合和欠拟合 常见面试篇 一、过拟合和欠拟合 是什么?二、过拟合 / 高方差(overfiting / high variance)篇2.1 过拟合是什么及检验方法?2.2 导致过拟合的原因是什么?2.3 过拟合的解决方法是什么? 三、欠拟合 / 高偏差(un...

文章 2024-08-06 来自:开发者社区

【机器学习】面试问答:PCA算法介绍?PCA算法过程?PCA为什么要中心化处理?PCA为什么要做正交变化?PCA与线性判别分析LDA降维的区别?

面试问答:PCA算法介绍?PCA算法过程?PCA为什么要中心化处理?PCA为什么要做正交变化? (1)简单介绍一下PCA 主成分分析(Principal componet analysis,PCA) 是一种无监督学习方法,利用正交变换把线性相关变量表示的观测数据转换为几个由线性无关变量...

文章 2024-08-06 来自:开发者社区

【机器学习】面试问答:决策树如何进行剪枝?剪枝的方法有哪些?

决策树如何进行剪枝? 分为预剪枝和后剪枝。 预剪枝的思想是在树中结点进行扩展之前,先计算当前的划分是否带来模型泛化能力的提升,如果不能,则不再继续生长子树。预剪枝对何时停止决策树的生长有几种方法 当树达到一定深度时,停止树的生长当达到当前结点的样本数量小于某个阈值的时候,停止树的生长计算每次分裂时对测试机的准确率...

文章 2024-08-06 来自:开发者社区

【机器学习】SVM面试题:简单介绍一下SVM?支持向量机SVM、逻辑回归LR、决策树DT的直观对比和理论对比,该如何选择?SVM为什么采用间隔最大化?为什么要将求解SVM的原始问题转换为其对偶问题?

介绍一下SVM (1)简单介绍一下SVM 支持向量机(support vector machines,SVM)是一种二分类模型。分为 线性可分支持向量机:训练数据线性可分,通过硬间隔最大化学习一个线性的分类器,又称为硬间隔支持向量机。线性支持向量机:训练数据近似线性可分,通过软间隔最大化学习一个线性...

文章 2024-08-06 来自:开发者社区

【机器学习】面试题:LSTM长短期记忆网络的理解?LSTM是怎么解决梯度消失的问题的?还有哪些其它的解决梯度消失或梯度爆炸的方法?

(1)简单介绍一下LSTM 因为循环神经网络(Recurrent Neural Networks,RNN),本质是一个全连接网络,在处理长期依赖的问题上会出现梯度消失和梯度爆炸。长短时记忆模块(Long Short Term Memory,LSTM)...

文章 2024-08-06 来自:开发者社区

【机器学习】过拟合和欠拟合怎么判断,如何解决?(面试回答)

过拟合和欠拟合怎么判断,如何解决? (1)判断:训练集误差和验证集误差,从而判断算法达到什么效果 训练误差大和验证误差都大,是欠拟合训练误差和验证误差差不多,都较低,是适度拟合训练误差小,验证误差大,是过拟合 (2)...

文章 2024-08-06 来自:开发者社区

【机器学习】简单解释贝叶斯公式和朴素贝叶斯分类?(面试回答)

简单解释贝叶斯公式和朴素贝叶斯分类 贝叶斯公式$$P(B|A) = \frac{P(A|B)P(B)}{P(A)} $$朴素贝叶斯分类算法:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别 算法过程 对每个类别计算概率P(yi​)对每个特征属性计算所有划分的条件概率P(x∣yi​)...

文章 2024-08-06 来自:开发者社区

【机器学习】如何进行中文命名实体识别?(面试回答)

如何进行中文命名实体识别? (1)划分分类 命名实体一般有两种划分:3大类和7小类。 三大类:实体类、时间类、数字类 7小类:人名、地名、组织机构名、时间、日期、货币量、百分数 (2)识别思想 通常是先进行实体识别、然后识别单个实体、最后再识别复合实体 (3)实体标注方法 不同的数据集可能采取不同的实体标注方法,常见的标注方法又IOB、BIOES、Markup 其中IOB标注法...

【机器学习】如何进行中文命名实体识别?(面试回答)
文章 2024-08-06 来自:开发者社区

【机器学习】采用 EM 算法求解的模型有哪些,为什么不用牛顿法或梯度下降法?(面试回答)

(1)概念 EM算法称为期望最大化算法,分为两步,求期望和求极大值。 (2)基本思想 首先根据己经给出的观测数据,估计出模型参数的值;然后再依据上一步估计出的参数值估计缺失数据的值,再根据估计出的缺失数据加上之前己经观测到的数据重新再对参数值进行估计,然后反...

文章 2024-08-06 来自:开发者社区

【机器学习】为什么会产生过拟合,有哪些方法可以预防或克服过拟合?(面试回答)

为什么会产生过拟合,有哪些方法可以预防或克服过拟合? 原因 一些假设条件(如样本独立同分布)可能是不成立的;训练样本过少不能对整个空间进行分布估计 判断依据 一般而言训练误差很低,但是测试误差较高,过拟合的概率较大,如果训练误差和测试误差都很高,一般是欠拟合。 解...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Java面试那些事儿

手把手带您学习Java,开启编程之路。

+关注