文章 2022-08-12 来自:开发者社区

②数据预处理之数据清理,数据集成,数据规约,数据变化和离散化

数据规约是指在保证原始数据信息不丢失的前提下,减少分析使用的数据量,数据规约中最常使用的方式是维规约。维规约的含义是从将原先高维的数据合理的压缩成低维数据,从而减少数据量,常用的方法为特征的提取, LDA 和 PCA 降维。特征的提取为从海量数据中选择与挖掘目标相关的属性成一个子表,不包含无关的属性,比如关于泰坦尼克号生产数据的数据挖掘中,船客 Name 与幸存率是无关的,就可以不放入子表中。P....

②数据预处理之数据清理,数据集成,数据规约,数据变化和离散化
文章 2022-08-12 来自:开发者社区

①数据预处理之数据清理,数据集成,数据规约,数据变化和离散化

本来这些储备知识,我想在后续的实际算法案例中进行解释,但是考虑到很多的小伙伴在学习的过程中都是逐步推进的,需要一定的时间去理解和应用,所以前期我们需要把所有的东西都准备好,这样就可以保证后续的算法实践游刃有余。数据清理我们一般看到的数据都是较为干净的数据,也就是结构化的数据,但是有时候在日志信息中,需要我们去提取出结构化的数据进行处理,这个时候就需要用到数据清理了。数据清理用到的工具1、Pyth....

①数据预处理之数据清理,数据集成,数据规约,数据变化和离散化
问答 2022-07-26 来自:开发者社区

如何理解数据预处理功能中的数据清理功能和数据集成功能啊?

如何理解数据预处理功能中的数据清理功能和数据集成功能啊?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。