文章 2022-12-04 来自:开发者社区

数据挖掘导论——综合实验(下)

二、数据预处理1、缺失值处理:通过上面数据重复度的统计,发现有缺失值的特征大多数值重复度都比较高,故使用众数填充的方法补充缺失值。2、数值化非数值特征非数值特征只有“notRepairedDamage”,它有‘-’,‘0.0’,‘1.0’三种值。将值‘-’用‘0.0’来代替,并把特征值转为浮点数类型。3、异常值处理功率特征power的范围在1 ~ 600之间,因此将超出范围的值截断在正常范围内。....

数据挖掘导论——综合实验(下)
文章 2022-12-04 来自:开发者社区

数据挖掘导论——综合实验(上)

实验目的与要求结合问题理解,描述三种适用于本题的模型。掌握数据挖掘的基本流程,包括数据分析与预处理,特征过程,模型训练与测试,实验内容文件中给出了一些可以参考的步骤,大家可以自行选择或自由发挥完成各阶段的工作。最后将预测结果文件上传到比赛网站上进行测试,将结果截图,记录分数和排名。试验环境本次实验采用PC机进行数据分析,采用服务器进行训练模型并进行预测。【PC机配置】CPU:11th Gen I....

数据挖掘导论——综合实验(上)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

瓴羊智能服务

专注于为企业提供数智化转型服务,数据知识挖掘机...方法论、数据技术与产品、最佳行业实践都能聊!

+关注