文章 2022-12-04 来自:开发者社区

数据挖掘导论——分类与预测(三)

年龄与PClass以及存活率的关系:f,ax=plt.subplots(1,3,figsize=(20,8)) sns.distplot(data[data['Pclass']==1].Fare,ax=ax[0]) ax[0].set_title('Fares in Pclass 1') sns.distplot(data[data['Pclass']==2].Fare,ax=ax[1]) ax....

数据挖掘导论——分类与预测(三)
文章 2022-12-04 来自:开发者社区

数据挖掘导论——分类与预测(二)

完成填充之后,查看填充的结果f,ax=plt.subplots(1,2,figsize=(20,10)) data[data['Survived']==0].Age.plot.hist(ax=ax[0],bins=20,edgecolor='black',color='red') ax[0].set_title('Survived= 0') x1=list(range(0,85,5)) ax[0....

数据挖掘导论——分类与预测(二)
文章 2022-12-04 来自:开发者社区

数据挖掘导论——分类与预测(一)

实验内容背景介绍泰坦尼克号于1909年3月31日在爱尔兰动工建造,1911年5月31日下水,次年4月2日完工试航。她是当时世界上体积最庞大、内部设施最豪华的客运轮船,有“永不沉没”的美誉。然而讽刺的是,泰坦尼克号首航便遭遇厄运:1912年4月10日她从英国南安普顿出发,途径法国瑟堡和爱尔兰昆士敦,驶向美国纽约。在14日晚23时40分左右,泰坦尼克号与一座冰山相撞,导致船体裂缝进水。次日凌晨2时2....

数据挖掘导论——分类与预测(一)
文章 2022-10-19 来自:开发者社区

数据挖掘二手车价格预测 Task05:模型融合

模型融合是kaggle等比赛中经常使用到的一个利器,它通常可以在各种不同的机器学习任务中使结果获得提升。顾名思义,模型融合就是综合考虑不同模型的情况,并将它们的结果融合到一起。模型融合主要通过几部分来实现:从提交结果文件中融合、stacking和blending。模型融合的类型Stacking相关理论介绍1) 什么是 stacking简单来说 stacking 就是当用初始训练数据学习出若干个基....

数据挖掘二手车价格预测 Task05:模型融合
文章 2022-10-19 来自:开发者社区

数据挖掘-二手车价格预测 Task04:建模调参

数据挖掘-二手车价格预测 Task04:建模调参模型调参部分利用xgb进行五折交叉验证查看模型的参数效果## xgb-Model xgr = xgb.XGBRegressor(n_estimators=120, learning_rate=0.1, gamma=0, subsample=0.8,\ colsample_bytree=0.9, max_depth=7) #,obje...

数据挖掘-二手车价格预测 Task04:建模调参
文章 2022-10-19 来自:开发者社区

数据挖掘-二手车价格预测 Task03:特征工程

特征工程理论:常见的特征工程包括:一、导入数据mport warnings warnings.filterwarnings('ignore') import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import missingno as msno import sc....

数据挖掘-二手车价格预测 Task03:特征工程
文章 2022-10-19 来自:开发者社区

数据挖掘-二手车价格预测 Task02:数据分析

Task02:数据分析1.EDA数据探索性分析读取文件import warnings warnings.filterwarnings('ignore') import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import missingno as msno data....

数据挖掘-二手车价格预测 Task02:数据分析
文章 2022-10-19 来自:开发者社区

数据挖掘-二手车价格预测 Task01:赛题理解

数据挖掘-二手车价格预测系列1.赛题概况赛题以预测二手车的交易价格为任务,数据集来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取15万条作为训练集,5万条作为测试集A,5万条作为测试集B,同时会对name、model、brand和regionCode等信息进行脱敏。2.分析赛题此题为传统的数据挖掘问题,通过数据科学以....

数据挖掘-二手车价格预测 Task01:赛题理解
问答 2022-07-24 来自:开发者社区

数据挖掘中预测型的方法一般有什么?

数据挖掘中预测型的方法一般有什么?

文章 2022-05-27 来自:开发者社区

数据挖掘系列(4)_Excel的数据挖掘插件_预测

使用预测向导可以预测时序中的值。 预测向导使用 Microsoft 时序算法,该算法是一个用于预测连续列(例如产品销售)的回归算法。每个预测模型必须包含一个事例序列,即区分序列中不同点的列。 例如,使用历史数据来预测几个月中的销售情况,则日期列为事例序列。其他 Microsoft 算法创建依靠给定输入列来预测可预测列的模型(如决策树模型)。 但时序模型的预测则仅以算法在创建模型时从原始数据集派生....

数据挖掘系列(4)_Excel的数据挖掘插件_预测

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

瓴羊智能服务

专注于为企业提供数智化转型服务,数据知识挖掘机...方法论、数据技术与产品、最佳行业实践都能聊!

+关注