数据挖掘导论——分类与预测(三)
年龄与PClass以及存活率的关系:f,ax=plt.subplots(1,3,figsize=(20,8)) sns.distplot(data[data['Pclass']==1].Fare,ax=ax[0]) ax[0].set_title('Fares in Pclass 1') sns.distplot(data[data['Pclass']==2].Fare,ax=ax[1]) ax....
数据挖掘导论——分类与预测(二)
完成填充之后,查看填充的结果f,ax=plt.subplots(1,2,figsize=(20,10)) data[data['Survived']==0].Age.plot.hist(ax=ax[0],bins=20,edgecolor='black',color='red') ax[0].set_title('Survived= 0') x1=list(range(0,85,5)) ax[0....
数据挖掘导论——分类与预测(一)
实验内容背景介绍泰坦尼克号于1909年3月31日在爱尔兰动工建造,1911年5月31日下水,次年4月2日完工试航。她是当时世界上体积最庞大、内部设施最豪华的客运轮船,有“永不沉没”的美誉。然而讽刺的是,泰坦尼克号首航便遭遇厄运:1912年4月10日她从英国南安普顿出发,途径法国瑟堡和爱尔兰昆士敦,驶向美国纽约。在14日晚23时40分左右,泰坦尼克号与一座冰山相撞,导致船体裂缝进水。次日凌晨2时2....
数据挖掘二手车价格预测 Task05:模型融合
模型融合是kaggle等比赛中经常使用到的一个利器,它通常可以在各种不同的机器学习任务中使结果获得提升。顾名思义,模型融合就是综合考虑不同模型的情况,并将它们的结果融合到一起。模型融合主要通过几部分来实现:从提交结果文件中融合、stacking和blending。模型融合的类型Stacking相关理论介绍1) 什么是 stacking简单来说 stacking 就是当用初始训练数据学习出若干个基....
数据挖掘-二手车价格预测 Task04:建模调参
数据挖掘-二手车价格预测 Task04:建模调参模型调参部分利用xgb进行五折交叉验证查看模型的参数效果## xgb-Model xgr = xgb.XGBRegressor(n_estimators=120, learning_rate=0.1, gamma=0, subsample=0.8,\ colsample_bytree=0.9, max_depth=7) #,obje...
数据挖掘-二手车价格预测 Task03:特征工程
特征工程理论:常见的特征工程包括:一、导入数据mport warnings warnings.filterwarnings('ignore') import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import missingno as msno import sc....
数据挖掘-二手车价格预测 Task02:数据分析
Task02:数据分析1.EDA数据探索性分析读取文件import warnings warnings.filterwarnings('ignore') import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import missingno as msno data....
数据挖掘-二手车价格预测 Task01:赛题理解
数据挖掘-二手车价格预测系列1.赛题概况赛题以预测二手车的交易价格为任务,数据集来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取15万条作为训练集,5万条作为测试集A,5万条作为测试集B,同时会对name、model、brand和regionCode等信息进行脱敏。2.分析赛题此题为传统的数据挖掘问题,通过数据科学以....
数据挖掘系列(4)_Excel的数据挖掘插件_预测
使用预测向导可以预测时序中的值。 预测向导使用 Microsoft 时序算法,该算法是一个用于预测连续列(例如产品销售)的回归算法。每个预测模型必须包含一个事例序列,即区分序列中不同点的列。 例如,使用历史数据来预测几个月中的销售情况,则日期列为事例序列。其他 Microsoft 算法创建依靠给定输入列来预测可预测列的模型(如决策树模型)。 但时序模型的预测则仅以算法在创建模型时从原始数据集派生....
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
瓴羊智能服务
专注于为企业提供数智化转型服务,数据知识挖掘机...方法论、数据技术与产品、最佳行业实践都能聊!
+关注