文章 2024-06-09 来自:开发者社区

【python kaggle机器学习】泰坦尼克号 - 灾难中的机器学习详解

作者介绍:10年大厂数据\经营分析经验,现任大厂数据部门负责人。 会一些的技术:数据分析、算法、SQL、大数据相关、python 欢迎加入社区:码上找工作 作者专栏每日更新: LeetCode解锁1000题: 打怪升级之旅 python数据分析可视化:企业实战案例 备注说明:方便大家阅读 公众号 数据分析螺丝钉 回复关键词 p...

【python kaggle机器学习】泰坦尼克号 - 灾难中的机器学习详解
文章 2023-12-20 来自:开发者社区

【Python机器学习】决策树、K近邻、神经网络等模型对Kaggle房价预测实战(附源码和数据集)

需要源码和数据集请点赞关注收藏后评论区留言私信~~~超参数调优超参数调优需要依靠试验的方法,以及人的经验。对算法本身的理解越深入,对实现算法的过程了解越详细,积累了越多的调优经验,就越能够快速准确地找到最合适的超参数试验的方法,就是设置了一系列超参数之后,用训练集来训练并用验证集来检验,多次重复以上过程,取效果最好的超参数。训练数据的划分可以采用保持法,也可以采用K-折交叉验证法。超参数调优的试....

【Python机器学习】决策树、K近邻、神经网络等模型对Kaggle房价预测实战(附源码和数据集)
文章 2023-05-09 来自:开发者社区

机器学习天降福音!数据科学家、Kaggle大师发布「ML避坑宝典」

【新智元导读】软件架构师、数据科学家、Kaggle大师Agnis Liukis近日撰写了一篇文章,讲述了在机器学习中,初学者最常见的一些错误及解决方案。数据科学和机器学习正变得越来越流行。进入这个领域的人数,每天都在增长。这意味着,很多数据科学家在构建第一个机器学习模型时,并没有丰富的经验,所以很容易发生错误。以下就是机器学习解决方案中一些最常见的初学者错误。在需要的地方没有使用数据归一化对初学....

机器学习天降福音!数据科学家、Kaggle大师发布「ML避坑宝典」
文章 2023-02-09 来自:开发者社区

机器学习实战 | 逻辑回归应用之“Kaggle房价预测”

本文转自丹妍,https://blog.csdn.net/z_mawkish/article/details/106335627Competition Description1. 问题描述:基于kaggle网站所提供的爱荷华州埃姆斯的住宅数据信息,预测每间房屋的销售价格,数据的标签SalePrice是连续性数据,因此可以判定这是一个回归问题。最终目标:预测每一个房屋的销售价格。对于测试集中的每个....

机器学习实战 | 逻辑回归应用之“Kaggle房价预测”
文章 2022-12-13 来自:开发者社区

​Kaggle M5 Forecasting:传统预测方法与机器学习预测方法对比(三)

机器学习使用机器学习方法,首先需要特征数据以及指标数据。在本文中,基于时间序列数据构造特征数据如下:特征数据1:滞后数据。选择 7 天前的 demand 数据作为特征数据。特征数据2:移动平均数据。选择 7 天前至 14 天之前的 demand 移动平均值数据作为特征数据。特征数据3:月销售均值特征数据4:每月销售最大值特征数据5:每月销售最小值特征数据6:每月销售最大值与最小值的差值特征数据7....

​Kaggle M5 Forecasting:传统预测方法与机器学习预测方法对比(三)
文章 2022-12-13 来自:开发者社区

​Kaggle M5 Forecasting:传统预测方法与机器学习预测方法对比(二)

双指数平滑方法单指数平滑方法只使用了一个平滑系数 ,而双指数平滑方法则引入了第二个平滑系数 ,以反映数据的趋势。使用双指数平滑方法,我们需要定义 seasonal_periods。具体代码如下: t0 = time.time() model_name='Double Exponential Smoothing' #train doubleExpSmooth_model = Exponential....

​Kaggle M5 Forecasting:传统预测方法与机器学习预测方法对比(二)
文章 2022-12-13 来自:开发者社区

​Kaggle M5 Forecasting:传统预测方法与机器学习预测方法对比(一)

本文使用的数据集来自 kaggle:M5 Forecasting — Accuracy。该数据集包含有 California、Texas、Wisconsin 三个州的产品类别、部门、仓储信息等。基于这些数据,需要预测接下来 28 天的每日销售量。本文代码 github见最后部分涉及到的方法有:单指数平滑法双指数平滑法三指数平滑法ARIMASARIMASARIMAXLight Gradient B....

​Kaggle M5 Forecasting:传统预测方法与机器学习预测方法对比(一)
文章 2022-06-13 来自:开发者社区

机器学习系列(4)_数据分析之Kaggle鸢尾花iris(下)

三、决策树和随机森林1、绘制图形%matplotlib inline import matplotlib.pyplot as plt import seaborn as sb sb.pairplot(iris_data.dropna(),hue='class') 绘制小提琴图:plt.figure(figsize=(10,10)) for column_index,column in en...

机器学习系列(4)_数据分析之Kaggle鸢尾花iris(下)
文章 2022-06-13 来自:开发者社区

机器学习系列(4)_数据分析之Kaggle鸢尾花iris(上)

我们要解决的问题如下:已知鸢尾花iris分为三个不同的类型:山鸢尾花Setosa、变色鸢尾花Versicolor、韦尔吉尼娅鸢尾花Virginica,这个分类主要是依据鸢尾花的花萼长度、宽度和花瓣的长度、宽度四个指标(也可能还有其他参考)。我们并不知道具体的分类标准,但是植物学家已经为150朵不同的鸢尾花进行了分类鉴定,我们也可以对每一朵鸢尾花进行准确测量得到花萼花瓣的数据。那么问题来了,你女朋....

机器学习系列(4)_数据分析之Kaggle鸢尾花iris(上)
文章 2022-06-13 来自:开发者社区

机器学习系列(2)_数据分析之Kaggle电影TMDB5000(下)

四、 Universal和Paramount两家影视公司的对比情况如何?# 对比两家电影公司的电影发行情况 # 对电影公司的数据进行整理 moviesdf['prodcompanies']=moviesdf['production_companies'].apply(json.loads) moviesdf['prodcompany']=moviesdf['prodcompanies'].app....

机器学习系列(2)_数据分析之Kaggle电影TMDB5000(下)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注