文章 2025-04-10 来自:开发者社区

从数据海洋中“淘金”——数据挖掘的魔法与实践

从数据海洋中“淘金”——数据挖掘的魔法与实践 在这个数据飞速膨胀的时代,每天产生的数据量可以用“天文数字”来形容。如果将数据比作金矿,那么数据挖掘(Data Mining)就是在数据的海洋中挖掘黄金的技术。作为一门结合统计学、机器学习和数据库技术的交叉学科,数据挖掘正在各行各业中发挥着巨大的价值。本文将通过通俗易懂的语言以及实...

从数据海洋中“淘金”——数据挖掘的魔法与实践
文章 2023-05-17 来自:开发者社区

数据挖掘实践(金融风控):金融风控之贷款违约预测挑战赛(下篇)[xgboots/lightgbm/Catboost等模型]--模型融合:stacking、blending

数据挖掘实践(金融风控):金融风控之贷款违约预测挑战赛(下篇)[xgboots/lightgbm/Catboost等模型]--模型融合:stacking、blending相关文章: 数据挖掘实践(金融风控):金融风控之贷款违约预测挑战赛(上篇) 数据挖掘机器学习专栏4.建模与调参项目链接以及码源见文末4.1 模型对比与性能评估4.1.1 逻辑回归优点训练速度较快,分类的时候,计算量仅仅只和特征.....

数据挖掘实践(金融风控):金融风控之贷款违约预测挑战赛(下篇)[xgboots/lightgbm/Catboost等模型]--模型融合:stacking、blending
文章 2023-05-17 来自:开发者社区

数据挖掘实践(金融风控):金融风控之贷款违约预测挑战赛(上篇)[xgboots/lightgbm/Catboost等模型]–模型融合:stacking、blending

数据挖掘实践(金融风控):金融风控之贷款违约预测挑战赛(上篇)[xgboots/lightgbm/Catboost等模型]--模型融合:stacking、blending1.赛题简介赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款,这是一个典型的分类问题。通过这道赛题来引导大家了解金融风控中的一些业务背景,解决实际问题,帮助竞赛新....

数据挖掘实践(金融风控):金融风控之贷款违约预测挑战赛(上篇)[xgboots/lightgbm/Catboost等模型]–模型融合:stacking、blending
问答 2022-07-24 来自:开发者社区

Python 数据挖掘中文本表示里的 word2vec 在实践时应该注意什么呢?

Python 数据挖掘中文本表示里的 word2vec 在实践时应该注意什么呢?

文章 2022-06-13 来自:开发者社区

【weka应用技术与实践】【数据挖掘】举例说明Kmeans算法的运行过程及算法描述

1. Kmeans算法的认识k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法,也是一种无监督的机械学习算法。聚类的认识聚类是一个将数据集中在某些方面相似的数据成员进行分类组织的过程,聚类就是一种发现这种内在结构的技术,聚类技术经常被称为无监督学习。k均值聚类是最著名的划分聚类算法,由于简洁和效率使得他成为所有聚类算法中最广泛使用的。算法采用误....

【weka应用技术与实践】【数据挖掘】举例说明Kmeans算法的运行过程及算法描述
问答 2022-04-15 来自:开发者社区

【教程免费下载】Python数据挖掘:概念、方法与实践

前言 过去十年,数据存储变得更便宜,硬件变得更快,算法上也有了引人注目的进步,这一切为数据科学的快速兴起铺平了道路,并推动其发展成为计算领域最重要的机遇。虽然“数据科学”一词可以包含从数据清理、数据存储到用图形图表可视化数据的所有环节,但该领域最重要的收获是发明了智能、精密的数据分析算法。使用计算机寻找大量数据中埋藏的有趣模式称为数据挖掘,这一领域包含了数据库系统、统计学和机器学习等课题。 ...

文章 2022-02-16 来自:开发者社区

如何在Web数据挖掘中保证用户访问速度的一点实践(SQLite+Quartz)

这个问题一直纠结我很久,以前也想过很多很多想法如下: 1)记录在WebDb中; 2)采用异步线程记录; 3)采用js像cnzz,google那样; 4) 等等记得的就这些了 但是都被我扼杀在脑海中了,第一种方式,本来webdb就已经负载不小了,每次请求都记录太不实际,而且采集的数据结构也会时常变化,通常根据当前的研究方向等来确定。第二种方式,比较好,但是怎么让线程在当前环境下存活也是个问题。...

文章 2022-02-16 来自:开发者社区

《Hadoop与大数据挖掘》一2.5.2 动手实践:K-Means算法实现

本节书摘来华章计算机《Hadoop与大数据挖掘》一书中的第2章 ,第2.5.2节,张良均 樊 哲 位文超 刘名军 许国杰 周 龙 焦正升 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.5.2 动手实践:K-Means算法实现 编写单机版的K-Means算法有利于理解Hadoop实现的K-Means算法,所以这里给出单机版(Java)的编写步骤,供读者参考。实验步骤如下:1)打开....

文章 2022-02-16 来自:开发者社区

《Hadoop与大数据挖掘》一2.4.4 MapReduce组件分析与编程实践

本节书摘来华章计算机《Hadoop与大数据挖掘》一书中的第2章 ,第2.4.4节,张良均 樊 哲 位文超 刘名军 许国杰 周 龙 焦正升 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.4.4 MapReduce组件分析与编程实践 MapReduce整个流程包括以下步骤:输入格式(InputFormat)、Mapper、Combiner、Partitioner、Reducer、输....

文章 2022-02-16 来自:开发者社区

《Hadoop与大数据挖掘》一2.4.3 动手实践:编写Word Count程序并打包运行

本节书摘来华章计算机《Hadoop与大数据挖掘》一书中的第2章 ,第2.4.3节,张良均 樊 哲 位文超 刘名军 许国杰 周 龙 焦正升 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.4.3 动手实践:编写Word Count程序并打包运行 1)打开Eclipse,新建MapReduce工程,如图2-35、图2-36所示。需要配置Hadoop的安装目录,因为这里的Eclipse....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

瓴羊智能服务

专注于为企业提供数智化转型服务,数据知识挖掘机...方法论、数据技术与产品、最佳行业实践都能聊!

+关注