文章 2025-10-26 来自:开发者社区

当“爆款书”遇上大数据:出版业的老路,正在被算法改写

当“爆款书”遇上大数据:出版业的老路,正在被算法改写 作者:Echo_Wish 还记得十几年前,畅销书是怎么诞生的吗?靠的是“编辑的眼光 + 媒体的宣传 + 一点点运气”。而现在,这一切都被“数据”悄悄重构了。在这个“信息比墨水还浓”的时代,大数据不仅让出版商更懂读者,...

当“爆款书”遇上大数据:出版业的老路,正在被算法改写
文章 2025-09-18 来自:开发者社区

大数据选举预测:算票的不只是选票,还有算法

大数据选举预测:算票的不只是选票,还有算法 今天咱聊一个有意思的话题:选举预测。说白了,就是在结果没揭晓之前,能不能靠数据和算法先一步“剧透”? 以前,预测选举结果主要靠民调:拉一帮人问问,你支持谁?结果拿来推全局。但大家都知道,民调有点像“朋...

大数据选举预测:算票的不只是选票,还有算法
文章 2025-08-25 来自:开发者社区

大数据能不能看透消费者的心?聊聊那些“你以为是偶然,其实是算法的必然”

大数据能不能看透消费者的心?聊聊那些“你以为是偶然,其实是算法的必然” 今天咱们聊一个听上去有点玄、但其实非常“接地气”的话题——如何用大数据分析消费者心理。 你有没有过这种感觉:刚刚在电商平台搜索过一双鞋,结果第二天打开某个短视频,推荐里全是穿搭指南、甚至直接推你那双鞋?或者你刚和朋友聊了“减肥”,...

大数据能不能看透消费者的心?聊聊那些“你以为是偶然,其实是算法的必然”
文章 2025-05-01 来自:开发者社区

大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!

全网(微信公众号/CSDN/抖音/华为/支付宝/微博) :青云交 亲爱的朋友们,热烈欢迎来到 青云交的博客!能与诸位在此相逢,我倍感荣幸。在这飞速更迭的时代,我们都渴望一方心灵净土,而 我的博客 正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识,也期待你毫无保留地分享独特见解,愿我们于此携手成长,共赴新程! 我的CSDN博客--青云交:总流量:15,099,826 引言:  &...

大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
文章 2025-03-23 来自:开发者社区

大数据中的数据预处理:脏数据不清,算法徒劳!

大数据中的数据预处理:脏数据不清,算法徒劳! 在大数据世界里,数据预处理是个让人又爱又恨的环节。爱它,是因为数据预处理做好了,后续的模型跑起来又快又准,仿佛给AI装上了火箭助推器;恨它,是因为数据质量堪忧,脏数据满天飞,预处理过程仿佛在泥潭里行...

大数据中的数据预处理:脏数据不清,算法徒劳!
文章 2024-11-11 来自:开发者社区

大数据查询优化算法

大数据查询优化算法是针对大规模数据集设计的,旨在提高查询效率和性能。这些算法主要集中在几个关键领域:数据分布分析与优化、索引选择与优化、查询处理优化、数据压缩优化、分区和聚类优化、数据预取策略、并行处理优化、成本模型与代价估算等。下面是这几个领域的简要介绍: 1. 数据分布分析与优化 分析数据分布:识别数据类型、分布形状(如正...

文章 2024-11-05 来自:开发者社区

阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析

1. XGBoost简介 XGBoost是一个优化的分布式梯度增强库,旨在实现高效,灵活和便携。它在GBDT框架的基础上实现机器学习算法。XGBoost提供了并行树提升(也称为GBDT,GBM),可以快速准确地解决许多数据科学问题。XGBoost最初是一个研究项目,孵化于Distributed (Deep) Machine Learning Community (DMLC) ,由陈天奇博...

阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析
文章 2024-11-04 来自:开发者社区

大数据中缺失值处理使用算法处理

在大数据分析中,数据预处理是一个非常重要的步骤,其中包括对缺失值的处理。缺失值的存在可能会影响模型训练的准确性和效率。针对缺失值,可以采用多种算法和技术来处理,以下是一些常见的方法: 1. 删除法 行删除:如果某个样本(行)中的关键特征有缺失值,且该样本对于整体数据集不是...

文章 2024-10-14 来自:开发者社区

大数据-106 Spark Graph X 计算学习 案例:1图的基本计算、2连通图算法、3寻找相同的用户

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完) HDFS(已更完) MapReduce(已更完) Hive(已更完) Flume(已更完) Sqoop(已更完) Zookeeper(已更完) HBase(已更完) Redis (已更完) Kafka(已更完) ...

大数据-106 Spark Graph X 计算学习 案例:1图的基本计算、2连通图算法、3寻找相同的用户
文章 2024-08-06 来自:开发者社区

【数据挖掘】金山办公2020校招大数据和机器学习算法笔试题

【数据挖掘】金山办公2020校招大数据和机器学习算法笔试题 1、 执行如下程序代码后,C的值是( C )int a = 0, c = 0;do{ –c;a = a - 1;}while(a > 0);01-1死循环 2、写出中序遍历如下二叉树的结果( C) A、6423517 B、6452173 C、3246157 D、3217456 3、设指针变量p指向双向链表中结点A,...

【数据挖掘】金山办公2020校招大数据和机器学习算法笔试题

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

阿里巴巴大数据计算

阿里大数据官方技术圈

+关注