文章 2023-05-08 来自:开发者社区

数据分析必学技能:混淆矩阵原理详解,Python调用实战

前言混淆矩阵用来评估分类的准确性。0、混淆矩阵的定义混淆矩阵(Confusion Matrix)是在机器学习中,用于对分类模型的性能进行评估的一种方法。混淆矩阵展示了模型在分类任务中的预测结果与实际标签之间的对应关系。混淆矩阵通常是一个二维矩阵,其中每一行代表着实际标签的类别,每一列代表着预测结果的类别。在二分类问题中,混淆矩阵包括四个元素,它们分别是:真正例(True Positive, TP....

数据分析必学技能:混淆矩阵原理详解,Python调用实战
文章 2023-04-28 来自:开发者社区

ChatGPT 数据仓库实战:Kaggle 酒店入住数据分析与维度建模

以下内容产生背景为:体验 ChatGPT 在大数据领域有哪些场景可以提高效率,主要使用 Kaggle 酒店入住数据进行维度建模和数据分析方面的模拟测试。虽然部分输出是错误的(可以在留言区讨论哈),如果把这个做成标准的工作流,形成一个产品,那会提高很多人的效率哈(很多人可能也会失业)。感受到了很大的危机以下为人机交互生成:Human:我希望你是一个大数据专家,熟悉使用 Hive SQL,pytho....

文章 2022-12-10 来自:开发者社区

COVID-19数据分析实战:用Python绘制动态排名视频

前言第一篇、第二篇、第三篇我们对数据进行了重新布局,布局后的数据结构方便我们进行柱状图可视化以及弹道分析。今天我们来学习使用该数据集执着更酷炫的动态排名视频。先看效果:一如既往,直奔代码。准备数据源数据源就是我们一直分析的COVID19 data 数据,可以去kaggle 下载。导入我们所需的库,相比于之前的文章,我们本次分析会用到animation模块,重点是里面会提供FuncAnimatio....

COVID-19数据分析实战:用Python绘制动态排名视频
文章 2022-12-10 来自:开发者社区

COVID-19数据分析实战:统计分析及可视化

前言第一篇文章和第二篇文章我们对line list 数据集进行清洗,以及对文本内容进行词云分析。本文中我们将要对主要的数据集covid_19_data.csv进行清洗和分析。这个数据集包含了所有受影响的国家的确诊,死亡,治愈人数的统计信息。有一些国家,比如中国,美国,意大利等受疫情影响比较大的国家还有各个省/州的详细信息。一如既往,问题优先。今天我们简单回答两个问题:截止到最近的一天,各个国家的....

COVID-19数据分析实战:统计分析及可视化
文章 2022-12-10 来自:开发者社区

COVID-19数据分析实战:WordCloud 词云分析

前言上一篇文章(链接)我们对COVID19_line_list数据集进行了清洗以及初步分析。本文中我们将分析如何用词云来展示文本信息的概要。比如我们从词云百度百科截取文字,制作词云。简单来说,词云就是重要单词的可视化,如下图。line list 数据集中有两列很重要的文本信息,symptoms (症状) 以及summary(摘要)。我们可以轻易的提出两个问题:COVID19 的主要症状是什么文本....

COVID-19数据分析实战:WordCloud 词云分析
文章 2022-12-10 来自:开发者社区

COVID-19数据分析实战:数据清洗篇

前言2020 年全球的关键词非COVID19 莫属。虽然现在关于病毒的起源众说纷纭,也引起了不小的外交冲突。作为数据爱好者,还是用数据说话比较靠谱。COVID19数据来源有很多,这里仅仅选kaggle上的数据。这里面的数据会持续更新,所以你拿到的数据可能会和我不同。该链接共包含以下数据集:COVID19_line_list_data.csv(358.85 KB)--> 关于一些每次确诊个例....

COVID-19数据分析实战:数据清洗篇
文章 2022-12-09 来自:开发者社区

Python数据分析库Pandas实战:解析Excel数据

上一节Python操作Excel表格使用的是openpyxl包,这个包虽然能处理简单日常工作中Excel表格数据处理,但面对机器学习庞大的数据,还是显得力不从心,所以openpyxl大多数应用于简单的Excel表格操作,以及机器学习分析后表格的样式优化,但针对于数据的操作运算,我们还是要借助与pandas。1.安装Pandas包对于直接下载python安装程序的用户来说,pandas包并没有自带....

Python数据分析库Pandas实战:解析Excel数据
文章 2022-12-08 来自:开发者社区

Python数据分析与挖掘实战学习笔记

Chapter2  Python数据分析工具@TOC序言 Python本身的数据分析功能不强,需要安装一些第三方扩展库来增强它的能力。 如果安装了Anaconda发行版,那么它自带了以下库:Numpu、Scipy、Matplotlib、Pandas、Scikit-Learn。 本章主要简单介绍这些库,在后面的章节中,会通过各种案例对这些库的使用进行更深入的说明。废话不多说,开始我的表演....

Python数据分析与挖掘实战学习笔记
文章 2022-11-25 来自:开发者社区

《DataWorks高效数据分析最佳实践-2020飞天大数据平台实战应用第一季》电子版地址

《DataWorks高效数据分析最佳实践-2020飞天大数据平台实战应用第一季》DataWorks高效数据分析最佳实践-2020飞天大数据平台实战应用第一季 电子版下载地址: https://developer.aliyun.com/ebook/3006 电子书: </div>

《DataWorks高效数据分析最佳实践-2020飞天大数据平台实战应用第一季》电子版地址
文章 2022-11-17 来自:开发者社区

实训3 Pandas数据分析实战(2)

各位可以看下题目是否相同,然后再参考哈 ,希望对各位有用需要数据可以私聊(^_^)/题目 1. 使用数据差分查看员工业绩波动情况(20分,其中完成代码功能并辅以注释12分,针对结果进行文字分析8分)# 1.使用数据差分查看员工业绩波动情况(20分,其中完成代码功能并辅以注释12分,针对结果进行文字分析8分) import pandas as pd # 读取全部数据,使用默认索引 df = pd.....

实训3 Pandas数据分析实战(2)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

{"cardStyle":"productCardStyle","productCode":"aliyun","productCardInfo":{"productTitle":"快速构建企业级数据分析 Agent","productDescription":"针对传统数据分析中存在的实时性差、数据孤岛分散及处理流程复杂等问题,本方案基于阿里云实时数仓 Hologres 与阿里云百炼,借助 MCP 协议整合多源异构数据,结合模型高效推理能力,实现从数据到业务洞察的端到端加速,全面提升决策效率。","productContentLink":"https://www.aliyun.com/solution/tech-solution/hologres-mcp","isDisplayProductIcon":true,"productButton1":{"productButtonText":"方案详情","productButtonLink":"https://www.aliyun.com/solution/tech-solution/hologres-mcp"},"productButton2":{"productButtonText":"方案部署","productButtonLink":"https://www.aliyun.com/solution/tech-solution-deploy/2922180"},"productButton3":{"productButtonText":"查看更多技术解决方案","productButtonLink":"https://www.aliyun.com/solution/tech-solution/"},"productPromotionInfoBlock":[{"productPromotionGroupingTitle":"解决方案推荐","productPromotionInfoFirstText":"原生 SQL 轻松实现多模态智能检索","productPromotionInfoFirstLink":"https://www.aliyun.com/solution/tech-solution/polardb-ai-search","productPromotionInfoSecondText":"MCP 赋能可视化 OLAP 智能体应用","productPromotionInfoSecondLink":"https://www.aliyun.com/solution/tech-solution/polardb-mysql-mcp"}],"isOfficialLogo":false},"activityCardInfo":{"activityTitle":"","activityDescription":"","cardContentBackgroundMode":"LightMode","activityContentBackgroundImageLink":"","activityCardBottomInfoSelect":"activityPromotionInfoBlock"}}

友盟+

友盟+,国内领先的第三方全域数据智能服务商。以“数据智能,驱动业务增长”为使命,基于卓越的技术与算法能力,结合实时更新的全域数据资源,覆盖191个行业分类、输出300+应用或行业的分析指标,通过AI赋能的一站式互联网数据产品与服务体系,帮助企业实现深度用户洞察、实时业务决策和持续业务增长。 截至2019年6月已累计为180万移动应用和815万家网站提供近九年的专业数据服务典型客户包括:中国移动、CCTV、人民日报客户端、今日头条、飞常准、喜马拉雅、唱吧、美拍、斗鱼、智慧树等。

+关注