文章 2023-05-22 来自:开发者社区

《阿里云认证的解析与实战-数据仓库ACP认证》——云上数据仓库的架构方案——五、GIS地理数据分析的最佳实践

1. 业务分析 GIS数据分析存在如下问题: • 数据结构复杂多样难以管理。• 数据动态变化要求更高维度计算。• 大数据和大计算场景性能不佳。• 智能化需要多模态数据融合管理。   2. 业务面临挑战 GIS数据具有如下特性: • 多源性:时空数据来源多样化、...

《阿里云认证的解析与实战-数据仓库ACP认证》——云上数据仓库的架构方案——五、GIS地理数据分析的最佳实践
文章 2023-05-08 来自:开发者社区

数据分析必学技能:混淆矩阵原理详解,Python调用实战

前言混淆矩阵用来评估分类的准确性。0、混淆矩阵的定义混淆矩阵(Confusion Matrix)是在机器学习中,用于对分类模型的性能进行评估的一种方法。混淆矩阵展示了模型在分类任务中的预测结果与实际标签之间的对应关系。混淆矩阵通常是一个二维矩阵,其中每一行代表着实际标签的类别,每一列代表着预测结果的类别。在二分类问题中...

数据分析必学技能:混淆矩阵原理详解,Python调用实战
文章 2023-04-28 来自:开发者社区

ChatGPT 数据仓库实战:Kaggle 酒店入住数据分析与维度建模

以下内容产生背景为:体验 ChatGPT 在大数据领域有哪些场景可以提高效率,主要使用 Kaggle 酒店入住数据进行维度建模和数据分析方面的模拟测试。虽然部分输出是错误的(可以在留言区讨论哈),如果把这个做成标准的工作流,形成一个产品,那会提高很多人的效率哈(很多人可能也会失业&#x...

文章 2022-12-10 来自:开发者社区

COVID-19数据分析实战:用Python绘制动态排名视频

前言第一篇、第二篇、第三篇我们对数据进行了重新布局,布局后的数据结构方便我们进行柱状图可视化以及弹道分析。今天我们来学习使用该数据集执着更酷炫的动态排名视频。先看效果:一如既往,直奔代码。准备数据源数据源就是我们一直分析的COVID19 data 数据,可以去kaggle 下载。导入我们所需的库,相比于之前的文章,...

COVID-19数据分析实战:用Python绘制动态排名视频
文章 2022-12-10 来自:开发者社区

COVID-19数据分析实战:统计分析及可视化

前言第一篇文章和第二篇文章我们对line list 数据集进行清洗,以及对文本内容进行词云分析。本文中我们将要对主要的数据集covid_19_data.csv进行清洗和分析。这个数据集包含了所有受影响的国家的确诊,死亡,治愈人数的统计信息。有一些国家,比如中国,美国,意大利等受疫情影响比较大的国家还有各个省/州的...

COVID-19数据分析实战:统计分析及可视化
文章 2022-12-10 来自:开发者社区

COVID-19数据分析实战:WordCloud 词云分析

前言上一篇文章(链接)我们对COVID19_line_list数据集进行了清洗以及初步分析。本文中我们将分析如何用词云来展示文本信息的概要。比如我们从词云百度百科截取文字,制作词云。简单来说,词云就是重要单词的可视化,如下图。line list 数据集中有两列很重要的文本信息,symptoms (症...

COVID-19数据分析实战:WordCloud 词云分析
文章 2022-12-10 来自:开发者社区

COVID-19数据分析实战:数据清洗篇

前言2020 年全球的关键词非COVID19 莫属。虽然现在关于病毒的起源众说纷纭,也引起了不小的外交冲突。作为数据爱好者,还是用数据说话比较靠谱。COVID19数据来源有很多,这里仅仅选kaggle上的数据。这里面的数据会持续更新,所以你拿到的数据可能会和我不同。该链接共包含以下数据集:COVID19_line_list_d...

COVID-19数据分析实战:数据清洗篇
文章 2022-12-09 来自:开发者社区

Python数据分析库Pandas实战:解析Excel数据

上一节Python操作Excel表格使用的是openpyxl包,这个包虽然能处理简单日常工作中Excel表格数据处理,但面对机器学习庞大的数据,还是显得力不从心,所以openpyxl大多数应用于简单的Excel表格操作,以及机器学习分析后表格的样式优化,但针对于数据的操作运算,我们还是要借助与pan...

Python数据分析库Pandas实战:解析Excel数据
文章 2022-12-08 来自:开发者社区

Python数据分析与挖掘实战学习笔记

Chapter2  Python数据分析工具@TOC序言 Python本身的数据分析功能不强,需要安装一些第三方扩展库来增强它的能力。 如果安装了Anaconda发行版,那么它自带了以下库:Numpu、Scipy、Matplotlib、Pandas、Scikit-Learn。 本章主要简单介绍这些库,在后面的章节中,会...

Python数据分析与挖掘实战学习笔记
文章 2022-11-25 来自:开发者社区

《DataWorks高效数据分析最佳实践-2020飞天大数据平台实战应用第一季》电子版地址

《DataWorks高效数据分析最佳实践-2020飞天大数据平台实战应用第一季》DataWorks高效数据分析最佳实践-2020飞天大数据平台实战应用第一季 电子版下载地址: https://developer.aliyun.com/ebook/3006 电子书: </div>

《DataWorks高效数据分析最佳实践-2020飞天大数据平台实战应用第一季》电子版地址

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

友盟+

友盟+,国内领先的第三方全域数据智能服务商。以“数据智能,驱动业务增长”为使命,基于卓越的技术与算法能力,结合实时更新的全域数据资源,覆盖191个行业分类、输出300+应用或行业的分析指标,通过AI赋能的一站式互联网数据产品与服务体系,帮助企业实现深度用户洞察、实时业务决策和持续业务增长。 截至2019年6月已累计为180万移动应用和815万家网站提供近九年的专业数据服务典型客户包括:中国移动、CCTV、人民日报客户端、今日头条、飞常准、喜马拉雅、唱吧、美拍、斗鱼、智慧树等。

+关注