DC学院学习笔记(二十四):养成数据分析的思维
最后三节课无关代码,所以也没有什么可以实践的。就直接用老师的课堂笔记了。 数据分析流程 问题定义是整个数据分析实施的前提,它甚至关系到了项目的成败,一个优秀的问题定义对于整个项目来说等于成功了一半。所以怎么去制定一个优秀的数据分析问题变成了至关重要的环节。 数据分析思维 确定数据分析的问题 一个优秀的数据分析问题需要满足重要性,可行性,新颖性,挑战性四个性质 重要性:该问题得到解决后,可以...
DC学院学习笔记(十三):探索性数据分析实践
还是用iris数据集举例,一起来完成对它的探索性数据分析吧!(也就是画个图,瞅瞅长的啥样子) import pandas iris = pandas.read_csv('http://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data') iris.columns=['sepal_length','sepal_widt....
DC学院学习笔记(十二):数据分析—探索型数据分析
终于学习到课程的核心部分了——数据分析了! 数据分析三大类型 探索型数据分析 验证型数据分析 预测型数据分析 数据科学的流程: 探索型数据分析的作用 与数据清理相辅相成 支持验证型数据分析、预测型数据分析 探索型数据分析的常用图表 条形图、直方图 饼图(饼图在探索型数据分析中使用较少,原因是肉眼对于角度之间的大小差别没有对高度之间的差别敏感) 折线图、散点图 箱形图 下面仔看一些例子...
DC学院数据分析学习笔记(三):基于HTML的网页爬虫
终于可以用python实践一下html的爬虫了,之前零散的也学过一些,这次希望能通过在DC学院的学习慢慢深入的了解爬虫的理论知识。OK,来看今天的数据分析学习笔记! 希望能有所收获( ̄︶ ̄)↗ from bs4 import BeautifulSoup html_doc = """ <html><head><title>The Dormouse's sto.....
DC学院数据分析学习笔记(二):爬虫需要的HTML
关于html,之前也稍微了解过一些,又碰到了,那么就系统的学习一下 HTML 超文本标记语言(HyperText Markup Language,简称:HTML)是一种用于创建网页的标准标记语言。 什么是 HTML? HTML 是用来描述网页的一种语言。 HTML 指的是超文本标记语言 (Hyper Text Markup Language) HTML 不是一种编程语...
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。