文章 2018-02-21 来自:开发者社区

DC学院学习笔记(二十四):养成数据分析的思维

最后三节课无关代码,所以也没有什么可以实践的。就直接用老师的课堂笔记了。 数据分析流程 问题定义是整个数据分析实施的前提,它甚至关系到了项目的成败,一个优秀的问题定义对于整个项目来说等于成功了一半。所以怎么去制定一个优秀的数据分析问题变成了至关重要的环节。 数据分析思维 确定数据分析的问题 一个优秀的数据分析问题需要满足重要性,可行性,新颖性,挑战性四个性质 重要性:该问题得到解决后,可以...

文章 2018-02-17 来自:开发者社区

DC学院学习笔记(十五):验证型数据分析

一些概念 1.随机变量:是试验结果的函数,是定义在样本空间$\Omega$上的实值函数:$X=X(\omega)$,随机变量一般用大写拉丁字母或小写希腊字母来表示 2.概率分布 关于随机变量,有一个非常值得关心的特性就是概率分布 概率:是一个在0-1之间的实数,度量随机事件发生的可能性,通常用于来量化某些不确定性命题 概率分布:在概率的基础上,一个随机变量所有的可能取值加上它取某一个值的概率,.....

文章 2018-02-14 来自:开发者社区

DC学院学习笔记(十三):探索性数据分析实践

还是用iris数据集举例,一起来完成对它的探索性数据分析吧!(也就是画个图,瞅瞅长的啥样子) import pandas iris = pandas.read_csv('http://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data') iris.columns=['sepal_length','sepal_widt....

文章 2018-02-14 来自:开发者社区

DC学院学习笔记(十二):数据分析—探索型数据分析

终于学习到课程的核心部分了——数据分析了! 数据分析三大类型 探索型数据分析 验证型数据分析 预测型数据分析 数据科学的流程: 探索型数据分析的作用 与数据清理相辅相成 支持验证型数据分析、预测型数据分析 探索型数据分析的常用图表 条形图、直方图 饼图(饼图在探索型数据分析中使用较少,原因是肉眼对于角度之间的大小差别没有对高度之间的差别敏感) 折线图、散点图 箱形图 下面仔看一些例子...

文章 2018-02-08 来自:开发者社区

DC学院数据分析学习笔记(四):爬虫的一些高级技巧

继续爬虫之旅!做完整个爬虫过程之后,成就感爆棚<( ̄︶ ̄)↗[GO!] 三大爬虫技巧 1. 设定 程序休止的时间 n为想要实现的时间间隔 import time time.sleep(n) 2. 设定代理 #使用urllib.request的两个方法进行代理的设置 proxy = urlrequest.ProxyHandler({'https': '47.91.78.201:3128'}.....

文章 2018-02-07 来自:开发者社区

DC学院数据分析学习笔记(三):基于HTML的网页爬虫

终于可以用python实践一下html的爬虫了,之前零散的也学过一些,这次希望能通过在DC学院的学习慢慢深入的了解爬虫的理论知识。OK,来看今天的数据分析学习笔记! 希望能有所收获( ̄︶ ̄)↗  from bs4 import BeautifulSoup html_doc = """ <html><head><title>The Dormouse's sto.....

文章 2018-02-07 来自:开发者社区

DC学院数据分析学习笔记(二):爬虫需要的HTML

关于html,之前也稍微了解过一些,又碰到了,那么就系统的学习一下 HTML 超文本标记语言(HyperText Markup Language,简称:HTML)是一种用于创建网页的标准标记语言。 什么是 HTML? HTML 是用来描述网页的一种语言。 HTML 指的是超文本标记语言 (Hyper Text Markup Language) HTML 不是一种编程语...

文章 2018-02-06 来自:开发者社区

DC学院数据分析学习笔记(一):获取数据

在DC学院上买了个数据分析的课程,OK!说干就干,记录下学习的笔记,希望能有所收获( ̄︶ ̄)↗ 数据获取的方式 开放数据集 网站爬虫 开放数据集 科研数据共享 数据算法竞赛:DC学院,天池,kaggle 政府公司分享 个人分享 这个没什么好说的,科学上网,国外网站多的是! 网站爬虫 建立网站连接 爬取网页/API 分析返回结果 抽取所需信息 爬虫分两大类: 基于网站API的爬取:一...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

友盟+

友盟+,国内领先的第三方全域数据智能服务商。以“数据智能,驱动业务增长”为使命,基于卓越的技术与算法能力,结合实时更新的全域数据资源,覆盖191个行业分类、输出300+应用或行业的分析指标,通过AI赋能的一站式互联网数据产品与服务体系,帮助企业实现深度用户洞察、实时业务决策和持续业务增长。 截至2019年6月已累计为180万移动应用和815万家网站提供近九年的专业数据服务典型客户包括:中国移动、CCTV、人民日报客户端、今日头条、飞常准、喜马拉雅、唱吧、美拍、斗鱼、智慧树等。

+关注