文章 2022-10-10 来自:开发者社区

Python 零基础入门数据分析实战之数据集应用

一、数据来源本节选用的是 Python 的第三方库 seaborn 自带的数据集,该小费数据集为餐饮行业收集的数据,其中 total_bill 为消费总金额、tip 为小费金额、sex 为顾客性别、smoker 为顾客是否吸烟、day 为消费的星期、time 为聚餐的时间段、size 为聚餐人数。import numpy as np from pandas import Series,Data.....

Python 零基础入门数据分析实战之数据集应用
文章 2022-09-02 来自:开发者社区

Python爬虫系列实战-采集NBA常规赛数据分析三分命中率

爬取的网站为:stat-nba.com,这里爬取的是NBA2016-2017赛季常规赛至2017年1月7日的数据;改变url_header和url_tail即可爬取特定的其他数据。import sys reload(sys) sys.setdefaultencoding('utf-8') import requests import time import urllib from bs4 imp....

文章 2022-08-02 来自:开发者社区

机器学习如何做到疫情可视化——疫情数据分析与预测实战

一、问题说明1、爬取中国、美国、巴西、印度、俄罗斯、法国、英国、土耳其、阿根廷、哥伦比亚、日本等11个国家以及中国31个省(自治区、直辖市)在2022.0101-2022.06.19的新冠疫情数据。如果对数据爬虫技术不熟悉,可使用data文件中提供的数据,其中中国各省数据为confirmedCount、curedCount、deadCount;world_confirmedCount、world....

文章 2022-06-10 来自:开发者社区

数据分析实战 | A/B测试探寻哪种广告点击率更高?

场景描述某个促销活动每个月都会开展一次,但和公司其他类似的促销活动相比,该促销活动的用户购买率比较低。通过调查用户购买率低的原因,发现问题可能出在促销广告上。于是我们准备了两个不同的广告,来验证哪种广告能够带来更高的用户购买率。A/B测试A/B 测试能够在多个选项中找出那个能够带来最佳结果的选项。在本例中,我们只要同时投放广告...

数据分析实战 | A/B测试探寻哪种广告点击率更高?
文章 2022-06-10 来自:开发者社区

数据分析实战 | Pandas交叉列表探寻用户数下降的原因

场景描述某公司经营的一款 APP 小游戏,游戏的用户数一直维持在一定的水平。然而,从 9 月开始,用户数开始大量减少。根据以往经验尝试做出如下假设。商业推广上存在问题,流失的用户数超过了新增的用户数每月不同主题的游戏活动开始变得很无聊,用户都不爱玩了按用户的性别或者年龄段等属性来划分用户群,可能是其中某个用户群出...

数据分析实战 | Pandas交叉列表探寻用户数下降的原因
文章 2022-06-10 来自:开发者社区

数据分析实战 | 探寻销售额下降的原因

场景描述某公司经营的一款 APP 小游戏,每月销售额稳定上涨,但是在 7 月却突然下降,无论从市场环境或是游戏本身的环境来看,这个游戏的销售额都还有继续增长的空间 ,影响该游戏销售额的主要影响因素可能有两点:游戏活动上新商业宣传力度更改经了解发现游戏活动与上月活动并无较大改变由于预算紧缺,宣传力度有...

数据分析实战 | 探寻销售额下降的原因
文章 2022-05-31 来自:开发者社区

数据分析之AB testing实战(附Python代码)(二)

② 将用户流量对应分成几组,在保证每组用户特征相同的前提下,让用户分别看到不同的方案设计;  注意几个术语,这个在后面的实战代码中有用。在做AB testing的时候,一般分为control组和treatment组,其中control组看到的是老页面(old page),treatment组看到的是...

数据分析之AB testing实战(附Python代码)(二)
文章 2022-05-31 来自:开发者社区

数据分析之AB testing实战(附Python代码)(一)

1、增长黑客1)前言  说到AB testing,就不得不说到增长黑客,这个词大约在2015年就引入到中国了,但是在2018年开始火热起来。那么互联网公司想要增加活跃用户、增加收入,现在的产品运营还是采用增长黑客这样一种运营方式,并不是产品经理一拍脑袋就可以想到,或者老板直接拍板决定就可以做到的。大...

数据分析之AB testing实战(附Python代码)(一)
文章 2022-05-20 来自:开发者社区

数据分析入门系列教程-K-Means实战

在Sklearn中使用K-MeansSklearn 同样提供了非常完善的 K-Means 算法实现from sklearn.cluster import KMeans kmeans = KMeans()再来看下可以传递给该类的主要参数都有哪些参数解释n_clusters即 K 值,默认为8max_iter最大迭代次数,如果聚类很难收敛的话,可以通...

数据分析入门系列教程-K-Means实战
文章 2022-05-20 来自:开发者社区

数据分析入门系列教程-SVM实战

sklearn 中的SVM其实在工具 sklearn 中,已经封装了多种 SVM 模型,这里我们重点介绍下 SVC,该模型既可以训练线性可分的数据,也可以训练线性不可分数据。from sklearn.svm import SVC相关参数参数名含义C惩罚系数,默认为1.0。当 C 越大时,分类器的准确性越高...

数据分析入门系列教程-SVM实战

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

友盟+

友盟+,国内领先的第三方全域数据智能服务商。以“数据智能,驱动业务增长”为使命,基于卓越的技术与算法能力,结合实时更新的全域数据资源,覆盖191个行业分类、输出300+应用或行业的分析指标,通过AI赋能的一站式互联网数据产品与服务体系,帮助企业实现深度用户洞察、实时业务决策和持续业务增长。 截至2019年6月已累计为180万移动应用和815万家网站提供近九年的专业数据服务典型客户包括:中国移动、CCTV、人民日报客户端、今日头条、飞常准、喜马拉雅、唱吧、美拍、斗鱼、智慧树等。

+关注