文章 2022-05-20 来自:开发者社区

数据分析入门系列教程-贝叶斯实战

文本到向量既然说到了 NLP,那么就不得不提及从文本到向量的转换。我们都知道,计算机是比较擅长处理数字类型的数据的,而对于字符类型数据往往都需要转换成数字类型,再进行相关运算。在自然语言处理领域同样如此,拿到文本后,我们需要先把文本转化成向量,然后再做处理。为现在较为流行的文本转向量的方式有两种&#...

数据分析入门系列教程-贝叶斯实战
文章 2022-05-20 来自:开发者社区

数据分析入门系列教程-决策树实战

sklearn 中的决策树首先我们先来了解下如何在 sklearn 中使用决策树模型。在 sklearn 中,可以使用如下方式来构建决策树分类器from sklearn.tree import DecisionTreeClassifier clf = DecisionTreeClassifier(criterion='entropy')其中的 cri...

数据分析入门系列教程-决策树实战
文章 2022-05-20 来自:开发者社区

数据分析入门系列教程-KNN实战

上一节我们完成了 KNN 算法理论的学习,同时还手动写了一个简易版的 KNN 分类器。今天我们来进行 KNN 的实战,看看如何通过 KNN 算法来解决生活中的问题。在实战之前,我们先来介绍一个概念-超参数。还记得我们上一节讲到的选择 K 值吗,这里的 K 就是超参。所谓超参数,就是在机器学习算法模型执行之前需要指定的参数。&#...

数据分析入门系列教程-KNN实战
文章 2022-05-09 来自:开发者社区

淘宝广告数据分析实战!(附代码和100W数据源)(下)

4、分析用户群体对广告点击率有什么关系不同的用户群体之间用户价值与消费习惯具有一定的差异,对于不同用户群体的广告投放的策略也不同。通过分析不同用户群体对广告点击率有什么关系,来制定不同的投放策略。这里的分析通过K-Means算法来对用户进行聚类,并基于RFM模型来对用户价值进行划分。①用K-Means算法对用户进行聚类这里选取用户的购物层次、广告点击率、...

淘宝广告数据分析实战!(附代码和100W数据源)(下)
文章 2022-05-09 来自:开发者社区

淘宝广告数据分析实战!(附代码和100W数据源)(中)

2、分析哪些类别的广告点击率更高,哪些类别的点击率低由于广告的类别数量众多,大部分类别的广告只有1-2次的展示,数据样本太小,因此选取展示数量最多的7个类别进行分析。① 找出展示数、点击数、点击率最高的广告类别可以看出类别6261广告的展示数、点击数、点击率均为最高,而类别4385广告的展示数虽然有10000+...

淘宝广告数据分析实战!(附代码和100W数据源)(中)
文章 2022-05-09 来自:开发者社区

淘宝广告数据分析实战!(附代码和100W数据源)(上)

分析背景及目的这是一份淘宝平台的广告展示/点击数据,本次分析需要从这些数据中发现某些规律或者异常,进而给运营团队提出建议。评价一个广告效果的指标就是广告的点击人数,可以反映一个广告有多少人愿意点击查看广告的内容,只有广告被点击,后续转化为购买行为才会发生。把广告的点击人数指标拆分:广告点击人数=广告展示数...

淘宝广告数据分析实战!(附代码和100W数据源)(上)
文章 2022-05-08 来自:开发者社区

Python数据分析实战 | 经典的同期群分析(附实战数据和代码)

前几天写了一篇关于同期群分析的内容,主要从理论层面,讲清楚这个经典的分析思维是什么、为什么要做以及怎么延展。并且在文末立了个开放式flag,说点赞超过xx,就会更新提供源数据的Python实现篇。原文这里:都说经典,同同同期群分析到底是个啥?话说像这种flag,本意其实是“拖延拖延&#...

Python数据分析实战 | 经典的同期群分析(附实战数据和代码)
文章 2022-05-08 来自:开发者社区

实战案例解读:数据分析,如何更进一步?

本文从一个具体的评价分析场景切入,按步分析,力求还原分析的每个环节。相关案例数据和代码可空降文末获取。最近收到不少留言,除了夸小编脑洞奇清的,问最多的竟然是:“我是偏运营/业务分析的,复杂的分析算法我不会,还有什么方法能够对评价类数据做更深入分析吗?”刚开始我会昧着良心回复“词云啊!”...

实战案例解读:数据分析,如何更进一步?
文章 2022-05-08 来自:开发者社区

数据分析必知必会 | TGI指数分析实战

这是Python数据分析实战的第一个案例,详细解读TGI指数,并用Python代码实现基础的TGI偏好分析。经常有一些专业的数据分析报告,会提到TGI指数,例如“基于某某TGI指数,我们发现某类用户更偏好XX”。对于不熟悉TGI定义的同学,看到类似的话一定是云山雾罩。这次,我们就来聊一聊什么是TGI...

数据分析必知必会 | TGI指数分析实战
文章 2022-05-08 来自:开发者社区

Python数据分析实战基础 | 清洗常用4板斧

这是Python数据分析实战基础的第三篇内容,主要对前两篇进行补充,把实际数据清洗场景下常用但零散的方法,按增、删、查、分四板斧的逻辑进行归类,以减少记忆成本,提升学习和使用效率。首先,导入案例数据集。因为案例数据存放在同一个Excel表的不同Sheet下,我们需要指定sheetname分别读取&#...

Python数据分析实战基础 | 清洗常用4板斧

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

友盟+

友盟+,国内领先的第三方全域数据智能服务商。以“数据智能,驱动业务增长”为使命,基于卓越的技术与算法能力,结合实时更新的全域数据资源,覆盖191个行业分类、输出300+应用或行业的分析指标,通过AI赋能的一站式互联网数据产品与服务体系,帮助企业实现深度用户洞察、实时业务决策和持续业务增长。 截至2019年6月已累计为180万移动应用和815万家网站提供近九年的专业数据服务典型客户包括:中国移动、CCTV、人民日报客户端、今日头条、飞常准、喜马拉雅、唱吧、美拍、斗鱼、智慧树等。

+关注