[帮助文档] 在推荐系统中应用FeatureStore管理特征_人工智能平台 PAI(PAI)

本文以FeatureStore的特征表为例,为您介绍FeatureStore从创建与注册到最终上线的过程,帮助您了解如何从零开始搭建并上线一套完整的推荐系统。

[帮助文档] 使用特征工程提取特征数据

通过推荐算法定制生成的特征工程,对原始数据集(包括用户表、物料表和行为表等)进行处理,并生成新的特征表,以供后续的召回和排序使用。前提条件已开通PAI(Designer),并创建默认工作空间。具体操作,请参见开通PAI并创建默认工作空间。开通PAI并创建默认工作空间已为工作空间绑定MaxComput...

高校精品课-复旦大学-机器学习与深度学习

1 课时 |
105 人已学 |
免费

PAI平台学习路线:机器学习入门到应用

52 课时 |
685 人已学 |
免费

场景实践 - 机器学习PAI实现精细化营销

7 课时 |
138 人已学 |
免费
开发者课程背景图

【机器学习入门与实践】数据挖掘-二手车价格交易预测(含EDA探索、特征工程、特征优化、模型融合等)

【机器学习入门与实践】数据挖掘-二手车价格交易预测(含EDA探索、特征工程、特征优化、模型融合等)note:项目链接以及码源见文末1.赛题简介了解赛题赛题概况数据概况预测指标分析赛题数据读取pandas分类指标评价计算示例回归指标评价计算示例EDA探索载入各种数据科学以及可视化库载入数据总览数据概况...

[帮助文档] 什么是线性模型特征重要性算法组件

线性模型特征重要性组件用于计算线性模型的特征重要性,包括线性回归和二分类逻辑回归,支持稀疏和稠密数据格式。本文为您介绍该组件的配置方法。

[帮助文档] 什么是特征重要性过滤组件

特征重要性过滤组件为线性特征重要性、GBDT特征重要性和随机森林特征重要性等组件提供过滤功能,支持过滤TopN的特征。

[帮助文档] 使用pai designer分箱组件离散化连续特征

特征离散是将连续的数据进行分段,使其变为多个离散化区间。针对该场景,PAI推出了分箱组件和数据转换模块组件。首先使用分箱组件将连续特征离散化,再使用数据转换模块将原始数据从连续值转换为离散值。本文为您介绍如何使用Designer组件进行连续特征离散化。

机器学习:特征工程字典特征和文本特征抽取

机器学习:特征工程字典特征和文本特征抽取

1、数据集mysql 性能瓶颈,读取速度pandas 读取工具numpy释放GILcpython 协程sklearn2、数据集结构特征值 + 目标值3、机器学习重复值 不需要进行去重缺失值 特殊处理4、特征工程定义将原始数据转换为更好代表预测模型的潜在问题的特征的过程,从而提高对未知数据的预测准确性...

SparkML机器学习之特征工程(二)特征转化(Binarizer、StandardScaler、MaxAbsScaler、Normalizer、N-gram、Tokenizer等)

特征转化 为什么要转化数据呢,就是要让它成为有效的特征,因为原始数据是很多脏数据无用数据的。常用的方法是标准化,归一化,特征的离散化等等。比如我输入的数据是句子,我得把它切分为一个个单词进行分析,这就是一种转化。 连续型数据处理之二值化:Binarizer 假设淘宝现在有个需求,我得根据年龄来进行物...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

社区圈子

阿里云机器学习平台PAI
阿里云机器学习平台PAI
阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。
2435+人已加入
加入
相关电子书
更多
人工智能平台PAI的MaaS实践
基于Spark的面向十亿级别特征的 大规模机器学习
基于Spark的面向十亿级别特征的大规模机器学习
立即下载 立即下载 立即下载