数据滤波

功能说明数据滤波组件可以对指定的数据列进行滤波处理,支持7种滤波方式:限幅滤波、中值滤波、滑动平均滤波、一阶滞后滤波、FIR滤波、最大值滤波和最小值滤波。计算逻辑原理限幅滤波:对输入数据进行限幅滤波操作,若输入值与有效值偏差...

滤波

参数说明IN端口-输入参数参数名描述默认值范围滤波类型无中值滤波限幅滤波中值滤波滑动平均滤波一阶滞后滤波FIR滤波滤波有效值限幅滤波有效值的选择方法前一次输出值前一次输出值固定值固定值限幅滤波的固定有效值0无最大偏差实际值和有效...

平滑函数

平滑函数是针对输入的时序曲线进行平滑和简单的滤波操作,滤波操作通常是发现时序曲线形态的第一步。函数列表 函数 说明 ts_smooth_simple 默认平滑函数,使用Holt Winters算法对时序数据进行滤波操作。ts_smooth_fir 使用FIR滤波器对时序...

预测与异常检测函数

能帮助用户快速找异常的实例曲线。ts_predicate_simple 函数格式:select ts_predicate_simple(x,y,nPred,isSmooth)参数说明如下:参数 说明 取值 x 时间列,从小到大排列。格式为Unixtime时间戳,单位为秒。y 数值列,对应某时刻的数据...

DT-MPC

101~500高级配置组参数名描述默认值范围约束等级操作上限等级优化问题约束等级2001~999操作下限等级优化问题约束等级2001~999设定值上限等级优化问题约束等级5001~999设定值下限等级优化问题约束等级5001~999自动测试参数闭环稳定时间上限...

变点检测函数

纵轴 src 未滤波前的数据,例如1956092.7647745228。prob 该点为变点的概率,取值范围为0~1。ts_breakout_detect 函数格式:select ts_breakout_detect(x,y,winSize)参数说明如下:参数 说明 取值 x 时间列,从小到大排列。格式为Unixtime...

使用EasyCompression进行模型压缩训练

EasyCompression是PAI推出的面向TensorFlow模型的压缩建模训练工具库,实现了剪枝、量化及结构化稀疏等压缩训练算法,旨在帮助深度学习领域开发者方便快捷地完成模型压缩训练。本文介绍如何使用EasyCompression进行剪枝、量化及结构化稀疏...

概述

针对时序数据分析场景,日志服务提供了丰富的时序分析算法,可以帮助您快速解决时序预测、时序异常检测、序列分解、多时序聚类等场景问题,兼容SQL标准接口,大大降低了您使用算法的门槛,提高分析问题和解决问题的效率。功能特点 支持单...

特征尺度变换

特征尺度变换算法组件支持对稠密或稀疏的数值类特征进行常见的尺度变换。功能介绍 特征尺度变换的功能如下:支持常见的log2、log10、ln、abs及sqrt等尺度变化函数。支持稠密及稀疏数据格式。参数配置 PAI-Studio支持通过可视化或PAI命令的...

数据视图

通过数据视图组件,您可以可视化地了解特征与标签列的分布情况及特征的特点,以便后续进行数据分析。该组件支持稀疏和稠密数据格式。本文为您介绍PAI-Studio提供的数据视图算法的参数配置方式及使用示例。配置组件 可视化方式 页签 参数 ...

索引优化

只对高选择率的列建B-tree索引:索引选择率是构建索引时选择什么索引类型的重要指标,B-tree索引只推荐使用在选择率非常高的列上。比如您的表有1000行数据,需要建索引的列有800个distinct的值,那么这一列索引选择率就是800/1000=0.8,这种...

线性模型特征重要性

计算线性模型的特征重要性,包括线性回归和二分类逻辑回归,支持稀疏和稠密数据格式。参数配置 计算线性模型的特征重要性,包括线性回归和二分类逻辑回归,支持稀疏和稠密数据格式。您可以通过以下任意一种方式,配置线性模型特征重要性...

大仓库提效指南

在代码仓库体积较大或网络状况不佳的情况下,推拉仓库需要大量的时间,随之而来的可能还有超时等问题。目前,Codeup已经支持了 Git LFS(大文件存储)和部分克隆、浅克隆等特性,以缓解此类问题,降低本地磁盘空间的占用,减少推拉仓库所需...

极大值检测函数

极大值检测函数用于在指定窗口中寻找序列的局部极大值。ts_find_peaks 函数格式:select ts_find_...纵轴 src 未滤波前的数据,例如1956092.7647745228。peak_flag 该点是否为极大值,其中:1.0:表示该点为极大值。0.0:表示该点不是极大值。

预测

稀疏矩阵 使用KV格式表示稀疏数据。key与value分隔符 默认为英文冒号(:)。kv对间的分隔符 默认为英文逗号(,)。执行调优 核心数 与参数每个核的内存大小搭配使用,取值范围为正整数。每个核的内存大小 与参数核心数搭配使用,单位为MB。...

K近邻

输入表数据是稀疏格式 使用KV格式表示稀疏数据。kv间的分隔符 默认为英文逗号(,)。key和value的分隔符 默认为英文冒号(:)。参数设置 近邻个数 默认值为100。执行调优 核心数 默认系统自动分配。内存数 默认系统自动分配。PAI命令方式 ...

特征离散

如果选择的是稀疏特征,则系统会自动筛选。标签列 如果您设置了该字段,则可以通过可视化方式查看特征到目标变量的x-y分布直方图。参数设置 离散方法 离散方法。取值如下:Isometric Discretization(等距离散)Isofrequecy Discretization...

聚类模型评估

输入为稀疏格式 使用KV格式表示稀疏数据。kv键间分隔符 默认为英文逗号(,)。kv键内分隔符 默认为英文冒号(:)。执行调优 核心数 与参数每个核的内存大小搭配使用,取值范围为正整数。每个核的内存大小 与参数核心数搭配使用,单位为MB。...

PS线性回归

是否稀疏格式 使用KV格式表示稀疏格式。kv间的分隔符 默认使用空格分隔。key与value分隔符 默认使用英文冒号(:)分隔。参数设置 L1 weight L1正则化系数。该参数值越大,表示模型非零元素越少。如果过拟合,则增大该参数值。L2 weight L2...

逻辑回归二分类

经典逻辑回归是一个二分类算法,支持稀疏及稠密数据格式。组件配置 PAI-Studio支持通过可视化或PAI命令的方式,配置该组件参数:可视化方式 页签 参数 描述 字段设置 训练特征列 输入数据源中,用于训练的特征列。支持DOUBLE及BIGINT类型。...

逻辑回归多分类

经典逻辑回归是一个二分类算法,PAI提供的逻辑回归可以支持多分类,且支持稀疏及稠密数据格式。组件配置 PAI-Studio支持通过可视化或PAI命令的方式,配置该组件参数:可视化方式 页签 参数 描述 字段设置 训练特征列 输入数据源中,用于...

稳态数据挑选

功能说明稳态数据挑选组件支持根据一维或多维数据的分布,区分动态波动数据和稳态数据,实现稳态数据的挑选,进行该操作前建议先进行滤波处理。具体的支持的方法有:滑动窗口检验法(Sliding Window Test,SWT)、组合统计检验法...

奇异值分解

无 tol 否 收敛误差 1.0e~06 enableSparse 否 输入数据是否为稀疏格式:true false false itemDelimiter 否 指当输入表数据为稀疏格式时,kv间的分隔符。空格 kvDelimiter 否 指当输入表数据为稀疏格式时,key和value的分隔符。冒号 ...

PAI-TF数据转换方法

trans_csv_id2sparse Python接口 将标记有效位置的CSV字符串集合转换成为稀疏矩阵。trans_csv_id2sparse(records,max_id,id_as_value=True,field_delim=”,”)输入以下参数:参数 是否必选 描述 records 是 类型STRING数组待解析CSV字符串...

特征异常平滑

特征平滑组件可以将输入特征中包含异常的数据平滑到一定区间,支持稀疏和稠密数据格式。背景信息 平滑方法如下:ZScore平滑 如果特征分布遵循正态分布,则噪音一般集中在-3×alpha和3×alpha之外,ZScore是将该范围的数据平滑到[-3×alpha,...

PS-SMART多分类

组件配置 PAI-Studio支持通过可视化或PAI命令方式,配置PS-SMART多分类组件的参数:可视化方式 页签 参数 描述 字段设置 是否稀疏格式 稀疏格式的KV之间使用空格分隔,key与value之间使用英文冒号(:)分隔。例如1:0.3 3:0.9。选择特征列 ...

PS-SMART回归

组件配置 PAI-Studio支持通过可视化或PAI命令方式,配置PS-SMART回归组件的参数:可视化方式 页签 参数 描述 字段设置 是否稀疏格式 稀疏格式的KV之间使用空格分隔,key与value之间使用英文冒号(:)分隔。例如1:0.3 3:0.9。选择特征列 ...

K均值聚类

输入为稀疏矩阵 使用KV格式表示稀疏数据。kv键间分隔符 默认为英文逗号(,)。kv键内分隔符 默认为英文冒号(:)。参数设置 聚类数 取值范围为1~1000。距离度量方式 支持Euclidean、Cosine及Cityblock方式。质心初始化方法 支持Random、...

K均值聚类

说明 如果是凸数据集,一般情况下可以不修改此值;如果不是凸数据集,可能很难收敛,此时建议指定最大的迭代次数,让算法可以及时退出循环。300[1,99999999]算法自动:根据数据值是否是稀疏的,来决定选择“K-Means”或“elkan K-Means”。...

朴素贝叶斯

输入数据是否为稀疏格式 使用KV格式表示稀疏数据。当输入为稀疏时,K:V间的分隔符 默认为英文逗号(,)。当输入为稀疏时,key和value的分隔符 默认为英文冒号(:)。执行调优 计算核心数 默认为系统自动分配。每个核心内存数 默认为系统...

离散值特征分析

离散值特征分析统计离散特征的分布情况。包括gini,entropy,gini gain,information gain,information gain ratio等指标。计算每个离散值对应的gini,entropy,计算单列对应的gini gain,information gain,information gain ratio。gini...

PS逻辑回归二分类

是否稀疏格式 如果是否稀疏格式为true,则特征ID不能使用0,建议特征从1开始编号。参数设置 L1 weight L1正则化系数。该参数值越大,模型非零元素越少。如果过拟合,则增大该参数值。L2 weight L2正则化系数。该参数值越大,模型参数绝对值...

电子罗盘

可以观察到,随着我们的旋转,散点构成了一个较为完整的圆形,说明X,Y轴的两个磁力传感器对于磁场变化的灵敏度大致一致,即变化等量磁通量带来的电阻变化是相似的,才能够呈现较为标准的圆形。而如果两个传感器的灵敏度差别较大,就会...

确定需求

您需要了解真实的业务需求是什么,以及确定整个业务系统能解决什么问题。业务调研 充分的业务调研和需求分析是数据仓库建设的基石,直接决定数据仓库能否建设成功。在数仓建设项目启动前,您需要请相关的业务人员介绍具体的业务,以便明确...

数据模型

在HBase中,数据存储在具有行和列的表中,这是与关系数据库(RDBMS)类似的模型,但与之不同的是其具备结构松散、多维有序映射的特点,它的索引排序键由行+列+时间戳组成,HBase表可以被看做一个“稀疏的、分布式的、持久的、多维度有序Map”...

部分克隆(Partial clone)介绍

部分克隆配合稀疏特性,可以帮助我们解决这一问题,我们可以首先启用部分克隆,并指定-no-checkout选项来指定克隆完成后不执行自动检,避免检时自动下载当前分支下的所有文件。之后,再通过稀疏功能,只按需下载并检指定目录...

线性回归

是否稀疏格式 使用KV格式表示稀疏格式。kv对间分隔符 默认使用英文逗号(,)分隔。key与value分隔符 默认使用英文冒号(:)分隔。参数设置 最大迭代轮数 算法进行的最大迭代次数。最小似然误差 如果两次迭代间的Log Likelihood之差小于该值...

COUNT

以下示例显示可以稀疏地填充关联数组(即,已赋值元素的序列中存在“间隙”)。COUNT仅包括已赋值的元素。DECLARE TYPE sparse_arr_typ IS TABLE OF NUMBER INDEX BY BINARY_INTEGER;sparse_arr sparse_arr_typ;BEGIN sparse_arr(-100):=-...

线性支持向量机

英文逗号(,)kvDelimiter 否 当输入表数据为稀疏格式时,key和value之间的分隔符。英文冒号(:)coreNum 否 计算的核心数,取值范围为正整数。系统自动分配 memSizePerCore 否 每个核心的内存,取值范围为1 MB~65536 MB。系统自动分配 ...

标准化

standard deviation:样本标准偏差,针对从总体抽样,利用样本来计算总体偏差,为了使算的值与总体水平更接近,就必须将算的标准偏差的值适度放大,即。样本标准偏差公式:。其中代表所采用的样本X1,X2,…,Xn的均值。标准化 PAI-...
< 1 2 3 >
跳转至: GO

新品推荐

你可能感兴趣

热门推荐

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折