数据滤波

功能说明数据滤波组件可以对指定的数据列进行滤波处理,支持7种滤波方式:限幅滤波、中值滤波、滑动平均滤波、一阶滞后滤波、FIR滤波、最大值滤波和最小值滤波。计算逻辑原理限幅滤波:对输入数据进行限幅滤波操作,若输入值与有效值偏差...

滤波

参数说明IN端口-输入参数参数名描述默认值范围滤波类型无中值滤波限幅滤波中值滤波滑动平均滤波一阶滞后滤波FIR滤波滤波有效值限幅滤波有效值的选择方法前一次输出值前一次输出值固定值固定值限幅滤波的固定有效值0无最大偏差实际值和有效...

平滑函数

平滑函数是针对输入的时序曲线进行平滑和简单的滤波操作,滤波操作通常是发现时序曲线形态的第一步。函数列表 函数 说明 ts_smooth_simple 默认平滑函数,使用Holt Winters算法对时序数据进行滤波操作。ts_smooth_fir 使用FIR滤波器对时序...

预测与异常检测函数

能帮助用户快速找异常的实例曲线。ts_predicate_simple 函数格式:select ts_predicate_simple(x,y,nPred,isSmooth) 参数说明如下:参数 说明 取值 x 时间列,从小到大排列。格式为Unixtime时间戳,单位为秒。y 数值列,对应某时刻的数据...

DT-MPC

101~500高级配置组参数名描述默认值范围约束等级操作上限等级优化问题约束等级2001~999操作下限等级优化问题约束等级2001~999设定值上限等级优化问题约束等级5001~999设定值下限等级优化问题约束等级5001~999自动测试参数闭环稳定时间上限...

变点检测函数

纵轴 src 未滤波前的数据,例如1956092.7647745228。prob 该点为变点的概率,取值范围为0~1。ts_breakout_detect 函数格式:select ts_breakout_detect(x, y,winSize)参数说明如下:参数 说明 取值 x 时间列,从小到大排列。格式为Unixtime...

使用EasyCompression进行模型压缩训练

EasyCompression是PAI推出的面向TensorFlow模型的压缩建模训练工具库,实现了剪枝、量化及结构化稀疏等压缩训练算法,旨在帮助深度学习领域开发者方便快捷地完成模型压缩训练。本文介绍如何使用EasyCompression进行剪枝、量化及结构化稀疏...

概述

针对时序数据分析场景,日志服务提供了丰富的时序分析算法,可以帮助您快速解决时序预测、时序异常检测、序列分解、多时序聚类等场景问题,兼容SQL标准接口,大大降低了您使用算法的门槛,提高分析问题和解决问题的效率。功能特点 支持单...

特征尺度变换

特征尺度变换算法组件支持对稠密或稀疏的数值类特征进行常见的尺度变换。功能介绍 特征尺度变换的功能如下: 支持常见的log2、log10、ln、abs及sqrt等尺度变化函数。支持稠密及稀疏数据格式。参数配置 PAI-Studio支持通过可视化或PAI命令的...

数据视图

通过数据视图组件,您可以可视化地了解特征与标签列的分布情况及特征的特点,以便后续进行数据分析。该组件支持稀疏和稠密数据格式。本文为您介绍PAI-Studio提供的数据视图算法的参数配置方式及使用示例。配置组件 可视化方式 页签 参数 ...

极大值检测函数

极大值检测函数用于在指定窗口中寻找序列的局部极大值。ts_find_peaks 函数格式:select ts_find_...纵轴 src 未滤波前的数据,例如1956092.7647745228。peak_flag 该点是否为极大值,其中:1.0:表示该点为极大值。0.0:表示该点不是极大值。

线性模型特征重要性

计算线性模型的特征重要性,包括线性回归和二分类逻辑回归,支持稀疏和稠密数据格式。参数配置 计算线性模型的特征重要性,包括线性回归和二分类逻辑回归,支持稀疏和稠密数据格式。您可以通过以下任意一种方式,配置线性模型特征重要性...

索引优化

索引选择率是构建索引时选择什么索引类型的重要指标,B-tree索引只推荐使用在选择率非常高的列上。比如您的表有1000行数据,需要建索引的列有800个distinct的值,那么这一列索引选择率就是800/1000=0.8,这种场景就很适合建B-tree索引。如果...

预测

使用KV格式表示稀疏数据。key与value分隔符 默认为英文冒号(:)。kv对间的分隔符 默认为英文逗号(,)。执行调优 核心数 与参数每个核的内存大小搭配使用,取值范围为正整数。每个核的内存大小 与参数核心数搭配使用,单位为MB。PAI命令...

K近邻

输入表数据是稀疏格式 使用KV格式表示稀疏数据。kv间的分隔符 默认为英文逗号(,)。key和value的分隔符 默认为英文冒号(:)。参数设置 近邻个数 默认值为100。执行调优 核心数 默认系统自动分配。内存数 默认系统自动分配。PAI命令方式 ...

聚类模型评估

输入为稀疏格式 使用KV格式表示稀疏数据。kv键间分隔符 默认为英文逗号(,)。kv键内分隔符 默认为英文冒号(:)。执行调优 核心数 与参数每个核的内存大小搭配使用,取值范围为正整数。每个核的内存大小 与参数核心数搭配使用,单位为MB。...

特征离散

如果选择的是稀疏特征,则系统会自动筛选。标签列 如果您设置了该字段,则可以通过可视化方式查看特征到目标变量的x-y分布直方图。参数设置 离散方法 离散方法。取值如下:Isometric Discretization(等距离散)Isofrequecy Discretization...

PS线性回归

是否稀疏格式 使用KV格式表示稀疏格式。kv间的分隔符 默认使用空格分隔。key与value分隔符 默认使用英文冒号(:)分隔。参数设置 L1 weight L1正则化系数。该参数值越大,表示模型非零元素越少。如果过拟合,则增大该参数值。L2 weight L2...

稳态数据挑选

功能说明稳态数据挑选组件支持根据一维或多维数据的分布,区分动态波动数据和稳态数据,实现稳态数据的挑选,进行该操作前建议先进行滤波处理。具体的支持的方法有:滑动窗口检验法(Sliding Window Test,SWT)、组合统计检验法...

逻辑回归二分类

经典逻辑回归是一个二分类算法,支持稀疏及稠密数据格式。组件配置 PAI-Studio支持通过可视化或PAI命令的方式,配置该组件参数:可视化方式 页签 参数 描述 字段设置 训练特征列 输入数据源中,用于训练的特征列。支持DOUBLE及BIGINT类型。...

逻辑回归多分类

经典逻辑回归是一个二分类算法,PAI提供的逻辑回归可以支持多分类,且支持稀疏及稠密数据格式。组件配置 PAI-Studio支持通过可视化或PAI命令的方式,配置该组件参数:可视化方式 页签 参数 描述 字段设置 训练特征列 输入数据源中,用于...

奇异值分解

true false false itemDelimiter 否 指当输入表数据为稀疏格式时,kv间的分隔符。空格 kvDelimiter 否 指当输入表数据为稀疏格式时,key和value的分隔符。冒号 coreNum 否 节点个数。与memSizePerCore参数配对使用,取值为[1, 9999]的正...

PAI-TF数据转换方法

无特殊情况不建议更改为False。field_delim 否 类型STRING,默认为英文逗号(,)。CSV格式数据的分隔符。不支持数字、正负号、字母e和E、小数点(.)和多字节分隔符。当使用空格作为分隔符时,多个连续空格将被视作一个分隔符。输出:由...

特征异常平滑

特征平滑组件可以将输入特征中包含异常的数据平滑到一定区间,支持稀疏和稠密数据格式。背景信息 平滑方法如下:ZScore平滑 如果特征分布遵循正态分布,则噪音一般集中在-3×alpha和3×alpha之外,ZScore是将该范围的数据平滑到[-3×alpha,...

PS-SMART多分类

是否稀疏格式 选中是否稀疏格式复选框。参数设置 类别数 输入3。评估指标类型 选择multiclass negative log likelihood。树数量 输入5。配置统一预测组件的参数(配置如下表格中的参数,其余参数使用默认值)。页签 参数 描述 字段设置 ...

PS-SMART回归

字段设置 是否稀疏格式 选中是否稀疏格式复选框。特征列 选择features列。标签列 选择label列。参数设置 目标函数类别 配置为Linear regression。评估指标类型 选择rooted mean square error。树数量 配置为5。配置统一预测组件的参数...

K均值聚类

如果是凸数据集,一般情况下可以不修改此值;如果不是凸数据集,可能很难收敛,此时建议指定最大的迭代次数,让算法可以及时退出循环。300[1, 99999999]算法自动:根据数据值是否是稀疏的,来决定选择“K-Means”或“elkan K-Means”。建议...

K均值聚类

使用稀疏格式数据作输入时,如果最大列编号超过2,000,000,则系统报错Algo Job Failed-System Error-Feature count can’t be more than 2000000。建议从0或1开始,重新对列进行编号。如果中心点模型过大导致写失败,则系统报错Algo Job ...

朴素贝叶斯

输入数据是否为稀疏格式 使用KV格式表示稀疏数据。当输入为稀疏时,K:V间的分隔符 默认为英文逗号(,)。当输入为稀疏时,key和value的分隔符 默认为英文冒号(:)。执行调优 计算核心数 默认为系统自动分配。每个核心内存数 默认为系统...

离散值特征分析

离散值特征分析统计离散特征的分布情况。包括gini,entropy,gini gain,information gain,information gain ratio等指标。计算每个离散值对应的gini,entropy,计算单列对应的gini gain,information gain,information gain ratio。gini...

PS逻辑回归二分类

如果是否稀疏格式为true,则特征ID不能使用0,建议特征从1开始编号。参数设置 L1 weight L1正则化系数。该参数值越大,模型非零元素越少。如果过拟合,则增大该参数值。L2 weight L2正则化系数。该参数值越大,模型参数绝对值越小。如果过...

表格存储和传统关系型数据库(例如...Server)有什么区别...

表格存储是阿里云自研的多模型结构化数据存储,提供海量结构化数据存储以及...相对于传统关系型数据库严格的SCHEMA,表格存储的表是稀疏的,每一行可以有不同的列,可以动态增加或者减少属性列,创建表时无需为表的属性列定义严格的SCHEMA。

Python组件常用SDK介绍

pres_diff_filter":{"keyName":"生料磨压差滤波","time":1617160993670,"value": 8.343000411987305,"key":"tenant_xxxxxx.filter_node.pres_diff_filter", quality":192 } }使用示例:#import start from algo_sdk import api_util#...

电子罗盘

可以观察到,随着我们的旋转,散点构成了一个较为完整的圆形,说明X,Y轴的两个磁力传感器对于磁场变化的灵敏度大致一致,即变化等量磁通量带来的电阻变化是相似的,才能够呈现较为标准的圆形。而如果两个传感器的灵敏度差别较大,就会...

云数据库Cassandra版应用场景

Cassandra能够支持大并发低延时的访问需求,具备高可用和弹性扩容能力,适合消息、feed流、订单查询、...低成本存储:采用稀疏存储模式,适合用户画像高压缩存储。高扩展性:线性可扩展,灵活扩容计算和存储能力。低延时:999延迟在毫秒级别。

Partial clone 介绍

部分克隆配合稀疏特性,可以帮助我们解决这一问题,我们可以首先启用部分克隆,并指定-no-checkout选项来指定克隆完成后不执行自动检,避免检时自动下载当前分支下的所有文件。之后,再通过稀疏功能,只按需下载并检指定目录...

确定需求

您需要了解真实的业务需求是什么,以及确定整个业务系统能解决什么问题。业务调研 充分的业务调研和需求分析是数据仓库建设的基石,直接决定数据仓库能否建设成功。在数仓建设项目启动前,您需要请相关的业务人员介绍具体的业务,以便明确...

数据模型

在HBase中,数据存储在具有行和列的表中,这是与关系数据库(RDBMS)类似的模型,但与之不同的是其具备结构松散、多维有序映射的特点,它的索引排序键由行+列+时间戳组成,HBase表可以被看做一个“稀疏的、分布式的、持久的、多维度有序Map”...

线性支持向量机

0.001 enableSparse 否 输入数据是否为稀疏格式,取值范围为{ture,false}。false itemDelimiter 否 当输入表数据为稀疏格式时,KV对之间的分隔符。英文逗号(,)kvDelimiter 否 当输入表数据为稀疏格式时,key和value之间的分隔符。英文...

线性回归

是否稀疏格式 使用KV格式表示稀疏格式。kv对间分隔符 默认使用英文逗号(,)分隔。key与value分隔符 默认使用英文冒号(:)分隔。参数设置 最大迭代轮数 算法进行的最大迭代次数。最小似然误差 如果两次迭代间的Log Likelihood之差小于该值...
< 1 2 3 >
跳转至: GO

新品推荐

你可能感兴趣

热门推荐

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折