问答 2024-04-09 来自:开发者社区

大佬们,请教,pyflink pandas udf如何提高并行度

我目前尝试使用pyflink做离线处理,flink版本是1.14.6。逻辑里用到了pyflink特有的函数pandas udf,了解到这是个批处理调用的函数,通过python.fn-execution.arrow.batch.size可以控制进入函数pd.Dataframe的数据量,这个我已经通过本地应用验证的确生效,但是我设置了这些参数,将作业提交到集群上执行,通过yarn per job的形....

问答 2023-06-20 来自:开发者社区

机器学习PAI有没有 udf 用pandas的教程?像这种详细一点的,

机器学习PAI有没有 udf 用pandas的教程?像这种详细一点的,

问答 2023-06-20 来自:开发者社区

在MaxCompute如果我新建一个udf,需要用到pandas,资源列表就要加上下面这个吗?

在MaxCompute如果我新建一个udf,需要用到pandas,那在注册函数的时候,资源列表就要加上下面这个吗?pandas.zip,numpy.zip,six.tar.gz,pytz.zip,python-datetil.zip

问答 2023-06-20 来自:开发者社区

在MaxCompute中想在udf中使用pandas,该怎样操作呢?

问题1:在MaxCompute中想在udf中使用pandas,该怎样操作呢?问题2:pandas的流程和numpy一样吗?

问答 2023-06-17 来自:开发者社区

DataWorks有没有 udf 用pandas的文档?

问题1:DataWorks有没有 udf 用pandas的文档? 问题2:有没有pandas的一个详细流程?

问答 2021-12-02 来自:开发者社区

Pandas UDF处理过的数据sink问题

使用了1.12.0的flink,3.7的python。自定义了一个pandas的UDF,定义大概如下  @udf(input_types=[DataTypes.STRING(), DataTypes.FLOAT()],  result_type=DataTypes.ROW(  [DataTypes.FIELD('buyQtl', DataTypes.BIGINT())...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

人工智能

了解行业+人工智能最先进的技术和实践,参与行业+人工智能实践项目

+关注