文章 2022-06-08 来自:开发者社区

Flink SQL 解析嵌套的 JSON 数据

在日常的开发中,最常用的数据格式是 JSON ,并且有的时候 JSON 的格式是非常复杂的(嵌套的格式),那在 Flink SQL 中进行解析的时候也会相当麻烦一点,下面将会演示如何在 DDL 里面定义 Map、Array、Row 类型的数据,以及在 SQL 里面如何获里面的值数据格式如下:以下数据完全是自己造的,没有任何实际含义{ "funcName": "test", "data": {...

Flink SQL 解析嵌套的 JSON 数据
问答 2021-12-07 来自:开发者社区

Flink SQL 解析复杂(嵌套)JSON的问题 以及写入到hive类型映射问题

json格式,如果是一个json array 该如何定义 schema,array里还可能存在嵌套json array的情况。 如数据: {"user_info":{"user_id":"0111","name":"xxx"},"timestam":1586676835655,"id":"10001","jsonArray":[{"name222":"xxx","user_id222":"00.....

问答 2021-12-07 来自:开发者社区

Flink SQL 解析复杂(嵌套)JSON 的问题以及写入到 hive 映射问题

json格式,如果是一个json数组的方法定义模式,数组里还可能存在隐藏json数组的情况。 如数据: {"user_info":{"user_id":"0111","name":"xxx"},"timestam":1586676835655,"id":"10001","jsonArray":[{"name222":"xxx" ,"user_id222":"0022"},{"name333":.....

问答 2021-12-06 来自:开发者社区

如何用Flink SQL的UDF优雅的拉平嵌套在json中的数组?

案例背景: 想增加一个Flink(1.8)SQL 的UDF,解析如下json中的name字段,name的value是一个数组,想取数组第一个值(其他舍弃),并将其拉平(即没有嵌套,跟其他 (e.g.:appKey) 在同一级别) 源json: {"appKey": "qq", "eventId": "18", "name" : [{"a":"jack","b":"mark","c":"tark"....

问答 2021-12-06 来自:开发者社区

Flink SQL Row里嵌套Array<Row>该如何用DDL定义?

[image: image.png] 如题,尝试用以下方式定义时会遇到异常,求社区大佬指点正确的打开姿势。 *来自志愿者整理的flink邮件归档

问答 2021-12-03 来自:开发者社区

flink sql 使用自定义函数 返回嵌套行,查询报错 scala.MatchError,为什么?

目前无法通过t.* 将嵌套的字段查询出来。 val schema = tEnv.executeSql( """ | SELECT t.* FROM ( | SELECT EvtParser(request) as t FROM parsed_nginx_log | ) |""".stripMargin).getTableSchema 其中自定义函数 EvtParser 定义如下。 @Data...

问答 2021-12-02 来自:开发者社区

Flink SQL中动态嵌套字段如何定义DDL

我们在使用streamsets作为CDC工具,输出到kafka中的内容是嵌套多变的类型,如:  {database:a, table: b, type:update, data:{a:1,b:2,c:3}}  {database:a, table: c, type:update, data:{c:1,d:2}}  请问这种类型该如何定义DDL?*来自志愿者整理的fli...

问答 2020-05-19 来自:开发者社区

嵌套json 怎么取数? #Flink

嵌套json 怎么取数? #Flink

问答 2020-05-13 来自:开发者社区

咨询一个flink sql的基础问题,如果要统计的数据(在kafka中)是那种嵌套多层的#Flink

咨询一个flink sql的基础问题,如果要统计的数据(在kafka中)是那种嵌套多层的json,能把想要的字段数据映射出来么?#Flink

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云实时计算Flink

一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。

+关注