问答 2023-11-06 来自:开发者社区

Dataphin dp hive数据源调整jdbc url和keytab之前提交的任务有影响吗?

Dataphin dp hive数据源调整jdbc url和keytab之前提交的任务有影响吗?

文章 2023-09-17 来自:开发者社区

大数据Hive URL解析函数及侧视图

1 实际工作需求业务需求中,我们经常需要对用户的访问、用户的来源进行分析,用于支持运营和决策。例如我们经常对用户访问的页面进行统计分析,分析热门受访页面的Top10,观察大部分用户最喜欢的访问最多的页面等:又或者我们需要分析不同搜索平台的用户来源分析,统计不同搜索平台中进入网站的用户个数,根据数据进行精准的引导和精准的广告投放等:要想实现上面的受访分析、来源分析等业务,必须在实际处理数据的过程中....

大数据Hive URL解析函数及侧视图
文章 2018-03-09 来自:开发者社区

Hive|| beeline连接的Invalid URL

今天在使用hive的client工具beeline时遇到了一个Invalid URL的错误。环境信息如下: hiveclient: bd23 hiveserver2: cloud011 hiveclient所在主机的jdk 1.7_51,hive 0.12和hadoop 2.3.0是从服务器端拷贝过来的,环境变量一切OK. 执行连接报了Invalid URL的错误: $ beeline Beel....

文章 2017-11-15 来自:开发者社区

自定义hive url parse函数

在用hive做nginx日志url 分析的时候,经常需要parse url。 hive中自带的函数parse_url可以实现这个功能,不过它对格式的要求比较严格,不能直接用于nginx log的request字段。 1 2 hive -e "select parse_url('http://facebook.com/path1/p.php?k1=v1&k2=v2#Ref1...

文章 2017-11-12 来自:开发者社区

hadoop中的hive查询cdn访问日志指定时间段内url访问次数最多的前10位(结合python语言)

hadoop环境描述: master节点:node1 slave节点:node2,node3,node4 远端服务器(python连接hive):node29 需求:通过hive查询到cdn日志中指定时间段内url访问次数最多的前10个url ps:用pig查询可以查询文章: http://shineforever.blog.51cto.com/1429204/1571124 说明:pyth...

hadoop中的hive查询cdn访问日志指定时间段内url访问次数最多的前10位(结合python语言)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

飞天洛神云网络

阿里云飞天洛神云网络

+关注