小记hive
dremio hive jdbc arp date 类型问题记录
简单记录下碰到的一些问题 分析 arthas stack 查看调用 ffect(class count: 2 , method count: 4) cost in 329 ms, listenerId: 11 ts=2023-12-26 06:18:17;thread_name=e3 - 1a758 ......
Hive的体系架构
Hello,大家好,上一篇博文聊了一下Hive的基本知识,为了让大家更深入地理解Hive,本篇就写一下Hive的体系架构吧。 先看一张图: 大概解释一下: command-line shell & thrift/jdbc 可以用 command-line shell 和 thrift/jdbc 两种 ......
Hive“横空出世”的原因
在沸沸扬扬的大数据江湖里,有这么一个框架,它刚开始很低调,然而,就在那么一个不起眼的一天,突然展示出其绝妙的武功,让大数据各大框架的掌门人暗挑大拇指,好了,不卖关子了,这个“横空出世”的框架就是——Hive。 一:Hive产生的背景 万事有因果,Hive的出现也不是无缘无故的,总体来说,Hive出现 ......
大数据从业者必知必会的Hive SQL调优技巧 | 京东云技术团队
摘要:在大数据领域中,Hive SQL被广泛应用于数据仓库的数据查询和分析。然而,由于数据量庞大和复杂的查询需求,Hive SQL查询的性能往往不尽人意。本文针对Hive SQL的性能优化进行深入研究,提出了一系列可行的调优方案,并给出了相应的优化案例和优化前后的SQL代码。通过合理的优化策略和技巧 ......
Hive 3.1.3 生产安装
1.安装用于存储元数据的关系数据库 生产环境中一般存储元数据采用独立的关系型数据库而非Hive本地的嵌入式数据库 本地的嵌入式数据库无法支持多个请求同时访问。 本示例采用Mysql8.0作为示例 具体的支持列表参考官方文档: https://cwiki.apache.org/confluence/d ......
Hive 3.1.3最小化安装
1.解压 mkdir /usr/hive tar -zxvf apache-hive-3.1.3-bin.tar.gz -C /usr/hive 2.配置Hive环境变量 在/etc/profile.d中配置 1.新建hive.sh vi /etc/profile.d/hive.sh export ......
Spark写hive insertInto和saveAsTable的差别和错误
insertInto必须保证源表字段顺序和hive表字段顺序一致,不然会插入乱序,如果字段数不一致,会报错 saveAsTable append模式下,如果字段数不一致,会报错,overwrite模式下,会重建表 如果是外部表,已经存在了数据,saveAsTable会报错 org.apache.sp ......
ClickHouse(19)ClickHouse集成Hive表引擎详细解析
目录Hive集成表引擎创建表使用示例如何使用HDFS文件系统的本地缓存查询 ORC 输入格式的Hive 表在 Hive 中建表在 ClickHouse 中建表查询 Parquest 输入格式的Hive 表在 Hive 中建表在 ClickHouse 中建表查询文本输入格式的Hive表在Hive 中建 ......
Hive-mapjoin详解(mapjoin原理)
笼统的说,Hive中的Join可分为Common Join(Reduce阶段完成join)和Map Join(Map阶段完成join)。本文简单介绍一下两种join的原理和机制。 一 .Common Join 如果不指定MapJoin或者不符合MapJoin的条件,那么Hive解析器会将Join操作 ......
Hive和Spark生产集群搭建
1.环境准备 1.1 版本选择 序号 bigdata-001 bigdata-002 bigdata-003 bigdata-004 bigdata-005 MySQL-8.0.31 mysql Datax Datax Datax Datax Datax Datax Spark-3.3.1 Spar ......
好题小记
CF838D Airplane Arrangements 题目传送门 很高妙的题。 直接计算不太好做,考虑把链首尾接起来拼成环,但注意到直接拼就无法判不合法,所以在 $1$ 和 $n$ 中间插入一个 $n+1$ 号点,若 $n+1$ 号点被覆盖则不合法。 考虑对于所有方案计算 $n+1$ 号点被覆盖 ......
C++ 反向遍历 array 小记
有时候需要逆向循环,例如从字符串的最右端遍历到最左端,需要注意一些细节!初学遇到一些 bug 记录在这里。 首先 arr.size() 的数据类型为 size_t,为无符号整型 对于 for (int idx = arr.size() - 1; idx >= 0; idx--): 使用 int 作为 ......
[2023.12.14] 大学 & XCPC小记
说起来 OI 退役多年,已经很久没有维护过这个博客。 上一周打完 ICPC 杭州站,也是大三赛季的最后一站,总觉得应该记一些什么……不止是记录我的 XCPC 生涯,也是给大学的前面快要 5 个学期做一个大体上的总结吧~ 一切都还要从高考结束开始说起。 2021.6 高考 & 暑假篇 高考结束,估分给 ......
hive Metastore 启动报错 Version information not found in metastore报错处理
修改 conf/hive-site.xml中的 hive.metastore.schema.verification 设置为false。 hive Metastore 启动报错 [main]: Metastore Thrift Server threw an exception... org.apa ......
关于再次出现 Could not open client transport with JDBC Uri: jdbc:hive2://node1:10000: java.net.ConnectException: 拒绝连接 (Connection refused) (state=08S01,code=0)
写在最前边——我报错是因为空间不足 当我时隔两个月再次看到这个报错的时候我是感到绝望的—— ——然而当我查了一遍百度发现唯一一个拥有相同报错解决方法的博客出自我之手的时候我的崩溃的—— ——在我发现曾经的方法无法解决现在的我的报错的时候,我觉得我的心都碎了QAQ 在经历了三天无果的尝试之后,我决定试 ......
EMR-hive集成ranger
hive集成ranger:https://help.aliyun.com/zh/emr/emr-on-ecs/user-guide/enable-hive-in-ranger-and-configure-related-permissions ......
四、Hive优化
1.1 hive的随机抓取策略 理论上来说,Hive中的所有sql都需要进行mapreduce,但是hive的抓取策略帮我们 省略掉了这个过程,把切片split的过程提前帮我们做了。 set hive.fetch.task.conversion=none; (一旦进行这么设置,select字段名也是 ......
三、Hive学习之SQL、函数
SQL练习 1、count(*)、count(1) 、count('字段名') 区别 从执行结果来看 count(*)包括了所有的列,相当于行数,在统计结果的时候,不会忽略列值为NULL 最慢的 count(1)包括了忽略所有列,用1代表代码行,在统计结果的时候,不会忽略列值为NULL 最快的 co ......
二、Hive学习
1、Hive分区(十分重要!!) 在大数据中,最常见的一种思想就是分治,我们可以把大的文件切割划分成一个个的小的文件,这样每次操作一个个小的文件就会很容易了,同样的道理,在hive当中也是支持这种思想的,就是我们可以把大的数据,按照每天或者每小时切分成一个个小的文件,这样去操作小的文件就会容易很多了 ......
一、Hive概述与安装部署
1、Hive基本概念 1.1 Hive简介 Hive本质是将SQL转换为MapReduce的任务进行运算,底层由HDFS来提供数据存储,说白了hive可以理解为一个将SQL转换为MapReduce的任务的工具,甚至更近一步说hive就是一个MapReduce客户端。 思考:计算文件user.txt中 ......
博弈论小记
博弈论是好文明喵! 博弈论入门提单喵 阶梯博弈 讲解 例题 POJ1704 评价:证明简单,特征比较明显,基本是铜/银牌题 斐波那契博弈 讲解 例题 HDU2516 评价:证明困难,但特征十分明显,直接打表找规律 Nim游戏的有趣题目 D-HihoCoder - 1172 题意:有一行n个硬币,有的 ......
Hive与MySQL的版本关系
Hive支持的MySQL版本 Hive的元数据存储在MySQL数据库中,因此必须要安装和配置MySQL,以便与Hive配合使用。但是,Hive不支持所有MySQL版本,以下是Hive所支持的MySQL版本: MySQL 5.5.x (推荐) MySQL 5.6.x MySQL 5.7.x MySQL ......
hive身份验证
Hive 通过HiveServer2对外提供服务,HiveServer2 是一种能使客户端执行 Hive 查询的服务。 HiveServer2 实现了一个新的基于 Thrift 的 RPC 接口,该接口可以处理客户端并发请求。当前版本支持 Kerberos,LDAP 以及自定义可插拔身份验证。新的 ......
EMR-hive集成openldap
LDAP认证:https://help.aliyun.com/zh/emr/emr-on-ecs/user-guide/use-ldap-authentication?spm=a2c4g.11186623.0.i4 OpenLDAP试用说明参考:https://help.aliyun.com/zh/ ......
实验6熟悉的hive的基本操作
今天完成了大数据实验六的hive的基本操作 参照实验6 熟悉Hive的基本操作_hive环境搭建实验报告-CSDN博客、 这位博主的代码,但是前期的启动hive并没有按照博主的来,启动hive大家参照我之前的一篇博客来就行 我是从黑马教程跟着下载的hive ......
hive执行sql报错 FAILED: Execution Error, return code 3 from org.apache.hadoop.hive.ql.exec.mr.MapredLocalTask
前言: 执行hive sql报错,sql逻辑是两个表左连接并将数据插入新的表中。 报错信息: [ERROR] 2023-12-05 15:49:49.165 +0800 - execute sql error: Error while processing statement: FAILED: Ex ......
DBeaver连接hive
配置maven仓库:窗口,首选项,连接,驱动,Maven,添加 https://repo.huaweicloud.com/repository/maven/ ......
[OpenVR] OpenVR 驱动开发调试的方法小记
OpenVR 驱动开发调试方法 VR 也许是下一个风口,也许只是一场耀眼的烟花晚会。这年轻的平台还有许多未成形的构建,其中恰好就包括一个完整的调试架构。这使得 VR 开发,尤其是驱动层的开发,变得十分得痛苦。 因为我个人的习惯,我会尽可能避免调用 Visual Studio. 但是由于在 Windo ......
datax采集txt文件数据到hive
1、提前创建hive表结构 DROP TABLE IF EXISTS ods.ods_log_1diu; CREATE TABLE IF NOT EXISTS ods.ods_log_1diu ( SI_NO STRING, --varchar(10) not null,主键 SEND_TABLE ......
关于hadoop hive中使用hive分区功能
很多人习惯了使用第三方的工具 去连接hive或者hbase数据库,并且 使用其中的sql编辑器进行失去了语句 的使用来进行数据的分析等一系列的 操作,但是一些shell命令也可以在其中 运行例如: 1. set hive.exec.dynamic.partition=true; 2. set hiv ......