大数据开发之Hive案例篇12:HDFS rebalance 一例

news/2024/5/20 2:57:51 标签: 大数据, hdfs, hadoop, hdfs rebalance

文章目录

  • 一. 问题描述
  • 二. 解决方案
    • 2.1 增加节点
    • 2.2 rebalance
    • 2.3 rebalance引发的问题

一. 问题描述

公司的离线数仓是CDH集群,19个节点,HDFS存储空间大约400TB左右,使用量在200TB左右。
由于历史遗留的问题,数据仓库需要重构,新旧数仓在一段时间内需要并存,此时HDFS空间救不够了。

于是申请增加6个节点,每个节点挂20T的存储,累积给HDFS增加120TB左右空间。

二. 解决方案

2.1 增加节点

通过Cloudera Manager 将新增加的6台机器加入到集群。
增加完节点后
image.png

2.2 rebalance

节点间数据分布不均匀:
新增加节点与旧节点之间数据分布不均匀
(这还是HDFS rebalance执行了一天多的时候的截图)
image.png

rebalance耗时:
image.png

rebalance后节点数据分布情况:
image.png

2.3 rebalance引发的问题

rebalance引发的问题:

retrying (13 attempts left). Error: <class 'kafka.errors.NotLeaderForPartitionError'>

Kafka出了问题,选主过程受到ZK的影响,导致生产者写的时候找不到主节点,进而导致数据丢失
image.png


http://www.niftyadmin.cn/n/430049.html

相关文章

空间计算时代下,中国能否诞生下一个“苹果”?

“one more thing&#xff01;” 6月6日的WWDC大会上&#xff0c;苹果CEO库克激动地喊出这句乔布斯的口头禅。随后&#xff0c;苹果的Vision Pro头显产品正式亮相&#xff0c;库克形容它是“革命性产品”“开启空间计算时代”。 当一个类似滑雪镜的头显设备出现在屏幕&#x…

聊一聊性能测试

提到性能测试&#xff0c;很多从业相关人员可能会感觉比较混淆。 性能测试&#xff0c;它是属于测试领域一个专业细分领域&#xff0c;和软件测试一样&#xff0c;性能测试涉及到的范围和所需要的技能是非常广而精的&#xff0c;如果从大的类型来划分的话性能测试可以被分为&a…

j攻防渗透第一章

工具名称 简介 Burp Suite Pro Web应用程序攻击测试集成平台 Sqlmap.jar插件 联动Burp Suite Pro进行SQL注入 Wappalyzer插件 浏览器网站技术分析插件 Fiddler 5 HTTP协议调试代理 Nmap 网络连接端口扫描 SQLMap SQL注入测试 NetCat 端口连接&#xff0c;数据提交 MetaSploit 安…

pandas---数据合并(concat、append、merge)

1. concat函数 pd.concat([data1, data2], axis1) 按照行或列进行合并&#xff0c;axis0为列索引&#xff0c;axis1为行索引。 df1 make_df([1, 2], [A, B]) df2 make_df([3, 4], [A, B]) display(df1, df2) # 默认上下合并&#xff0c;垂直合并 pd.concat([df1, df2]) …

MongoDB实际场景应用

你要构建一个在线零售商店&#xff0c;这个店铺需要处理会员数据、订单数据以及商品数据等。为了保存和管理这些数据&#xff0c;你可以使用MongoDB。 目录 1. 设计数据模式 2. 插入数据 3. 查询数据 1. 设计数据模式 对于在线零售商店的数据&#xff0c;你可以设计三个Mo…

grpc 实现grpc gateway(window环境)

官网&#xff1a;https://grpc-ecosystem.github.io/grpc-gateway/ github&#xff1a;https://github.com/grpc-ecosystem/grpc-gateway grpc gateway的原理官网有介绍。总结一下就是&#xff1a; gRPC-Gateway帮助你同时以gRPC和RESTful风格提供你的API。grpc-gateway旨在为您…

WinForm——软件加载读条界面卡死问题

WinForm——软件加载读条界面卡死问题 前言一、问题现象二、测试部分代码1.Loading窗体2.加载代码Program处 三、分析原因四、解决方案代码1.Loading窗体2.加载代码Program处 前言 在制作软件开启界面&#xff0c;读条加载时&#xff0c;在Program中new了个Loading窗体&#x…

Linux系统实现虚拟内存教程

Linux系统实现虚拟内存有两种方法&#xff1a;交换分区&#xff08;swap分区&#xff09;和交换文件&#xff0c; 一、交换文件 查看内存&#xff1a;free -m , -m是显示单位为MB&#xff0c;-g单位GB free -g 创建一个文件&#xff1a;touch命令用于修改…