HDFS—集群压测

news/2024/5/20 3:09:14 标签: hdfs, hadoop, 大数据

目录

测试写性能

 测试读性能

删除测试产生的文件

测试写性能

hadoop jar /opt/module/hadoop-3.1.3/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-3.1.3-tests.jar TestDFSIO -write -nrFiles 10 -fileSize 128MB

  

一共参与测试的文件:10个文件 * 2个副本 = 20个

压测后的速度:1.97

实测速度:1.97M/s * 20个文件 ≈ 39.4M/s

三台服务器的带宽:12.5 + 12.5 + 12.5 ≈ 30m/s

所有网络资源都已经用满。

 测试读性能

hadoop jar /opt/module/hadoop-3.1.3/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-3.1.3-tests.jar TestDFSIO -read -nrFiles 10 -fileSize 128MB

Number of files:生成mapTask数量,一般是集群中(CPU核数-1),我们测试虚拟机就按照实际的物理内存-1分配即可

Total MBytes processed:单个map处理的文件大小

Throughput mb/sec:单个mapTak的吞吐量

计算方式:处理的总文件大小/每一个mapTask写数据的时间累加

集群整体吞吐量:生成mapTask数量*单个mapTak的吞吐量

Average IO rate mb/sec::平均mapTak的吞吐量

计算方式:

        每个mapTask处理文件大小/每一个mapTask写数据的时间

        全部相加除以task数量

IO rate std deviation:方差、反映各个mapTask处理的差值,越小越均衡

注意:如果测试过程中,出现异常

(1)可以在yarn-site.xml中设置虚拟内存检测为false

<!--是否启动一个线程检查每个任务正使用的虚拟内存量,如果任务超出分配值,则直接将其杀掉,默认是true -->

<property>

     <name>yarn.nodemanager.vmem-check-enabled</name>

     <value>false</value>

</property>

(2)分发配置并重启Yarn集群

删除测试产生的文件

hadoop jar /opt/module/hadoop-3.1.3/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-3.1.3-tests.jar TestDFSIO -clean


http://www.niftyadmin.cn/n/146715.html

相关文章

什么是Java静态属性?有什么作用?

如果在Java程序中使用static修饰属性&#xff0c;则该属性称为静态属性(也称全局属性)&#xff0c;静态属性可以使用类名直接访问&#xff0c;访问格式如下&#xff1a; 类名属性名在学习静态属性之前&#xff0c;先来看一个案例&#xff0c;如文件3-13所示。 文件3-13 Examp…

项目实战典型案例21——面向对象复用、面向对象实现、立体化权限落地

面向对象复用、面向对象实现、立体化权限落地一&#xff1a;背景介绍问题一、针对于激励配置的功能体现出来的&#xff1a;面向对象思想就可以实现极大程度的复用性的问题。问题二、脱离学习通设计图&#xff0c;过程化&#xff0c;如何用面向对象的思想来去组织管理流程图问题…

ChatGPT前传

文章目录前言GPT概述GPT-1代GPT-1 学习目标和概念介绍GPT-1 训练数据集GPT-1 模型结构和应用细节GPT-1 效果性能和总结GPT-2代GPT-2 学习目标和概念介绍GPT-2 训练数据集GPT-2 模型结构和应用细节GPT-2 性能效果和总结GPT-3代GPT-3 学习目标和概念介绍GPT-3 训练数据集GPT-3 模…

git使用学习笔记

git介绍&#xff1a;分布式版本控制器https://git-scm.com/ SSH免密登录 分布式版本控制器相比集中式版本控制器的优点&#xff1a; 服务器断网的情况下也可以进行开发(因为版本控制是在本地进行的)每个客户端保存的也都是整个完整的项目(包含历史记录、更加安全) git常用命令…

4. 对称飞行器 -- BFS搜索

对称飞行器 小强在玩一个走迷宫的游戏&#xff0c;他操控的人物现在位于迷宫的起点&#xff0c;他的目标是尽快的到达终点。 每一次他可以选择花费一个时间单位向上或向下或向左或向右走一格&#xff0c;或是使用自己的对称飞行器花费一个时间单位瞬移到关于当前自己点中心对称…

数据结构与算法基础(王卓)(16):KMP算法(个人学习历程)

如果只是想快速了解上手KMP&#xff0c;可以直接看&#xff1a; 数据结构与算法基础&#xff08;王卓&#xff09;&#xff08;17&#xff09;&#xff1a;KMP算法详解&#xff08;精讲&#xff08;最简单、直接、有效的思路方法&#xff09;不含代码&#xff0c;但说明了所有…

进销存库存管理软件哪个好用?

进销存库存管理软件哪个好用?最好是销售、进货、记账、库存管理一体的那种软件&#xff0c;要是有pc和ios跨平台的就更完美了&#xff01; 市面上大部分的仓库管理系统动辄几万几十万&#xff0c;而且用起来常常面临&#xff1a;想要的功能没有&#xff0c;不想要的功能删不掉…

python不要再使用while死循环,使用定时器代替效果更佳!

在python开发的过程中&#xff0c;经常见到小伙伴直接使用while True的死循环sleep的方式来保存程序的一直运行。 这种方式虽然能达到效果&#xff0c;但是说不定什么时候就直接崩溃了。并且&#xff0c;在Linux环境中在检测到while True的未知进程就会直接干掉。 面对这样的…