HDFS配置lzo压缩

news/2024/5/20 4:29:22 标签: 大数据, 数据仓库, hdfs, lzo

参考 https://www.cnblogs.com/caoshouling/p/14091113.html, 做了验证,很好的文档。

1) 停止hdfs集群

2)安装配置maven

https://blog.csdn.net/hailunw/article/details/117996934

3)生成lzo压缩程序包

3.1)安装前置package

yum -y install  lzo-devel  zlib-devel  gcc autoconf automake libtool

3.2)下载lzo源文件 https://github.com/twitter/hadoop-lzo/archive/refs/heads/master.zip 到99服务器,解压缩。

wget https://github.com/twitter/hadoop-lzo/archive/refs/heads/master.zip
unzip master.zip 

3.3)安装lzo

cd /home/user/hadoop-lzo-master
mkdir lzo
export CFLAGS=-m64
export CXXFLAGS=-m64
export C_INCLUDE_PATH=/usr/local/hadoop/lzo/include
export LIBRARY_PATH=/usr/local/hadoop/lzo/lib

mvn clean package -Dmaven.test.skip=true
cd target/native/Linux-amd64-64
tar -cBf - -C lib . | tar -xBvf - -C ~
cp ~/libgplcompression* $HADOOP_HOME/lib/native/
cp /home/user/hadoop-lzo-master/target/hadoop-lzo-0.4.21-SNAPSHOT.jar $HADOOP_HOME/share/hadoop/common/

4)配置Hadoop

4.1)将lzo包分发到66服务器和88服务器

scp -r /home/user/hadoop-3.2.2/share/hadoop/common/hadoop-lzo-0.4.21-SNAPSHOT.jar user@192.168.1.88:/home/user/hadoop-3.2.2/share/hadoop/common/hadoop-lzo-0.4.21-SNAPSHOT.jar

scp -r /home/user/hadoop-3.2.2/share/hadoop/common/hadoop-lzo-0.4.21-SNAPSHOT.jar user@192.168.1.66:/home/user/hadoop-3.2.2/share/hadoop/common/hadoop-lzo-0.4.21-SNAPSHOT.jar

scp -r $HADOOP_HOME/lib/native/* user@192.168.1.88:$HADOOP_HOME/lib/native/

scp -r $HADOOP_HOME/lib/native/* user@192.168.1.66:$HADOOP_HOME/lib/native/

4.2)在66,88,99服务器修改配置文件core-site.xml,添加如下内容。

<property>
<name>io.compression.codecs</name>
<value>
org.apache.hadoop.io.compress.GzipCodec,
org.apache.hadoop.io.compress.DefaultCodec,
org.apache.hadoop.io.compress.BZip2Codec,
org.apache.hadoop.io.compress.SnappyCodec,
com.hadoop.compression.lzo.LzoCodec,
com.hadoop.compression.lzo.LzopCodec
</value>
</property>
<property>
<name>io.compression.codec.lzo.class</name>
<value>com.hadoop.compression.lzo.LzoCodec</value>
</property>

4.3)重新启动hdfs集群


http://www.niftyadmin.cn/n/877026.html

相关文章

Flume的简单案例一 监听端口并读取数据

1&#xff09;创建Flume Agent配置文件 flume-telnet-logger.conf 2&#xff09;在配置文件中添加以下内容 参照https://flume.apache.org/FlumeUserGuide [usernewbie job]$ cat flume-telnet-logger.conf # example.conf: A single-node Flume configuration# Name the com…

Flume的简单案例二 读取本地文件

1&#xff09;创建Flume Agent配置文件 flume-file-logger.conf 2&#xff09;在配置文件中添加以下内容 参照https://flume.apache.org/FlumeUserGuide # example.conf: A single-node Flume configuration# Name the components on this agent a2.sources r2 a2.sinks k2 …

Kafka简介及安装

Kafka简介 Kafka是一个分布式的基于发布/订阅模式的消息队列&#xff0c;主要应用于大数据实时处理领域。它和flume类似&#xff0c;它的优点是broker处理书记的方法多样灵活&#xff0c;缺点是接口没有flume的接口丰富。 Consumer端同一个group的consumer不能同时消费Broker…

HIVE以及MySQL的安装配置

1&#xff09;卸载已安装的mysql 2&#xff09;安装mysql wget http://repo.mysql.com/mysql80-community-release-el7.rpm rpm -ivh mysql80-community-release-el7.rpm yum install mysql-server #chown user:user -R /var/lib/mysql mysqld --initialize systemctl start m…

Zookeeper简介及安装,以及Hadoop的HA集群(hdfs的namenode和yarn的resourcemanager)配置

Zookeeper是一个分布式的&#xff0c;开放源码的分布式应用程序协调服务&#xff0c;是Google的Chubby一个开源的实现&#xff0c;是Hadoop和Hbase的重要组件。通常它被用来提供以下服务。 统一命名服务 统一配置服务 统一集群管理 服务器节点动态上下线 软复杂均衡 Zookeepe…

Linux 安装配置 Maven

1) 下载Maven安装包&#xff0c;解压缩 wget https://mirrors.bfsu.edu.cn/apache/maven/maven-3/3.8.1/binaries/apache-maven-3.8.1-bin.zip unzip apache-maven-3.8.1-bin.zip -d maven 2&#xff09;配置环境变量 [userNewBieSlave2 maven]$ cat /etc/profile | grep -i…

使用mybatis操作MySQL中的数据库表1---读取数据

1&#xff09;MySQL中创建表 create table student ( id int(11) not null, name varchar(255) default null, email varchar(255) default null, age int(11) default null, primary key(id) ) ENGINEInnoDB DEFAULT CHARSETutf8; insert into student(id,name,email,age) va…

使用mybatis操作MySQL中的数据库表2---插入数据 以及开启日志

1&#xff09;在接口studenDAO.java中加入如下内容。 public int insertStudent(Student student); 2) 修改文件StudentDAO.xml加入以下内容。 <mapper> <insert id"insertStudent"> insert into student values (#{id},#{name},#{email},#{age}) <…