【大数据入门核心技术-Hbase】(二)HBase数据模型

news/2024/5/20 4:02:58 标签: hbase, 大数据, 分布式, hdfs, hadoop

目录

一、NameSpace

二、Region

三、Row

四、Column

五、Cell

六、RowKey

七、Store

八、TimeStamp


一、NameSpace


        命名空间,类似于关系型数据库的 DatabBase 概念,每个命名空间下有多个表。HBase 有两个自带的命名空间,分别是 hbase 和 default,hbase 中存放的是 HBase 内置的表, default 表是用户默认使用的命名空间。

二、Region


        类似于关系型数据库的表概念。不同的是,HBase 定义表时只需要声明列族即可,不需 要声明具体的列。这意味着,往 HBase 写入数据时,字段可以动态、按需指定。因此,和关 系型数据库相比,HBase 能够轻松应对字段变更的场景。

三、Row


        HBase 表中的每行数据都由一个 RowKey 和多个 Column(列)组成,数据是按照 RowKey 的字典顺序存储的,并且查询数据时只能根据 RowKey 进行检索,所以 RowKey 的设计十分重要。

四、Column


        HBase 中的每个列都由 Column Family(列族)和 Column Qualifier(列限定符)进行限 定,例如 info:name,info:age。建表时,只需指明列族,而列限定符无需预先定义。 5)Time Stamp
用于标识数据的不同版本(version),每条数据写入时,如果不指定时间戳,系统会 自动为其加上该字段,其值为写入 HBase 的时间。

五、Cell


        单元格,在表中的同一个位置'某一行的某一列位置',会有多个cell,相同的位置每修改一次,就会生成一个cell。
         由{rowkey,列族:列名,time stamp},进行唯一标识。

六、RowKey

        行的标签,唯一定位行的标识 。

七、Store

        在同一个region中,列族的个数 = store的个数,store有两种:memstore/storefile

八、TimeStamp

        时间戳,表示数据执行的时间,每执行一次操作就会生成一个版本。


http://www.niftyadmin.cn/n/15764.html

相关文章

自动驾驶之3D点云聚类算法调研

1. 方法 总共分为4类 基于欧式距离的聚类Supervoxel 聚类深度(Depth) 聚类Scanline Run 聚类 1.1 基于欧氏距离的聚类 思路: 在点云上构造kd-tree, 然后在某个半径阈值(例如0.5m), 则分割为一个实例。 相似算法: RBNN (radially bounded nearest neighbor graph), 2008. …

山东理工大学pta程序设计---实验七函数 知识点+题目

定义函数 返回类型 函数名(参数1, 参数2…) {//函数体 (返回值, 除了void类型都要有返回值, 跟返回类型对应) ;} int main() {return 0; //向操作系统返回0, 代表程序正常结束 }自定义函数 如果自己写的这个函数写在main函数前面,

UE实现指北针效果

文章目录 1.实现目标2.实现过程2.1 设计指北针Widget2.2 实时指北2.3 添加到页面显示3.参考资料1.实现目标 在UE中实现指北针效果,GIF图如下。 2.实现过程 实现思路较为简单,即获取到当前场景的Rotation,来设置UMG的旋转角度即可。 2.1 设计指北针Widget 包括底图圆环,…

图像处理学习笔记-10-图像分割与边缘检测

图像分割的三大类方法:根据区域间灰度不连续搜寻区域之间的边界,在奇异性检测、边缘连接和边界检测介绍;以像素性质的分布进行阈值处理,在阈值处理介绍;直接搜寻区域进行分割,在基于区域的分割中介绍 奇异…

C++学习笔记(十八)——stack和queue

stack stack的介绍 stack接口的介绍 queue queue的介绍 queue接口的介绍 stack stack的介绍 stack是一种先进后出的容器. stack是一种容器适配器,专门用在具有后进先出(last-in first-out)操作的上下文环境中,其删除只能从容器的一端进行元素的插入与提取操作.stack是作…

OpenCV入门(C++/Python)- 使用OpenCV色彩空间(七)

在本教程中,了解计算机视觉中使用的流行色彩空间,并将其用于基于颜色的分割。 使用OpenCV色彩空间不同的颜色空间RGB颜色空间LAB颜色空间YCrCB 颜色空间HSV颜色空间如何使用这些颜色空间进行分割简单方法文章内容如下:首先,我们将…

数据挖掘——关联规则(Association Rule)Apriori算法和python代码实现

关联规则(Association Rule)什么是关联规则一些基本概念任务是什么Apriori 算法核心思想步骤与流程图如何找到候选集python代码实现什么是关联规则 关联规则(Association Rules)是反映一个事物与其他事物之间的相互依存性和关联性,是数据挖掘…

Web安全测试工具AppScan简述

01 安全测试的对象 了解常见的Web应用安全漏洞,参考OWASP Top 10 2017。 理解这些常见漏洞的攻击原理,如何判断系统是否存在这些漏洞、如何防止这些漏洞。 02 安全测试的实施 SQL注入测试 确认所有的解释器都明确的将不可信数据从命令语句或者查询语…