大数据技术原理和应用林子雨版课后习题答案解析 联系客服

发布时间 : 星期一 文章大数据技术原理和应用林子雨版课后习题答案解析更新完毕开始阅读

.

多表连接 无法实现表与表之间关联 存储模式 基于行模式存储,元组或基于列存储,每个列族都行会被连续地存储在磁由几个文件保存,不同列盘也中 族的文件是分离的 数据索引 针对不同列构建复杂的只有一个行键索引 多个索引 数据维护 用最新的当前值去替换更新操作不会删除数据记录中原来的旧值 旧的版本,而是生成一个新的版本 可伸缩性 很难实现横向扩展,纵向轻易地通过在集群中增扩展的空间也比较有限 加或者减少硬件数量来实现性能的伸缩

4. HBase有哪些类型的访问接口?

答:HBase提供了Native Java API , HBase Shell , Thrift Gateway , REST GateWay , Pig , Hive 等访问接口。

5. 请以实例说明HBase数据模型。

.

.

答: Name 201505001 201505002 201505003 Luo Min Liu Jun Xie You 列限定符 列族 Info Major Math Math Math Email Luoqq. liuqq. xieqq. you163. 行键

单元格 单元格有两个时间戳ts1和ts2 每个时间戳对应一个数据版本 6. 分别解释HBase中行键、列键和时间戳的概念

(1) 行键是唯一的,在一个表里只出现一次,否则就是在更新同一行,行键可以是任意的字节数组。

(2) 列族需要在创建表的时候就定义好,数量也不宜过多。列族名必须由可打印字符组成,创建表的时候不需要定义好列。

(3) 时间戳,默认由系统指定,用户也可以显示设置。使用不同的时间戳来区分

.

.

不同的版本。

7. 请举个实例来阐述HBase的概念视图和物理视图的不同

HBase数据概念视图

行键 “.cnn.” 时间戳 T5 列族contents 列族anchor Anchor:cnnsi.=”CNN” T3 Anchor:my.look.ca=”CNN” “.cnn.” T3 Content:html=” ...” T2 Content:html=” ...” T1 Content:html=” ...”

HBase数据物理视图

行键 “.cnn.” 时间戳 T5 列族anchor Anchor:cnnsi.=”.

.

CNN” T4 Anchor:my.look.ca=”CNN”

行键 “.cnn.” 时间戳 T3 列族contents Content:html=”...” T2 Content:html=”...” T1 Content:html=”...”

在HBase的概念视图中,一个表可以视为一个稀疏、多维的映射关系。 在物理视图中,一个表会按照属于同一列族的数据保存在一起

8. 试述HBase各功能组建及其作用 (1)库函数:到每个客户端;

(2)一个Master主服务器:主服务器Master主要负责表和Region的管理工作;

.