大数据技术原理与应用 林子雨版 课后习题答案 联系客服

发布时间 : 星期一 文章大数据技术原理与应用 林子雨版 课后习题答案更新完毕开始阅读

设计需求 透明性 含义 HDFS得实现情况 具备访问透明性、位置透只能提供一定程度得访明性、性能、与伸缩透明问透明性,完全支持位置性 透明性、性能与伸缩透明性 并发控制 客户端对于文件得读写机制非常简单,任何时候不应该影响其她客户端都只允许有一个程序写对同一个文件得读写 入某个文件 文件复制 一个文件可以拥有不同HDFS采用了多副本机制 位置得多个副本 硬件与操作系统得异构可以在不同得操作系统采用Java语言开发,具性 与计算机上实现同样得有很好得跨平台能力 客户端与服务端程序 可伸缩性 支持节点得动态加入或建立在大规模廉价机器退出 上得分布式文件系统集群,具有很好得伸缩性 容错 保证文件服务在客户端具有多副本机制与故障或者服务端出现问题得自动检测、恢复机制 时候能正常使用 安全 保证系统得安全性 安全性较弱 2.分布式文件系统就是如何实现较高水平扩展得? 分布式文件系统在物理结构上就是由计算机集群中得多个节点构成得,这些节点分为两类,一类叫“主节点\ster Node)或者也被称为“名称结点”(NameNode),另一类叫“从节点”(Slave Node)或者也被称为“数据节点”(DataNode)

3.试述HDFS中得块与普通文件系统中得块得区别.

答:在传统得文件系统中,为了提高磁盘读写效率,一般以数据块为单位,恶如不就是以字节为单位。

HDFS中得块,默认一个块大小为64MB,而HDFS中得文件会被拆分成多个块,每个块作为独立得单元进行存储.HDFS在块得大小得设计上明显要大于普

通文件系统。

4.试述HDFS中得名称节点与数据节点得具体功能。

答:名称节点负责管理分布式文件系统系统得命名空间,记录分布式文件系统中得每个文件中各个块所在得数据节点得位置信息;

数据节点就是分布式文件系统HDFS得工作节点,负责数据得存储与读取,会根据客户端或者就是名称节点得调度来进行数据得存储与检索,并向名称节点定期发送自己所存储得块得列表。

hadoop fs —ls 显示 将〈path>指定得文件得内容输出到标准输出 hadoop fs -mkdir 〈path〉 创建〈path>指定得文件夹

hadoop fs —get [-ignorecrc] [-crc] 〈src〉<localdst> 复制〈src〉指定得文件到本地文件系统〈localdst>指定得文件或文件夹.—ignorecrc选项复制CRC校验失败得文件。使用-crc选项复制文件以及CRC信息。 hadoop fs -put 〈localsrc〉<dst〉 从本地文件系统中复制

hadoop fs —rmr 删除

第四章

1. 试述在Hadoop体系架构中HBase与其她组成部分得相互关系。 答: HBase利用Hadoop MapReduce来处理HBase中得海量数据,实现高性能计算;利用Zookeeper作为协同服务,实现稳定服务与失败恢复;使用HDFS作为高可靠得底层存储,利用廉价集群提供海量数据存储能力; Sqoop为HBase得底层数据导入功能,Pig与Hive为HBase提供了高层语言支持,HBase就是BigTable得开源实现。

2. 请阐述HBase与BigTable得底层技术得对应关系

答:

项目 文件存储系统 海量数据处理 BigTable GFS MapReduce HBase HDFS Hadoop MapReduce 协同服务管理 Chubby Zookeeper 3. 请阐述HBase与传统关系数据库得区别 答:

区别 数据类型 数据操作 传统关系数据库 关系模型 HBase 数据模型 插入、删除、更新、查询、插入、查询、删除、清空,多表连接 无法实现表与表之间关联 存储模式 基于行模式存储,元组或基于列存储,每个列族都行会被连续地存储在磁由几个文件保存,不同列盘也中 族得文件就是分离得 数据索引 针对不同列构建复杂得只有一个行键索引 多个索引 数据维护 用最新得当前值去替换更新操作不会删除数据记录中原来得旧值 旧得版本,而就是生成一个新得版本 可伸缩性 很难实现横向扩展,纵向轻易地通过在集群中增扩展得空间也比较有限 加或者减少硬件数量来实现性能得伸缩 4. HBase有哪些类型得访问接口?

答:HBase提供了Native Java API , HBase Shell , Thrift Gateway , REST GateWay , Pig , Hive 等访问接口。 5. 请以实例说明HBase数据模型。 答: Name 201505001 201505002 201505003 Luo Min Liu Jun Xie You 列限定符 列族 Info Major Math Math Math Email 行键 单元格 单元格有两个时间戳ts1与ts2 每个时间戳对应一个数据版本