推广 热搜: 行业  机械  设备    经纪  教师  系统  参数    蒸汽 

大数据期末复习题目汇总

   日期:2024-11-07     移动:http://yishengsujiao.xhstdz.com/quote/2418.html

1. 下面哪个程序负责 HDFS 数据存储。                 (C   )

大数据期末复习题目汇总

A. NameNode      B.Jobtracker

C. Datanode      D. secondaryNameNode

2.  HDFS 中的 block 默认保存几个备份。             ( A 

A. 3 份          B. 2 份

C. 1 份          D. 不确定

3.  HDFS1.0 默认 Block Size大小是多少。            ( B  )

A. 32MB          B. 64MB

C. 128MB        D. 256MB

 

4. 下面哪个进程负责 MapReduce 任务调度。                ( B 

A. NameNode           B. Jobtracker

C. TaskTracker        D. secondaryNameNode

5. Hadoop1.0默认的调度器策略是哪个。                    (A  )

A. 先进先出调度器     B. 计算能力调度器

C. 公平调度器         D. 优先级调度器

6. Client 端上传文件的时候下列哪项正确?                 (  B )

A. 数据经过 NameNode 传递给 DataNode

B. Client 端将文件切分为 Block,依次上传

C. Client 只上传数据到一台 DataNode,然后由 NameNode 负责 Block 复制工作

D. 以上都不正确

7. 在实验集群的master节点使用jps命令查看进程时,终端出现以下哪项能说明Hadoop主节点启动成功?                                               (  D )

A. Namenode,Datanode, TaskTracker      

B. Namenode,Datanode, secondaryNameNode

C. Namenode,Datanode, HMaster  

D. Namenode,JobTracker, secondaryNameNode

8. 若不针对MapReduce编程模型中的key和value值进行特别设置,下列哪一项是MapReduce不适宜的运算。                                               (  D )

A. Max                B. Min

C. Count              D. Average

9. MapReduce编程模型,键值对<key, value>的key必须实现哪个接口?       ( A  )

A.WritableComparable    B. Comparable

C. Writable              D. LongWritable

10. 以下哪一项属于非结构化数据。(C)

A. 企业ERP数据          B. 财务系统数据

C. 视频监控数据          D. 日志数据

11. Hbase数据库的BlockCache缓存的数据块中,哪一项不一定能提高效率。   (D  )

A. –ROOT-表             B. .meta.表

C. HFile index           D. 普通的数据块

12. Hbase是分布式列式存储系统,记录按什么集中存放。                    (A  )

A. 列族                  B. 列

C. 行                    D. 不确定

13. Hbase的Region组成中,必须要有以下哪一项。                         (  B )

A. StoreFile             B. MemStore

C. HFile                 D. metaStore

14. 客户端首次查询Hbase数据库时,首先需要从哪个表开始查找。            ( B  )

A. .meta.                B. –ROOT-

C. 用户表                D. 信息表

15、设计分布式数据仓库hive的数据表时,为取样更高效,一般可以对表中的连续字段进行什么操作。                                                               (  A )

A. 分桶                  B. 分区

 C. 索引                  D. 分表

得分

评卷人

 

 

 

二、判断题(每题 2 分,共 16 分)

请在下表中填写√或者×,写在试题后无效。

 

题号

1

2

3

4

5

6

7

8

答案

本文地址:http://nhjcxspj.xhstdz.com/quote/2418.html    物流园资讯网 http://nhjcxspj.xhstdz.com/ , 查看更多

特别提示:本信息由相关企业自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


0相关评论
相关行业动态
推荐行业动态
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号