1. 下面哪个程序负责 HDFS 数据存储。 (C )
A. NameNode B.Jobtracker
C. Datanode D. secondaryNameNode
2. HDFS 中的 block 默认保存几个备份。 ( A )
A. 3 份 B. 2 份
C. 1 份 D. 不确定
3. HDFS1.0 默认 Block Size大小是多少。 ( B )
A. 32MB B. 64MB
C. 128MB D. 256MB
4. 下面哪个进程负责 MapReduce 任务调度。 ( B )
A. NameNode B. Jobtracker
C. TaskTracker D. secondaryNameNode
5. Hadoop1.0默认的调度器策略是哪个。 (A )
A. 先进先出调度器 B. 计算能力调度器
C. 公平调度器 D. 优先级调度器
6. Client 端上传文件的时候下列哪项正确? ( B )
A. 数据经过 NameNode 传递给 DataNode
B. Client 端将文件切分为 Block,依次上传
C. Client 只上传数据到一台 DataNode,然后由 NameNode 负责 Block 复制工作
D. 以上都不正确
7. 在实验集群的master节点使用jps命令查看进程时,终端出现以下哪项能说明Hadoop主节点启动成功? ( D )
A. Namenode,Datanode, TaskTracker
B. Namenode,Datanode, secondaryNameNode
C. Namenode,Datanode, HMaster
D. Namenode,JobTracker, secondaryNameNode
8. 若不针对MapReduce编程模型中的key和value值进行特别设置,下列哪一项是MapReduce不适宜的运算。 ( D )
A. Max B. Min
C. Count D. Average
9. MapReduce编程模型,键值对<key, value>的key必须实现哪个接口? ( A )
A.WritableComparable B. Comparable
C. Writable D. LongWritable
10. 以下哪一项属于非结构化数据。(C)
A. 企业ERP数据 B. 财务系统数据
C. 视频监控数据 D. 日志数据
11. Hbase数据库的BlockCache缓存的数据块中,哪一项不一定能提高效率。 (D )
A. –ROOT-表 B. .meta.表
C. HFile index D. 普通的数据块
12. Hbase是分布式列式存储系统,记录按什么集中存放。 (A )
A. 列族 B. 列
C. 行 D. 不确定
13. Hbase的Region组成中,必须要有以下哪一项。 ( B )
A. StoreFile B. MemStore
C. HFile D. metaStore
14. 客户端首次查询Hbase数据库时,首先需要从哪个表开始查找。 ( B )
A. .meta. B. –ROOT-
C. 用户表 D. 信息表
15、设计分布式数据仓库hive的数据表时,为取样更高效,一般可以对表中的连续字段进行什么操作。 ( A )
A. 分桶 B. 分区
C. 索引 D. 分表
得分
评卷人
二、判断题(每题 2 分,共 16 分)
请在下表中填写√或者×,写在试题后无效。
题号
1
2
3
4
5
6
7
8
答案
- 1001抖音小店入驻指南,详细介绍抖音小店开通条件和申请流程
- 100218个生活中简单的小改变,能让你健康变瘦
- 1003外贸关键词搜索工具网站大全,外贸必备!
- 1004JAVAEE——Lucene基础:什么是全文检索、Lucene实现全文检索的流程、配置开发环境、索引库创建与管理
- 1005艺人霸屏指数排名:赵丽颖无奈垫底,王一博仅第七,榜首是真大佬
- 1006(网站测速)测速域名ping+域名
- 1007罗云熙、白鹿《长月烬明》收官,德塔文、V榜及猫眼数据大盘点
- 1008近期白肺患者变多了?最新回应!有人感染后没发烧,双肺却已白化…这些情况做个CT很有必要→
- 1009更新、更快、更优——第三届进博会的三大“关键词”