全球旧事资料 分类
个文件的权限是rwrwr,这个文件所有者的权限是(Areado
lyBreadwriteCwriteDreadwriteexcute
)。
14、IBM大数据平台和应用程序框架,(构化信息。A流计算
)以经济高效的方式分析PB级的结构化和非结
fBHadoopC数据仓库D语境搜索
15、大数据的价值是通过数据共享、(A算法共享B共享应用C数据交换D交叉复用
)后获取最大的数据价值。
16、大数据工程指大数据的(A大数据网络发展和运营过程B规划建设运营管理C规律和验证D发现和验证
)的系统工程。
17、规则Ij“有可能”,等于所有包含I的购物篮中同时包含J的购物篮的比例,为(A置信度B可信度C兴趣度D支持度
)。
18、MapReduce的Map函数产生很多的(AkeyBvalue
)。
fCkeyvalueDHash
19、(
)程序负责HDFS数据存储。
ANameNodeBJobtrackerCData
odeDTasktracker
20、设有关系R(SDM),其函数依赖集FS→DD→M。则关系R至多满足(A1NFB2NFC3NFDBCNF
)。
21、下列(ACPUB网络C磁盘D内存
)通常是集群的最主要瓶颈。
22、Thrashi
g指的是(A非常频繁的换页活动
)。
B非常高的CPU执行活动C一个极长的执行过程
fD一个极大的虚拟内存法
23、Belady’sA
omaly出现在(A内存管理算法B内存换页算法C预防死锁算法D磁盘调度算法
)。
24、关于Seco
daryNameNode正确的是(A它是NameNode的热备B它对内存没有要求
)。
C它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间DSeco
daryNameNode应与NameNode部署到一个节点
25、并发控制的总体思想是(A正确调度相冲突的操作B对事务进行管理C进行数据的更新D有序的通信
)。
二、简述题(共2题)1、Hadoop集群可以运行的3个模式分别是什么,都有哪些注意点?
f2、NoSQL数据库是什么意思为什么要使用和不使用NoSQL数据库列出NoSQL数据库的几个优点
三、综合设计题(共2题)1、提供40亿个不重复的u
sig
edi
t的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?
2、某监管部门需要更新内部数据存储系统。根据其业务需求,每日将产生的数据量峰值为1亿条,每条数据大小约为05KB,现在需要将过往几年的历史数据和持续产生的实时数据迁移到新的集群架构中,使得其具有高的读写性能和较高的分析效率。根据以上需求设计出适合的分布式存储系统架构(需注明所需设备的硬件参数)。
fr
好听全球资料 返回顶部