搜档网
当前位置:搜档网 › 精选新版2020年最新公需科目:《大数据》考试题库(含答案)

精选新版2020年最新公需科目:《大数据》考试题库(含答案)

2020年最新公需科目《大数据》考试题(含答案)

一、选择题

1.下面哪个程序负责 HDFS 数据存储。

a)NameNdeb)Jbtrackerc)Datanded)SecndaryNameNdee)tasktracker

答案.C Datande

二、单选题

2.美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地

点。这体现了大数据分析理念中的(B )。(单选题)

A.在数据基础上倾向于全体数据而不是抽样数据

B.在分析方法上更注重相关分析而不是因果分析

C.在分析效果上更追究效率而不是绝对精确

D.在数据规模上强调相对数据而不是绝对数据

3.下列关于计算机存储容量单位的说法中,错误的是( C)。(单选题)

A.1KB<1MB<1GB

B.基本单位是字节(Byte)

C.一个汉字需要一个字节的存储空间

D.一个字节能够容纳一个英文字符,

三、多选题

4.从传播学角度解释,新兴的网络平台提供了非常大的开放空间,让人们更加有可能享有对信息的()等。ABCD分

A.表达权

B.参与权

C.监督权

D.知情权

5.美国大的猎头公司储备人才考虑的因素包括()。ABCD分

A.智商

B.经历

C.情商

D.价值观

6.大数据的核心是洞察,洞察有以下哪些特色?ABCD分

A.洞察工作重点

B.洞察调度奥妙

C.洞察管理规律

D.洞察未来趋势

7.运用大数据进行大治理要做到()。ABCD分

A.用数据决策

B.用数据管理

C.用数据说话

D.用数据创新

8.对于大数据而言,最基本.最重要的要求就是减少错误.保证质量。因此,大数据收集的信息量要尽量

精确。( F)(判断题)

9.阿兰·图灵在哪一年提出图灵测试的概念?C

A.1952年

B.1954年

C.1950年

D.1955年

10.网球比赛,与其他体育项目一样,涉及大量数据。

正确

错误

11.大数据时代的五个无处不在,具体指的是().服务无处不在。

A.网络无处不在

B.计算无处不在

C.大数据无处不在

D.软件无处不在

12.茂名PX事件发生后,下列哪个学校的化工系学生在网上进行了一场“PX词条保卫战”?

A.复旦

B.清华

C.北大

D.浙大

13.“(b)阿里巴巴?贵州年货节”销售额突破8.5亿元,促进了贵州电子商务加快发展。

A.2015

B.2016

C.2013

D.2014

14.传统的“统治”或“管理”观念认为,公共事务的管理权只属于政府对

15.由于历史的原因,我国医院的信息化建设层次不齐.水平不一。

正确

错误

1.促进大数据发展部级联席会议在哪一年的4月13日召开了第一次会议?C

A.2013年

B.2014年

C.2016年

D.2015年

16.“()阿里巴巴·贵州年货节”销售额突破8.5亿元,促进了贵州电子商务加快发展。D

A.2013

B.2014

C.2015

D.2016

17.根据周琦老师所讲,高德交通报告针对全国()个城市交通状态进行挖掘分析。

A.30

B.21

C.25

■D.38

18.20 世纪中后期至今的媒介革命,以()的出现为标志。

■A.互联网

B.自动化

■C.计算机■D.数字化

19.2015年,贵州全省大数据服务器规模为100余万台,规划建设服务器规模1000万台。错

四、论述题

20.(D )反映数据的精细化程度,越细化的数据,价值越高。

A.规模

B.活性

C.关联度

D.颗粒度

21.具备很强的报告撰写能力,可以把分析结果通过文字.图表.可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求。(F )是否

22.《国务院办公厅关于深入实施“互联网+流通”行动计划的意见》要求.支持建设农产品流通全程冷链系统。√分

正确错误

23.当前大数据技术的基础是由( C)首先提出的。

A.微软

B.百度

C.谷歌

D.阿里巴巴

24.智慧城市的构建,不包含(C)

A.数字城市B。物联网C。联网监控D。云计算

25.以下选项中,不属于大数据对人才能力的要求是c分)得分.0分

A.业务能力

B.数学统计能力

C.IT技术能力

D.逻辑思维能力

26.传统数据密集型行业积极探索和布局大数据应用的表现是( BCE)。 A.投资入股互联网电商行业 B.打通多源跨域数据

C.提高分析挖掘能力

D.自行开发数据产品

E.实现科学决策与运营

27.下列关于数据重组的说法中,错误的是( A)。

A.数据重组是数据的重新生产和重新采集

B.数据重组能够使数据焕发新的光芒

C.数据重组实现的关键在于多源数据融合和数据集成

D.数据重组有利于实现新颖的数据模式创新

28.大数据的本质是A

A.洞察

B.搜集

C.联系

D.挖掘

29.2015年,贵州全省大数据服务器规模为100余万台,规划建设服务器规模1000万台。

正确

错误√

30.支撑大数据业务的基础是(A)

A.数据科学B。数据应用C。数据硬件D。数据人才

31.根据周琦老师所讲,以下哪项不属于数据挖掘的内容?(单选题1分)

A.建立道路拥堵概率与拥堵趋势变化模型

B.多维分析统计用户出行规律

C.高德地图导航有躲避拥堵功能√

D.补充与完善路网属性

32.云计算使得使用信息的存储是一个(ABCD)的方式,它会大大地节约网络的成本,使得网络将来越来越泛在.越来越普及,成本越来越低。(多选题3分)得分.0分

A.共享式

B.密闭式

C.密集式

D.分布式

33.2008年以后,第(D)信息传输技术.传输2亿路信号。(单选题1分)得分.0分

A.三代

B.一代

C.二代

D.四代

34.在美国的大数据大棋中,“五眼”是指配合美国进行全球监控的包含美国.英国.加拿大兰在内的五个国家(T)是否

35.数据化就是数字化,是相互等同的关系。×分

正确

错误

36.智能健康手环的应用开发,体现了(D)的数据采集技术的应用

A.统计报表B。网络爬虫C。API接口D。传感器

37.20世纪50年代-80年代,第一代信息传输技术只能传输4380路信号。√分.1分得正确错误

38.大数据的应用之一是,促进健康管理的个性化和多元化。√分

正确错误

39.宁家骏委员指出,20世纪下半个世纪直至现在,是信息技术时代。分

正确1

错误

40.当前大数据技术的基础是由( C)首先提出的。

A.微软

B.百度

C.谷歌

D.阿里巴巴

41.下列关于计算机存储容量单位换算关系的公式中,正确的是( BE)

A.1KB=1012Byte B。1KB=1024Byte C。1GB=1024KB D。1GB=1012KB E。1GB=1024MB

42.大数据的低耗能存储及高效率计算的要求,需要以下多种技术协同合作(ABCD)

A.分布式云存储技术B。高性能并行计算技术C。多源数据清洗及数据整合技术D。分布式文件系统及分布式并行数据库E。可视化高维度展示技术

43.可以对大数据进行深度分析的平台工具是(C)

A.传统的机器学习和数据分析肛具B。第二代机器学习工具C。第二代机器学习工具D。未来机器学习工具

44.云计算使得使用信息的存储是一个()的方式,它会大大地节约网络的成本,使得网络将来越来越泛在.越来越普及,成本越来越低。(多选题3分)分

A.密集式

B.分布式√

C.共享式√

D.密闭式

45.请简述Map-Reduce算法的原理?

Map-Reduce的目标是在面对节点失效的情况时能够保证大量的文件和数据依然可用。

初始化时数据被分割成许多分块的小数据,这些数据都是以的形式存储。用户程序会分配一个Maser 进程和许多wrker 进程。

任务开始时,Maser 将用户程序的工作分成两种类型的任务(map 任务和reduce 任务),并将这些任务分配给相应的工人(wrkers)。Maser 的责任如下.给map 工人和reduce 工人分配相应的任务,检测是否有工人进程死掉,将Map 任务处理后的结果通知给Reduce 任务。

得到Maser 的Map 工作任务的指令后,Map 工人开始工作。Map 工人从input中获取分块的数据,并通过其中数据存储的方式对数据进行处理,并将处理的中间结果(形成的链表)存放在本地磁盘中。

得到Maser 的有关Map 处理结果的通知后,Reduce 任务开始工作。Reduce 工人把每个map 工人的本地磁盘中的内容进行整合,形成有序的最终结果,并将结果写入到输出文件

中。

假如一个工人进程失败了,该工人的任务就被分配给其他的工人进程。如果一个Maser 进程失败了,那么整个Map-Reduce任务就会终止。

1.输入文件分成M 块,每块大概16M~64MB(可以通过参数决定),接着在集群的机器上执行分派处理程序。

2.M 个Map 任务和R 个Reduce 任务需要分派,Maser 选择空闲Wrker 来分配这些Map 或Reduce 任务。

3.Wrker 读取并处理相关输入块,Map 函数产生的中间结果对暂时缓冲到内存。

4.中间结果定时写到本地硬盘,分区函数将其分成R 个区。中间结果在本地硬盘的位置信息将被发送回Maser,然后Maser 负责把这些位置信息传送给ReduceWrker。

5.当Maser 通知执行Reduce 的Wrker 关于中间对的位置时,它调用远程过程,从Map Wrker 的本地硬盘上读取缓冲的中间数据。当Reduce Wrker读到所有的中间数据,它就使用中间key 进行排序,这样可使相同key 的值都在一起。

6.Reduce Wrker 根据每一个唯一中间key 来遍历所有的排序后的中间数据,并且把key 和相关的中间结果值集合传递给用户定义的Reduce 函数。Reduce 函数的结果写到一个最终的输出文件。

7.当所有的Map 任务和Reduce 任务都完成的时候,Maser 激活用户程序。此时MapReduce 返回用户程序的调用点。

1.2014年2月27日,中共中央总书记.国家主席.中央军委主席.中央网络安全和信息化领导小组组长习近平2月27日下午主持召开中央网络安全和信息化领导小组第一次会议并发表重要讲话。他强调,()和(A)是事关国家安全和国家发展.事关广大人民群众工作生活的重大战略问题。

A.网络安全.信息化

B.信息安全.信息化

C.安全.发展

D.网络安全.信息安全

46.《国家信息化领导小组关于加强信息安全保障工作的意见》([2003]27号),简称“27号文”,它的诞生标志着我国信息安全保障工作有了总体纲领,其中提出要在5年内建设中国信息安全保障体系。√分

正确

错误

47.关于大数据在社会综合治理中的作用,以下理解不正确的是(c )。

A.大数据的运用能够维护社会治安

B.大数据的运用能够加强交通管理

C.大数据的运用能够杜绝抗生素的滥用

D.大数据的运用有利于走群众路线

48.下列选项中,属于贵州发展大数据的先天优势的是(abcd)。(多选题3

A.空气清新

B.远离地震带

C.气候凉爽

D.电力资源充沛

49.云计算使得使用信息的存储是一个(abcd)的方式,它会大大地节约网络的成本,使得网络将来越来越泛在.越来越普及,成本越来越低。(多选题3分)得分.0

A.分布式

B.密闭式

C.密集式

D.共享式

50.智慧城市的构建,不包含( C)。

A.数字城市

B.物联网

C.联网监控

D.云计算

相关主题