搜档网
当前位置:搜档网 › 大数据考试答案分析

大数据考试答案分析

大数据考试答案分析
大数据考试答案分析

1、当前大数据技术的基础是由(C)首先提出的。(单选题,本题2分)

A:微软B:百度C:谷歌D:阿里巴巴

2、大数据的起源是( C )。(单选题,本题2分)

A:金融B:电信C:互联网D:公共管理

3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。(单选题,本题2分)

A:数据管理人员B:数据分析员C:研究科学家D:软件开发工程师4、(D )反映数据的精细化程度,越细化的数据,价值越高。(单选题,本题2分)

A:规模B:活性C:关联度D:颗粒度

5、数据清洗的方法不包括(D)。(单选题,本题2分)

A:缺失值处理B:噪声数据清除C:一致性检查D:重复数据记录处理

6、下列关于普查的缺点的说法中,正确的是(A)

A、工作量大,容易导致调查内容有限,产生重复和遗漏现象

B、误差不易被控制

C、对样本的依赖性和比较性

D、评测结果不够稳定

7、智能健康手环的应用开发,体现了(D)的数据采集技术的应用。

A:统计报表B:网络爬虫C:API接口D:传感器

8、智慧城市的智慧之源使(C)

A:数字城市B:物联网C:大数据D:云计算

9、下列关于数据重组的说法中,错误的是(A)。(单选题,本题2分)

A:数据重组是数据的重新生产和重新采集

B:数据重组能够使数据焕发新的光芒

C:数据重组实现的关键在于多源数据融合和数据集成

D:数据重组有利于实现新颖的数据模式创新

10、智慧城市的构建,不包含(C)。(单选题,本题2分)

A:数字城市B:物联网C:联网监控D:云计算

11、大数据的最显著特征是(A)。(单选题,本题2分)

A:数据规模大B:数据类型多样

C:数据处理速度快D:数据价值密度高

12、假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使(A)。

A:因果相关B:相关因果C:并列相关D:因果并列13、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风

与洋流可能发生的地点。这体现了大数据分析理念中的( B )。(单选题,本题2分)A:在数据基础上倾向于全体数据而不是抽样数据

B:在分析方法上更注重相关分析而不是因果分析

C:在分析效果上更追究效率而不是绝对精确

D:在数据规模上强调相对数据而不是绝对数据

14、下列关于舍恩伯格对大数据特点的说法中,错误的是( D )。(单选题,本题2分)A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高15、当前社会中,最为突出的大数据环境是( A )。(单选题,本题2分)

A:互联网B:物联网C:综合国力D:自然资源

16、在数据生命周期管理实践中,(B)是执行方法。(单选题,本题2分)

A:数据存储和备份规范B:数据管理和维护

C:数据价值发觉和利用D:数据应用开发和管理

17、下列关于网络用户行为的说法中,错误的是(C)。(单选题,本题2分)

A:网络公司能够捕捉到用户在其网站上的所有行为

B:用户离散的交互痕迹能够为企业提升服务质量提供参考

C:数字轨迹用完即自动删除

D:用户的隐私安全很难得以规范保护

18、下列关于计算机存储容量单位的说法中,错误的是(C)。(单选题,本题2分)

A:1KB<1MB<1GB B:基本单位是字节(Byte)

C:一个汉字需要一个字节的存储空间D:一个字节能够容纳一个英文字符,19、下列关于聚类挖掘技术的说法中,错误的是( B )。(单选题,本题2分)

A:不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别

B:要求同类数据的内容相似度尽可能小

C:要求不同类数据的内容相似度尽可能小

D:与分类挖掘技术相似的是,都是要对数据进行分类处理

20、下列国家的大数据发展行动中,集中体现“重视基础、首都先行”的国家是(D)。(单选题,本题2分)

A:美国B:日本C:中国D:韩国

21、下列演示方式中,不属于传统统计图方式的是(D)。(单选题,本题2分)

A:柱形图B:饼状图C:曲线图D:网络图

22、可以对大数据进行深度分析的平台工具是(C)。(单选题,本题2分)

A:传统的机器学习和数据分析工具B:第二代机器学习工具

C:第三代机器学习工具D:未来机器学习工具

23、下列关于大数据的分析理念的说法中,错误的是( D )。(单选题,本题2分)

A:在数据基础上倾向于全体数据而不是抽样数据

B:在分析方法上更注重相关分析而不是因果分析

C:在分析效果上更追究效率而不是绝对精确

D:在数据规模上强调相对数据而不是绝对数据

24、通过一系列处理,在基本保持原始数据完整性的基础上,减少数据规模的大小(C)。(单选题,本题2分)

A:数据清洗B:数据融合C:数据规约D:数据挖掘

25、面向用户提供大数据一站式部署方案,包括数据中心和服务器等硬件,数据分析应用

软件及技术运维等多方面内容的大数据商业模式使(A)。(单选题,本题2分)A:大数据解决方案模式B:大数据信息分类模式

C:大数据处理服务模式D:大数据志愿提供模式

26、万维网之父是(C)。(单选题,本题2分)

A:彼得·德鲁克B:舍恩伯格

C:蒂姆·伯纳斯-李D:斯科特·布朗

27、下列各国大数据发展路径的描述中,对应关系正确的是(ACDE)。

A:彼得·德鲁克B:舍恩伯格

C:蒂姆·伯纳斯-李D:斯科特·布朗

28、Mac OS系统的开发者是( C )。(单选题,本题2分)

A:微软公司B:惠普公司C:苹果公司D:IBM公司

29、大数据时代,数据使用的关键是(D)。(单选题,本题2分)

A:数据收集B:数据存储C:数据分析D:数据再利用30、下列关于数据交易市场的说法中,错误的是(C)。(单选题,本题2分)

A:数据交易市场是大数据产业发展到一定程度的产物

B:商业化的数据交易活动催生了多方参与的第三方数据交易市场

C:数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助

D:数据交易市场是大数据资源化的必然产物

31、下列论据中,能够支撑“大数据无所不能”的观点的是(A)。(单选题,本题2分)

A:互联网金融打破了传统的观念和行为B:大数据存在泡沫

C:大数据具有非常高的成本D:个人隐私泄露与信息安全担忧

32、数据仓库的最终目的是( D )。(单选题,本题2分)

A:收集业务需求B:建立数据仓库逻辑模型

C:开发数据仓库的应用分析D:为用户和业务部门提供决策支持33、支撑大数据业务的基础是(B)。(单选题,本题2分)

A:数据科学B:数据应用C:数据硬件D:数据人才34、下列各国大数据发展路径的描述中,对应关系正确的是(ACDE)。

A:日本:走尖端IT路线B:英国:视大数据为新的自然资源

C:韩国:重视基础,首都先行D:印度:以IT外包转型为突破口

E:澳大利亚:原则先行,谨慎发展

35、按照服务目的,数据流通平台可分为(CDE)。

A:政府数据开发平台B:企业数据开放平台C:数据交易市场

D:数据研发市场E:数据废气交易市场

36、下列论据中,能够支撑“大数据无所不能”的观点的是(ADE)。

A:互联网金融打破了传统的观念和行为B:大数据存在泡沫

C:大数据具有非常高的成本D:大数据医疗正在走进平民百姓

E:数据资产型企业前景光明

37、大数据的价值体现在(ABCDE)。

A:大数据给思维方式带来了冲击B:大数据为政策制定提供科学依据

C:大数据助力智慧城市提升公共服务水平

D:大数据实现了精准营销E:大数据的发力点在于预测

38、当前大数据技术的基础包括()。

A:分布式文件系统B:分布式并列计算C:关系型数据库

D:分布式数据库E:非关系型数据库

39、可可视化高维展示技术在展示数据之间的关系以及数据分析结果方面的作用(bD)。

A:能够直观反映成对数据之间的空间关系

B:能够直观反映多维数据之间的空间关系

C:能够静态演化失误的变化及变化的规律

D:能够动态演化失误的变化及变化的规律

E:提供高性能并行计算计算的强力支撑

40、在网络爬虫的爬行策略中,应用最为基础的是(AB )。(多选题,本题3分)

A:深度优先遍历策略B:广度优先遍历策略C:高度优先遍历策略

D:反向链接策略E:大站优先策略

41、当前,大数据产业发展的特点是(ACE )。(多选题,本题3分)

A:规模较大B:规模较小C:增速很快

D:增速缓慢E:多产业交叉融合

42、下列关于数据生命周期管理的核心认识中,正确的是(ABC )。选题,本题3分)

A:数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段

B:在不同的数据存在阶段,数据的价值是不同的

C:根据数据价值的不同应该对数据采取不同的管理策略

D:数据生命周期管理旨在产生效益的同时,降低生产成本

E:数据生命周期管理最终关注的是社会效益

43、下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是(AB)。答案选C更正(多选题,本题3

分)

A:传统营销模式比基于大数据的营销模式投入更小

B:传统营销模式比基于大数据的营销模式针对性更强

C:传统营销模式比基于大数据的营销模式转化率低

D:基于大数据的营销模式比传统营销模式实时性更强

E:基于大数据的营销模式比传统营销模式精准性更强

44、下列关于脏数据的说法中,正确的是(ABCDE)。(多选题,本题3分)

A:格式不规范

B:编码不统一

C:意义不明确

D:与实际业务关系不大

E:数据不完整

45、数据再利用的意义在于(ABC)。(多选题,本题3分)

A:挖掘数据的潜在价值

B:实现数据重组的创新价值

C:利用数据可扩展性拓宽业务领域

D:优化存储设备,降低设备成本

E:提高社会效益,优化社会管理

46、按照涉及自变量的多少,可以将回归分析分为(CD )。(多选题,本题3分)

A:线性回归分析

B:非线性回归分析

C:一元回归分析

D:多元回归分析

E:综合回归分析

47、传统数据密集型行业积极探索和布局大数据应用的表现是(BCE)。(多选题,本题3分)

A:投资入股互联网电商行业

B:打通多源跨域数据

C:提高分析挖掘能力

D:自行开发数据产品

E:实现科学决策与运营

48、大数据人才整体上需要具备(ABE )等核心知识。(多选题,本题3分)

A:数学与统计知识

B:计算机相关知识

C:马克思主义哲学知识

D:市场运营管理知识

E:在特定业务领域的知识

49、下列关于大数据的说法中,错误的是(AD )。(多选题,本题3分)

A:大数据具有体量大、结构单一、时效性强的特征

B:处理大数据需采用新型计算架构和智能算法等新技术

C:大数据的应用注重相关分析而不是因果分析

D:大数据的应用注重因果分析而不是相关分析

E:大数据的目的在于发现新的知识与洞察并进行科学决策

50、下列关于计算机存储容量单位换算的公式中正确的是(BE )。(多选题,本题3分)

A:1KB=1012BYTS

B:1KB=1024BYTS

C:1GB=1024KB

D:1GB=1012MB

E:1GB=1024MB

51、第三方数据处理模式表现为:服务商通过服务或平台即服务云服务形式为用户提供自己

的数据上传到服务商的平台上,由平台进行分析处理,用户可以在线查看相应的结果(是)

52、在美国的大数据大旗中,“五眼”是指配合美国进行全球监控的包括美国、英国、加拿大、兰在内的五个国家。(是)

53、当前,企业提供的大数据解决方案大多基于Ha doop开发项目(是)

54、澳大利亚政府大数据为新的自然资源,积极承担数据提供者的角色,主动披露政府(是)

55、大数据可以分析与挖掘出之前人们不知道或者没注意到的模式,可以从海量数据中发展趋势,虽然也有不精确的时候,但并不能因此而否定大数据挖掘的价值(是)

56、数据资产型企业产品线的盈利,主要通过提供收费服务来获取(是)

57 、在大数据的范围内,应该把用户视为互联网中的数据分子,独立、细致地对其行为进

行行为特征,充分挖掘大数据的价值,变数据为资产(否)

58、在噪声数据中,波动数据比离群点数据偏离整体水平更大。(否)(判断题,本题2分)

59、对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收

集的信息量要尽量

精确。(否F)(判断题,本题2分)

60、一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。

因此分布式数据库

具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。(是T )(判断题,本题2分)

61、具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰

地展现出来,能够

清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的

基本要求。(F否)(判断题,本题2分)

62、谷歌流感趋势充分体现了数据重组和扩展对数据价值的重要意义。(否F)(判断题,本题2分)

63、决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节

点代表最终的分类

结果,其优点在于易于实现,决策时间短,并且适合处理非数值型数据。(是T)(判断题,本题2分)

64、信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。(否F)(判断题,本题2分)

65、简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为

调查对象。在抽取

样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。否(F)(判断题,本题2分)

66、啤酒与尿布的经典案例,充分体现了实验思维在大数据分析理念中的重要性。(否F )(判断题,本题2

分)

67、对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不

同兴趣偏好的用户

最好集中处理。(否F)(判断题,本题2分)

数据分析期末试题及答案

数据分析期末试题及答案 一、人口现状.sav数据中是1992年亚洲各国家和地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)的数据,试用多元回归分析的方法分析各国家和地区平均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的关系。(25分) 解: 1.通过分别绘制地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间散点图初步分析他们之间的关系 上图是以人均GDP(x1)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系。尝试多种模型后采用曲线估计,得出 表示地区平均寿命(y)与人均GDP(x1)的对数有线性关系

上图是以成人识字率(x2)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间基本呈正线性关系。 上图是以疫苗接种率(x3)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系 。 x)为横轴,地区平均寿命(y)为纵轴的散点图,上图是以疫苗接种率(x3)的三次方(3 3 由图可知,他们之间呈正线性关系 所以可以采用如下的线性回归方法分析。

2.线性回归 先用强行进入的方式建立如下线性方程 设Y=β0+β1*(Xi1)+β2*Xi2+β3* X+εi i=1.2 (24) 3i 其中εi(i=1.2……22)相互独立,都服从正态分布N(0,σ^2)且假设其等于方差 R值为0.952,大于0.8,表示两变量间有较强的线性关系。且表示平均寿命(y)的95.2%的信息能由人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)一起表示出来。 建立总体性的假设检验 提出假设检验H0:β1=β2=β3=0,H1,:其中至少有一个非零 得如下方差分析表 上表是方差分析SAS输出结果。由表知,采用的是F分布,F=58.190,对应的检验概率P值是0.000.,小于显著性水平0.05,拒绝原假设,表示总体性假设检验通过了,平均寿命(y)与人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间有高度显著的的线性回归关系。

大数据试题答案与解析_最全

1、当前大数据技术的基础是由( C)首先提出的。(单选题,本题2分) A:微软 B:百度 C:谷歌 D:阿里巴巴 2、大数据的起源是(C )。(单选题,本题2分) A:金融 B:电信 C:互联网 D:公共管理 3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是 ( C)。(单选题,本题2分) A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师 4、(D )反映数据的精细化程度,越细化的数据,价值越高。(单选题,本题2分) A:规模 B:活性 C:关联度 D:颗粒度 5、数据清洗的方法不包括( D)。(单,本题2分)

A:缺失值处理 B:噪声数据清除 C:一致性检查 D:重复数据记录处理 6、智能健康手环的应用开发,体现了( D)的数据采集技术的应用。(单选题,本题2分) A:统计报表 B:网络爬虫 C:API接口 D:传感器 7、下列关于数据重组的说法中,错误的是( A)。(单选题,本题2分) A:数据重组是数据的重新生产和重新采集 B:数据重组能够使数据焕发新的光芒 C:数据重组实现的关键在于多源数据融合和数据集成 D:数据重组有利于实现新颖的数据模式创新 8、智慧城市的构建,不包含( C)。(单选题,本题2分) A:数字城市 B:物联网 C:联网监控 D:云计算 大数据的最显著特征是( A)。(单选题,本题2分) A:数据规模大 B:数据类型多样

C:数据处理速度快 D:数据价值密度高 10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地 点。这体现了大数据分析理念中的(B )。(单选题,本题2分) A:在数据基础上倾向于全体数据而不是抽样数据 B:在分析方法上更注重相关分析而不是因果分析 C:在分析效果上更追究效率而不是绝对精确 D:在数据规模上强调相对数据而不是绝对数据 11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D )。(单选题,本题2分) A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高 12、当前社会中,最为突出的大数据环境是(A )。(单选题,本题2分) A:互联网 B:物联网 C:综合国力 D:自然资源 13、在数据生命周期管理实践中,( B)是(单选题,本题2分) A:数据存储和备份规 B:数据管理和维护 C:数据价值发觉和利用

数据分析练习题

数据分析练习题 第 小组 姓名: 练习一: 1、老师在计算学期总平均分的时候按如下标准:作业占100%、测验占30%、期中占35%、期末考试占35% x 小关 = . x 小兵 = . 2、结果如下表:(单位:小时) 求这些灯泡的平均使用寿命? . x = .小时 3、在一个样本中,2出现了x 1次,3出现了x 2次,4出现了x 3次,5出现了x 4次,则这个样本的平均数为 . 4、某人打靶,有a 次打中x 环,b 次打中y 环,则这个人平均每次中靶 环。 5、某校为了了解学生作课外作业所用时间的情况,对学生作课外作业所用时间进行调查,下表是该校初二某班50名学生某一天做数学课外作业所用时间的情况统计表 (1)、第二组数据的组中值是多少? (2)、求该班学生平均每天做数学作业所用时间 答:(1)组中值为: . (2)解: 6、某公司有15名员工,他们所在的部门及相应每人所创的年利润如下表该公司每人所创年利润的平均数是多少万元?

7、为调查居民生活环境质量,环保局对所辖的50个居民区进行了噪音(单位:分贝)水平的调查,结果如下图,求每个小区噪音的平均分贝数。 8、某公司销售部有营销人员15人,销售部为了制定某种商品的销售金额,统计了这15个人的销售量如下(单位:件) 1800、510、250、250、210、250、210、210、150、210、150、120、120、210、150 求这15个销售员该月销量的中位数和众数。 假设销售部负责人把每位营销员的月销售定额定为320件,你认为合理吗?如果不合理,请你制定一个合理的销售定额并说明理由。 练习二: 1. 数据8、9、9、8、10、8、99、8、10、7、9、9、8的中位数是 ,众数是 2. 一组数据23、27、20、18、X 、12,它的中位数是21,则X 的值是 . 3. 数据92、96、98、100、X 的众数是96,则其中位数和平均数分别是( ) A.97、96 B.96、96.4 C.96、97 D.98、97 4. 如果在一组数据中,23、25、28、22出现的次数依次为2、5、3、4次,并且没有其他的数据, 则这组数据的众数和中位数分别是( ) A.24、25 B.23、24 C.25、25 D.23、25 请你根据上述数据回答问题: (1).该组数据的中位数是什么? (2).若当气温在18℃~25℃为市民“满意温度”,则我市一年中达到市民“满意温度”的大约有多少天? 60 噪音/分贝 80 70 50 40 90

2017年公需科目大数据考试 所有测试题答案

2017年公需科目大数据考试所有测试题答案 (网上收集,经用过还可以,信不过可以不用) 网络时代的国家治理 1. 林雅华博士认为,“治理”是一个全新的政治概念,它既不同于“统治”,也不同 于“管理”。(正确) 2. 互联网时代最为典型的特征是扁平化、单一向度。(错误) 3. 林雅华博士认为,《舌尖上的中国》系列节目之所以获得成功,是网络时代的国家 治理让民众参与进来的有效体现。(正确) 4. 网络时代的国家治理应以文化人、以德化人、以礼化人。(正确) 5. 林雅华博士认为,在越来越复杂化的现代社会中,我们庞大的国家机器也许无法面 面俱到,如果能够广泛地征集群众的智慧,对国家治理而言不失为有效之道。(正确) 6. 我国下列哪些城市曾因PX项目问题发生过群体性事件?(多选题)(ABCD) A.大连 B.镇海 C.昆明 D.厦门 7. 茂名PX事件发生后,下列哪个学校的化工系学生在网上进行了一场“PX词条保卫战”?(单选题)(清华) 8. 林雅华博士指出,在网络时代,电子政务的发展刻不容缓。(正确) 9. 美国首个联邦首席信息官是下列哪位总统任命的?(单选题)(奥巴马) 10. 林雅华博士指出,Windows XP“停服”事件是一个事关我国信息安全的重大事件。(正确) 11. 林雅华博士指出,目前中国的是一个复杂社会,是一个转型社会。(正确) 大数据改变未来(学习笔记) 1. ENIAC诞生于哪一年?(1946年) 2. 大数据仅仅是指数据的体量大。(错误) 3. 吴军博士认为,所有未来的公司,某种程度上都是大数据公司。(正确) 4. 计算机是根据逻辑推理来回答天为什么是蓝色的。(错误) 5. 吴军博士认为机器无法取代人类成为放射科医生。(错误) 6. 大数据的思维会把原来销售的概念变成服务的概念。(正确) 7. 吴军博士认为,彻底解决保护个人隐私的问题,需要一些新的方法,比如双向监督的方法。(正确) 大数据在交通方面的应用(学习笔记) 1. 根据周琦老师所讲,高德交通信息服务覆盖(110)多个城市以及全国高速路网。 2. 根据周琦老师所讲,将大数据智能化融入高德地图,能够提供更精准的到达时间预 测和实时躲避拥堵功能。(正确) 3. 根据周琦老师所讲,通过索引技术,在分析具体问题时,可以回调出每条道路对应

spss期末大数据分析报告

SPSS在教育研究中的应用某大学学生对本校的满意度调查 学院:教育学院 专业:课程与教学论 学号:201411000156 姓名:李平 2014年12月13日

目录 一、研究问题的提出 (3) 二、研究内容与方法 (3) (一) 研究内容 (3) (二) 研究方法 (3) 三、调查对象及人数 (4) 四、问卷分析 (5) (一)回收情况 (5) (二)信度分析 (5) 五、数据统计与分析 (6) (一)数据输入 (6) (二)数据分析 (7) 1.描述统计 (7) (1)多选题描述统计 (7) (2)单选题描述统计 (9) 2.推断统计 (12) (1)独立样本T检验 (12) (2)单一样本T检验 (15) (3)单因素方差分析 (17) (4) X2检验 (21) 3.相关分析 (22) (1)变量间相关分析 (22) (2)维度间相关分析 (23) 六、结论 (27) 七、附录 (28)

一、研究问题的提出 学生的学校生活和成长密切相关。我们通过对他们的大学生活满意度的调查结果向有关部门提出建议,并希望能引起学校对这一系列问题的关注,最终希望大学生对其大学的满意度有所提升,大学生是一个庞大的群体,特别是近几年,随着高校的扩招,我国越来越多人能够上大学。上大学是很多人的梦想,他们都憧憬着大学校园的生活,然而当他们进了大学后才发现大学生活并非所想的美好,取而代之的却是对校园生活的不满,大学生是十分宝贵的人才资源,他们对校园生活的体验和感受,与他们的更好的学习。 二、研究内容与方法 (一)研究内容 了解学生对于学校的师资水平、环境、日常管理等各方面的满意度。 (二)研究方法 1.问卷编制 本研究采用自编问卷,问卷共由两部分组成:基本情况部分包括被调查者的性别、年级等,问卷主体部分包括师资水平、学校环境、日常管理三大维度,细分为12个三级指标(见表2-1),问卷采用五点制计分法,即“非常满意”、“满意”、“一般”、“不满意”、“非常不满意”,分别赋值5分、4分、3分、2分、1分。 表2-1 某大学学生对本校的满意度测评指标体系 一 级指标 二级指标(潜在变量)三级指标(观测变量) 对自己师资水平对教师教学方法、对教师工作态 度、对教师人品修养、对师资配备 学校的意学校环境对学习环境、对就餐环境、对居住 环境、对校园绿化环境 满度指数日常管理对专业课时安排、对收费标准、对 奖、助学金制度、对学校治安

大数据考试题含答案精编WORD版

大数据考试题含答案精 编W O R D版 IBM system office room 【A0816H-A0912AAAHH-GX8Q8-GNTHHJ8】

1 多选传统大数据质量清洗的特点有: A. 确定性 B. 强类型性 C. 协调式的 D. 非确定性 2 多选以下选项中属于数据的作用的是()。 A. 沟通 B. 验证假设 C. 建立信心 D. 欣赏 3 多选数据建立信心的作用需具备的条件包括()。 A. 可靠数据源 B. 多方的数据源 C. 合适的数据分析 D. 信得过的第三方单位 4 多选数据只有在与()的交互中才能发挥作用。

A. 人 B. 物 C. 消费者 D. 企业 5 单选大数据可能带来(),但未必能够带来()。 A. 精确度;准确度 B. 准确度;精确度 C. 精确度;多样性 D. 多样性;准确度 6 多选大数据的定义是: A. 指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合 B. 任何超过了一台计算机处理能力的数据量 C. 技术 D. 商业 7 多选大数据五大类应用方向是: A. 查询

B. 触达 C. 统计 D. 预警 E. 预测 8 多选以下哪些指标是衡量大数据应用成功的标准? A. 成本更低 B. 质量更高 C. 速度更快 D. 风险更低 9 多选大数据有哪些价值? A. 用户身份识别 B. 描述价值 C. 实时价值 D. 预测价值 E. 生产数据的价值 10 多选大数据的预测价值体现在:

A. 预测用户的偏好、流失 B. 预测热卖品及交易额 C. 预测经营趋势 D. 评价 11 单选什么是大数据使用的最可靠方法? A. 大数据源 B. 样本数据源 C. 规模大 D. 大数据与样本数据结合 12 多选大数据是描述()所发生的行为。 A. 未来 B. 现在 C. 过去 D. 实时 13 多选传统研究中数据采集的方法包括: A. 网络监测

数据分析期末题

数据分析方法课程设计

题目概述: 3、调查美国50个州7种犯罪率,得结果列于表1,其中给出的是美国50个州每100 000 个人中七种犯罪的比率数据。这七种犯罪是:murder(杀人罪),rape(强奸罪),robbery(抢劫罪),assault(斗殴罪),burglary(夜盗罪),larceny(偷盗罪),auto(汽车犯罪)。

1)基于变量()的观测值,求样本协 方差矩阵S和样本相关系数矩阵R; 2)分别从S和R。出发做主成分分析: (1)求样本主成分的贡献率、累计贡献率和各个样本主成分; (2)在两种情况下,你认为应该保留几个主成分,其意义如何解释?(提示:要求累计贡献率达到80%以上)就此题而言,你认为基于S和R的分析结果哪个更 合理? (3)按第一主成分得分将美国50个州排序,结果如何? (4)作以第一主成分得分为横坐标,第二主成分得分为纵坐标的散点图。 L快速聚类和类平均距离谱系聚3)对表1的美国50个州七种犯罪的比率数据,分别试用 2.5 类法将美国50个州分4类,并对聚类结果进行分析和比较。从聚类结果看,你认为哪种分类方法好? 问题一 采用sas得到样本协方差矩阵S:

样本相关系数矩阵R: 问题二 1、从R进行主成分分析: (1)、求样本主成分的贡献率、累计贡献率和各个样本主成分。 贡献率: (2)累计贡献率到达80%以上,需保留三个主成分,前三个成分的累计贡献率已达到86.9%。

由此三个主成分: PRIN1=0.300279murder+ 0.431759 rape+0.396875 robbery+0.396652assault+ 0.440157 burglary +0.357360arceny +0.295177auto PRIN2=-0.629174muder-0.169435rape+0.042247robbery-0.343528asault+0.203341bur glary+ 0.402319larceny+0.502421auto PRIN3=0.178245muder-0.2442rape+0.495861robbery-0.06951asault- 0.2099burglary- 0.5392larceny+0.568auto 从S进行主成分分析: 贡献率: 特征向量: 累计贡献率:第一个成分贡献率已达到87.36%。主成分表达式: PRIN1=0.000864muder+0.008773rape+0.056993robbery+0.059196asault+ 0.465346burglary+0.872863larceny+0.121384auto 分析: 由于第一主成分对所有变量都有近似相等的载荷,因此可认为第一主成分是对所有犯罪率的总度量。第二主成分在变量auto和larceny上有高的正载荷,而在变量murder和assault上有高的负载荷;在burglary上存在小的正载荷,而在rape上存在小的负载荷。可以认为,这个主成分是用于度量暴力犯罪在犯罪性质上占的比重。第三主成分很难给出明显的解释。在依PRIN1排序的结果表中,排在前面的PRIN1值较小的州犯罪率较低,即北达科他NORTH DAKOTA(PRIN1= -3.96408)州犯罪率最低,PRIN1值较大的州,犯罪率较高,即内华达NEV ADA(PRIN1= 5.26699)州犯罪率最高。在依PRIN2排序的结果表35.4中,排在前面的PRIN2值较小州的暴力犯罪性质比重较大。

《 数据分析 》课程期末考试试题A卷

命题方式:单独命题 佛山科学技术学院2008—2009学年第一学期 《数据分析》课程期末考试试题A卷专业、班级:姓名:学号:

共 3 页第 2 页

共 3 页第3 页

一(1)SAS界面包括 输出框,日志框,编辑器 (2)在非数值变量后面家上”$”符号. (3) 自由格式输入数据应加上”@@”标记. (4) 三均值的计算公式 ^ M=1/4Q1+1/2M+1/4Q3 二 程序: data t1; input x@@; cards; 100.00 107.57 112.42 96.21 121.58 107.21 117.16 116.19 101.37 109.78 112.83 104.37 105.40 109.50 111.60 112.10 113.50 112.40 proc univariate plot normal; run; proc capability graphics normal; histogram x/normal; qqplot x/normal(….); run; (1)由上图可知道 均值:109.510556 方差:40.5703938 变异系数:5.81632451 峰度:0.05978054 偏度:-0.3324812 (2) 中位数: 上四分位数: 下四分位数: 四分位极差: (3)做出直方图、QQ图、茎叶图、箱线图 直方图:

QQ图 茎叶图:

箱线图: (4)进行正态性W 检验(取05.0=α). 由上图可以知道Wo=0.978265,P=0.9304>05.0=α; 故不能拒绝原假设Ho,所以是高度显著的。 三 data t2; input x1-x4; cards ; 16.7 26.7 6.4 35.0 18.2 28.0 3.2 29.7 16.7 26.7 2.1 34.9 18.1 26.7 4.3 31.5 16.7 26.0 3.0 32.7 18.1 30.2 7.0 34.9 20.2 30.5 4.8 34.4 20.2 29.5 5.5 36.2 21.5 31.5 5.8 36.5 18.8 30.6 5.4 35.4 21.6 27.8 5.4 34.1 21.3 29.5 5.8 35.8 proc corr cov pearson ; run ; (1)计算协方差矩阵,Pearson 相关矩阵; 协方差矩阵:

大数据试题库

大数据试题库 选择题 1.下列哪一项不是大数据提供的用户交互方式:(C) A.统计分析和数据挖掘 B.任意查询和分析 C.图形化展示 D.企业报表 2.与大数据密切相关的技术是(B) A蓝牙 B,云计算 C,博弈论 D,wifi 3.大数据应用需依托的新技术有( D) A.大规模存储与计算 B.数据分析处理 C.智能化 D.三个选项都是 4.与大数据密切相关的技术是(B) A蓝牙 B 云计算 C 博弈论 D wifi 填空题 1.大数据最具潜能的三大应用领域分别为商业智能,公共服务和市场营销. 2.1pb=(1024)tb=(2e20)gb=(2e30)mb=(2e40)kb 3.大数据的特征是___、___、___、___。 答案:大量化、多样化、快速化、价值密度低。 4.大数据的4v特征分别是大量化多样化快速化价值密度低

判断题 1.大数据的存储方案通常对一份数据在不同节点上存储三份副本,以提高系统容错性。 (√) 2.大数据思维,是指一种意识,认为公开的数据一旦处理得当就能为千百万人急需解 决的问题提供答案。(√) 3.数据可视化可以便于人们对数据的理解(√) 4.大数据技术和云计算技术是两门完全不相关的技术(X) 简答题 1.请简述大数据的结果展现方式。 答: 1)报表形式 基于数据挖掘得出的数据报表,包括数据表格、矩阵、图形和自定义格式的报表等,使用方便、设计灵活。 2.图形化展现 提供曲线、饼图、堆积图、仪表盘、鱼骨分析图等图形形式宏观展现模型数据的分布情况,从而便于进行决策。 2)KPI展现 提供表格式绩效一览表并可自定义绩效查看方式,如数据表格或走势图,企业管理者可根据可度量的目标快速评估进度。 4.查询展现 按数据查询条件和查询内容,以数据表格来汇总查询结果,提供明细查询功能,并可在查询的数据表格基础上进行上钻、下钻、旋转等操作。 2.例举身边的大数据。 答: i.QQ,微博等社交软件产生的数据 ii.天猫,京东等电子商务产生的数据

大数据试题及答案

第一组试题 一、选择题 1、以下哪个不是大数据的特征(C ) A. 价值密度低 B. 数据类型繁多 C.访问时间短 D. 处理速度快 2、当前大数据技术的基础是由( C )首先提出的。(单选题,本题2 分)A:微软 B:百度 C:谷歌 D:阿里巴巴 3、大数据的起源是(C )。(单选题,本题2 分) A:金融 B:电信 C:互联网 D:公共管理 4、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( C )。(单选题,本题 2 分) A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师 5、(C )反映数据的精细化程度,越细化的数据,价值越高。(单选题,本题 2 分) A:规模 B:活性 C:颗粒度 D:关联度 6、智能健康手环的应用开发,体现了( C )的数据采集技术的应用。(单选 题,本题 2 分) A:统计报表 B:网络爬虫 C:传感器 D:API 接口 7、下列关于数据重组的说法中,错误的是(C )。(单选题,本题2 分)A:数据重组实现的关键在于多源数据融合和数据集成 B:数据重组能够使数据焕发新的光芒 C:数据重组是数据的重新生产和重新采集 D:数据重组有利于实现新颖的数据模式创新

8、智慧城市的构建,不包含(C )。(单选题,本题2 分) A:数字城市 B:物联网 C:联网监控 D:云计算 9、当前社会中,最为突出的大数据环境是(C )。(单选题,本题2 分)A:综合国力 B:物联网 C:互联网 D:自然资源 二、判断题 1.对于大数据而言,最基本。最重要的是要求就是减少错误、保证质量。因此,大数据收集的信息要尽量精确。() 2. 对于大数据而言,在数据规模上强调相对数据而不是绝对数据。() 3.基于大数据的营销模式和传统营销模式,传统营销模式比大数据营销模式投入更小。() 4.大数据具有体量大、结构单一、时效性强的特征。() 三、简答题 1.大数据发展过程中遇到的问题有哪些? 解析: (1)大数据是全数据,忽视甚至蔑视抽样; (2)连续数据就是大数据; (3)数据量级大是大数据; (4)数据量大好于量小。 2.咸鱼APP在投入使用发展过程中有哪些不足之处? 解析: (1)交易信任危机 (2)物流问题 (3)商品的售后及维修问题

生意参谋数据分析师考试题复习(三)

《生意参谋数据分析师》考试 1、 单选题 分值: 1 王家杂货铺的掌柜在复盘上月数据时发现客服小甲有12个咨询是没回复;如果小甲上个月总共有100个咨询量,那么他当时的回复率是多少? A: 0.12 B: 0.58 C: 0.82 D: 0.88 答案解析:"参考章节:店铺客服转化率诊断本题考点:客服回复率答案解析:客服回复率是指客服对于咨询他的客户进行回复的百分占比,如果有100个咨询量,其中12个没有回复,那么回复率就是(10 0-12)/100=88%" 2、 单选题 分值: 1 小芳根据数据分析发现主推宝贝标题里很多关键词没有带来访客数和转化率,于是想要替换这些关键词,她应该替换什么关键词进去? A: 从生意参谋的搜索词里面找到自己叶子类目的相关性强转化率高流量大的核心关键词,如果标题里没有的,就可以找出来替换进去。 B: 看看别人标题都用什么词,自己没有的,加进来 C: 加类目大词进来引流量 D: 选一些长尾词转化率高

答案解析:参考章节:快速优化标题提升手淘搜索流量本题考点:优质关键词寻找和标题优化答案解析:生意参谋—市场—搜索排行—搜索词里面找到自己叶子类目的相关性强转化率高流量大的核心关键词。 3、 单选题 分值: 1 小明是吹风机类目的商家,他想做类目趋势对比表,为此他需要收集近几年的相关数据作为参考? A: 近5年 B: 近4年 C: 近3年 D: 近2年 答案解析:参考章节:品类罗盘—商品年度规划(一)本题考点:市场趋势表格制作试题解析:在大数据的背景下,我们做类目数据对比时,会去抓取近3年子类目数据为参考维度。 4、 单选题 分值: 1 小明店铺的无线首页,模块1跳转店内爆款,每天点击量200,模块2跳转店内新品,每天点击量80;因为新品数据良好,有次爆款潜力,小明决定交换模块1和模块2跳转商品! A: 正确 B: 错误 答案解析:参考章节:页面效果如何提升?本题考点:页面数据分析答案解析:根据页面板块的点击数、点击率、转化率等数据来确定优化方向 5、 单选题 分值: 1 为了尽量减少花费,小李想选择免费方法实现新品破0 ;以下那种破0 方法不是免费的?

大数据考试题

《大数据》试题 单选题 1、大数据的核心就是(B) A、告知与许可 B、预测 C、匿名化 D、规模化 2、大数据不是要教机器像人一样思考。相反,它是(A) A、把数学算法运用到海量的数据上来预测事情发生的可能性。 B、被视为人工智能的一部分。 C、被视为一种机器学习。 D、预测与惩罚。 3、采样分析的精确性随着采样随机性的增加而(C),但与样本数量的增加关系不大。 A、降低 B、不变 C、提高 D、无关 4、大数据是指不用随机分析法这样的捷径,而采用(A)的方法 A、所有数据 B、绝大部分数据 C、适量数据 D、少量数据 5、大数据的简单算法与小数据的复杂算法相比(A) A、更有效 B、相当 C、不具备可比性 D、无效 6、相比依赖于小数据和精确性的时代,大数据因为更强调数据的(D),帮助我们进一步接近事实的真相。 A、安全性 B、完整性 C、混杂性 D、完整性和混杂性 7、大数据的发展,使信息技术变革的重点从关注技术转向关注(A) A、信息 B、数字 C、文字 D、方位 8、大数据时代,我们是要让数据自己“发声”,没必要知道为什么,只需要知道(B) A、原因 B、是什么 C、关联物 D、预测的关键 9、建立在相关关系分析法基础上的预测是大数据的(C) A、基础 B、前提 C、核心 D、条件 10、(C)下列说法正确的是 A、有价值的数据是附属于企业经营核心业务的一部分数据; B、数据挖掘它的主要价值后就没有必要再进行分析了; C、所有数据都是有价值的; D、在大数据时代,收集、存储和分析数据非常简单; 11、关于数据创新,下列说法正确的是(D) A、多个数据集的总和价值等于单个数据集价值相加; B、由于数据的再利用,数据应该永久保存下去; C、相同数据多次用于相同或类似用途,其有效性会降低; D、数据只有开放价值才能得到真正释放。 12、关于数据估值,下列说法错误的是(B) A、随着数据价值被重视,公司所持有和使用的数据也渐渐纳入了无形资产的范畴; B、无论是向公众开放还是将其锁在公司的保险库中,数据都是有价值的; C、数据的价值可以通过授权的第三方使用来实现 D、目前可以通过数据估值模型来准确的评估数据的价值评估 13、在大数据时代,下列说法正确的是(B)。 A、收集数据很简单 B、数据是最核心的部分 C、对数据的分析技术和技能是最重要的 D、数据非常重要,一定要很好的保护起来,防止泄露 14、随着数据科学家的崛起,(C)的地位将发生动摇。 A、国家领导人 B、大型企业 C、行业专家和技术专家 D、职业经理人 15、大数据公司的多样性表明了(B) A、数据作用的体现 B、数据价值的转移 C、数据技术的发展 D、数据思维的创新 16、以下哪种说法是错误的(B) A、将罪犯的定罪权放在数据手中,借以表达对数据和分析结果的崇尚,这实际上是一种滥用。 B、随着数据量和种类的增多,大数据促进了数据内容的交叉检验,匿名化的数据不会威胁到任何人的隐私。 C、采集个人数据的工具就隐藏在我们日常生活所必备的工具当中,比如网页和智能手机应用程序。 D、预测与惩罚,不是因为所做,而是因为将做。 17、只要得到了合理的利用,而不单纯只是为了“数据”而“数据”,大数据就会变成(B) A、强大的威胁 B、强大的武器 C、预测工具 D、分析工具 18、在大数据时代,我们需要设立一个不一样的隐私保护模式,这个模式应该更着重于(A)为其行为承担责任。 A、数据使用者 B、数据提供者 C、个人许可 D、数据分析者

大数据时代题目及答案(三套试题仅供参考)

大数据时代题目及答案(三套试题仅供参考)

第一套试题 1、当前大数据技术的基础是由(C)首先提出的。(单选题,本题2分) A:微软 B:百度 C:谷歌 D:阿里巴巴 2、大数据的起源是(C )。(单选题,本题2分) A:金融 B:电信 C:互联网 D:公共管理 3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。(单选题,本题2分) A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师 4、(D )反映数据的精细化程度,越细化的数据,价值越高。(单选题,本题2分) A:规模 B:活性 C:关联度 D:颗粒度 5、数据清洗的方法不包括( D)。(单选题,本题2分) A:缺失值处理 B:噪声数据清除 C:一致性检查 D:重复数据记录处理 6、智能健康手环的应用开发,体现了( D)的数据采集技术的应用。(单选题,本题2分) A:统计报表 B:网络爬虫 C:API接口 D:传感器 7、下列关于数据重组的说法中,错误的是(A)。(单选题,本题2分) A:数据重组是数据的重新生产和重新采集 B:数据重组能够使数据焕发新的光芒 C:数据重组实现的关键在于多源数据融合和数据集成 D:数据重组有利于实现新颖的数据模式创新 8、智慧城市的构建,不包含( C)。(单选题,本题2分) A:数字城市 B:物联网 C:联网监控 D:云计算 9、大数据的最显著特征是(A)。(单选题,本题2分) A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的(B )。(单选题,本题2分) A:在数据基础上倾向于全体数据而不是抽样数据 B:在分析方法上更注重相关分析而不是因果分析 C:在分析效果上更追究效率而不是绝对精确 D:在数据规模上强调相对数据而不是绝对数据 11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D)。(单选题,本题2分) A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高12、当前社会中,最为突出的大数据环境是(A)。(单选题,本题2分) A:互联网 B:物联网 C:综合国力 D:自然资源 13、在数据生命周期管理实践中,( B)是执行方法。(单选题,本题2分) A:数据存储和备份规范 B:数据管理和维护 C:数据价值发觉和利用 D:数据应用开发和管理 14、下列关于网络用户行为的说法中,错误的是(C)。(单选题,本题2分) A:网络公司能够捕捉到用户在其网站上的所有行为 B:用户离散的交互痕迹能够为企业提升服务质量提供参考 C:数字轨迹用完即自动删除 D:用户的隐私安全很难得以规范保护 15、下列关于计算机存储容量单位的说法中,错误的是( C)。(单选题,本题2分) A:1KB<1MB<1GB B:基本单位是字节(Byte) C:一个汉字需要一个字节的存储空间 D:一个字节能够容纳一个英文字符, 16、下列关于聚类挖掘技术的说法中,错误的是(B)。(单选题,本题2分) A:不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别

《数据分析与统计软件》期末测试试题()

《数据分析与统计软件》期末试题()

————————————————————————————————作者:————————————————————————————————日期:

A卷 20xx—20xx学年第一学期 《数据分析与统计软件》期末试卷(1) 专业班级 姓名 学号 开课系室理学院应用数学系 考试日期 题号一二三四五六总分本题满分21 18 16 17 17 11 100 本题得分 阅卷人 注意事项: 1.本试卷正文共6页。 2.反面及附页可作草稿纸。 3.答题时请在试卷正面指定位置答题,注意书写清楚,保持卷面清洁。 4. 试卷本请勿撕开,不能铅笔答题,否则作废。

一、填空题(本题满分21分,每空3分) 1、设X 为p 维总体,()(1,2,,)i X i n =L 是X 的样本, 样本均值为()1 1n i i X X n ==∑,则()Cov X 的常用无偏估 为:_________________________________。 2、设Y 是取0,1两个值的随机变量,它受变量12,X X 的影响,则Y 与变量 12,X X 的LOGISTIC 回归模型为_______________________________。 3、设变量123(,,)T X X X 的协方差阵为4222932325?? ??∑=-?? ??-?? ,则它的相关阵为________________________;偏相关系数13(2)ρ?为________________。 4、今对5人进行测试,测得2个指标:脉搏1X ,引体向上次数2X ,数据如 下表,则两者的样本Spearman 相关系数为:__________________;两者的样本Kendall τ相关系数为:__________________ 。 X 1 50 52 58 46 56 X 2 15 12 13 17 14 5、在R 中,对一列0,1二值观测数据向量x 进行随机性检验的函数调用格 式为:____________________________。 本题满分21分 本题得分

数据分析与统计软件期末试题

A卷 20xx—20xx学年第一学期 《数据分析与统计软件》期末试卷(1) 专业班级 姓名 学号 开课系室理学院应用数学系 考试日期 题号一二三四五六总分本题满分21 18 16 17 17 11 100 本题得分 阅卷人 注意事项: 1.本试卷正文共6页。 2.反面及附页可作草稿纸。 3.答题时请在试卷正面指定位置答题,注意书写清楚,保持卷面清洁。 4. 试卷本请勿撕开,不能铅笔答题,否则作废。

1 / 7 一、填空题(本题满分21分,每空3分) 1、设X 为p 维总体,()(1,2,,)i X i n =L 是X 的样本, 样本均值为()1 1n i i X X n ==∑,则()Cov X 的常用无偏 估为:_________________________________。 2、设Y 是取0,1两个值的随机变量,它受变量12,X X 的影响,则Y 与变量 12,X X 的LOGISTIC 回归模型为_______________________________。 3、设变量123(,,)T X X X 的协方差阵为4222932325?? ??∑=-?? ??-?? ,则它的相关阵为________________________;偏相关系数13(2)ρ?为________________。 4、今对5人进行测试,测得2个指标:脉搏1X ,引体向上次数2X ,数据 如下表,则两者的样本Spearman 相关系数为:__________________;两者的样本Kendall τ相关系数为:__________________ 。 5、在R 中,对一列0,1二值观测数据向量x 进行随机性检验的函数调用 格式为:____________________________。

大数据考试题含答案知识讲解

1 多选传统大数据质量清洗的特点有: A. 确定性 B. 强类型性 C. 协调式的 D. 非确定性 2 多选以下选项中属于数据的作用的是()。 A. 沟通 B. 验证假设 C. 建立信心 D. 欣赏 3 多选数据建立信心的作用需具备的条件包括()。 A. 可靠数据源 B. 多方的数据源 C. 合适的数据分析 D. 信得过的第三方单位 4 多选数据只有在与()的交互中才能发挥作用。 A. 人 B. 物 C. 消费者 D. 企业 5 单选大数据可能带来(),但未必能够带来()。 A. 精确度;准确度 B. 准确度;精确度 C. 精确度;多样性 D. 多样性;准确度 6 多选大数据的定义是: A. 指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合 B. 任何超过了一台计算机处理能力的数据量 C. 技术 D. 商业 7 多选大数据五大类应用方向是: A. 查询 B. 触达 C. 统计 D. 预警 E. 预测 8 多选以下哪些指标是衡量大数据应用成功的标准? A. 成本更低 B. 质量更高 C. 速度更快 D. 风险更低 9 多选大数据有哪些价值? A. 用户身份识别

B. 描述价值 C. 实时价值 D. 预测价值 E. 生产数据的价值 10 多选大数据的预测价值体现在: A. 预测用户的偏好、流失 B. 预测热卖品及交易额 C. 预测经营趋势 D. 评价 11 单选什么是大数据使用的最可靠方法? A. 大数据源 B. 样本数据源 C. 规模大 D. 大数据与样本数据结合 12 多选大数据是描述()所发生的行为。 A. 未来 B. 现在 C. 过去 D. 实时 13 多选传统研究中数据采集的方法包括: A. 网络监测 B. 电话访谈 C. 对面访谈 D. 线上互动 14 单选大数据整合要保证各个数据源之间的()。 A. 一致性、协调性 B. 差异性、协调性 C. 一致性、差异性 D. 一致性、相容性 15 单选分类变量使用()建立预测模型。 A. 决策树 B. 分类树 C. 离散树 D. 回归树 16 多选()是大数据应用的步骤。 A. 数据输入 B. 建模分析 C. 使用决策支持工具输出结果 D. 验证假设 17 多选避免“数据孤岛”的方法包括: A. 关键匹配变量 B. 数据融合 C. 数据输入 D. 利用样本框

大数据基础技能试题及答案

Java基础 1. Which of the following will compile correctly? A) float f=10f; B) float f=10.1; C) float f=10.1f; D) byte b=10b; 2. Which declarations of identifiers are legal A. $persons B. TwoUsers C. *point D. this E. _endline 3. Which statement of assigning a long type variable to a hexadecimal value is correct A. long number = 345L; B. long number = 0345; C. long number = 0345L; D. long number = 0x345L 4. Which of the following fragments might cause errors A. String s = "Gone with the wind"; String t = " good "; String k = s + t; B. String s = "Gone with the wind"; String t; t = s[3] + "one"; C. String s = "Gone with the wind"; String standard = s.toUpperCase(); D. String s = "home directory"; String t = s - "directory"; 5. Which are syntactically valid statement at// point x class Person { private int a; public int change(int m){ return m; } }

《我们的大数据时代》考试题目及答案

我们的大数据时代 (一) 单选题(每题2分) 1. 下列关于舍恩伯格对大数据特点的说法中,错误的是(D) A. 数据规模大 B. 数据类型多样 C. 数据处理速度快 D. 数据价值密度高 2. 下列关于大数据的分析理念的说法中,错误的是(D) A. 在数据基础上倾向于全体数据而不是抽样数据 B. 在分析方法上更注重相关分析我不是因果分析 C. 在分析效果上更追究效率而不是绝对精确 D. 在数据规模上强调相对数据而不是绝对数据 3. 万维网之父是(C) A. 彼得·德鲁克 B. 舍恩伯格 C. 蒂姆·伯纳斯—李 D. 斯科特·布朗 4. 下列关于普查的缺点的说法中,正确的是(A)。 A. 工作量较大,容易导致调查内容有限、产生重复和遗漏现象 B. 误差不易被控制 C. 对样本的依赖性比较强 D. 评测结果不够稳定 5.下列关于聚类挖掘技术的说法中,错误的是(B)。 A. 不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别 B. 要求同类数据的内容相似度尽可能小 C. 要求不同类数据的内容相似度尽可能小 D. 与分类挖掘技术相似的是,都是要对数据进行分类处理 6. 智慧城市的构建,不包含(C)。 A. 数字城市 B. 物联网 C. 联网监控 D. 云计算 7.大数据的起源是(C)。 A. 金融 B. 电信 C. 互联网 D. 公共管理 8. 智慧城市的智慧之源是(C)。 A. 数字城市 B. 物联网 C. 大数据 D. 云计算 9. 假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是(A)关系,而吸烟和肺癌则是(A)关系。

A. 因果;相关 B. 相关;因果 C. 并列;相关 D. 因果;并列 10. 下列关于数据交易市场的说法中,错误的是(C)。 A. 数据交易市场是大数据产业发展到一定程度的产物 B. 商业化的数据交易活动催生了多方参与的第三方数据交易市场 C. 数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助 D. 数据交易市场是大数据资源化的必然产物 11. 下列关于计算机存储容量单位的说法中,错误的是(C)。 A. 1KB<1MB<1GB B. 基本单位是字节(Byte) C. 一个汉字需要一个字节的存储空间 D. 一个字节能够容纳一个英文字符 12. 当前大数据技术的基础是由(C)首先提出的。 A. 微软 B. 百度 C. 谷歌 D. 阿里巴巴 13. 下列国家的大数据发展行动中,集中体现“重视基础、首都先行”的国家是(D)。 A. 美国 B. 日本 C. 中国 D. 韩国 14. 下列演示方式中,不属于传统统计图方式的是(D)。 A. 柱状图 B. 饼状图 C. 曲线图 D. 网络图 15. 当前社会中,最为突出的大数据环境是(A)。 A. 互联网 B. 物联网 C. 综合国力 D. 自然资源 16. 可以对大数据进行深度分析的平台工具是(C)。 A. 传统的机器学习和数据分析工具 B. 第二代机器学习工具 C. 第三代机器学习工具 D. 未来机器学习工具 17. 智能健康手环的应用开发,体现了(D)的数据采集技术的应用。 A. 统计报表 B. 网络爬虫 C. API接口 D. 传感器 18. 过一系列处理,在基本保持原始数据完整性的基础上,减小数据规模的是(C)。 A. 数据清洗

相关主题