熊猫题库

|设为首页 |收藏本站 |切换到宽版
注册
查看: 420|回复: 0

国开《大数据技术》形考任务4【答案】

[复制链接]

6130

主题

6130

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

积分
18978
发表于 2022-6-24 10:38:03 | 显示全部楼层 |阅读模式
直接下载提交即可


“大数据技术” 课程形考作业四
一、单选题
1、下列关于流计算的说法,哪项是错误的?
( ) 实时获取来自不一样数据源的海量数据,通过实时剖析处理,取得有价值的信息
( ) 流计算遵循一个根本理念,即数据的价值跟着时刻的消逝而下降
( ) 关于一个流计算系统来说,它大概撑持TB级乃至是PB级的数据规划
( ) 流计算只需求确保较低的推迟时刻,即只到达秒等级即可处理全部疑问
2、下列关于数据处理流程,说法有误的是?
( ) 在传统的数据处理流程中,存储的数据是旧的
( ) 在传统的数据处理流程中,需求用户自动宣布查询来获取成果
( ) 传统的数据处理流程,需求先收集数据并存储在关系数据库等数据管理系统中
( ) 流计算的处理流程一般包括三个期间:数据实时收集、数据批量计算、实时查询效劳
3、下面描绘错误的是:
(A) Storm尽管能够做到低推迟,可是无法完成高吞吐,也不能在毛病发作时精确地处理计算状况
(B) Spark Streaming经过选用微批处理方法完成了高吞吐和容错性,可是献身了低推迟和实时处理才能
(C) Flink完成了谷歌 Dataflow流计算模型,是一种兼具高吞吐、低推迟和高功能的实时流计算结构,而且一起撑持批处理和流处理
(D) Spark Streaming能够完成毫秒级呼应,而Flink只能完成秒级呼应
4、以下哪个不归于事情驱动型应用?
(A) 反诈骗
(B) 反常检测
(C) 根据规矩的报警
(D) 花费者技术中的实时数据即席剖析
5、下列关于图结构数据的描绘,错误的是?
(A) 许多非图结构的大数据,一般会被变换为关系模型后进行剖析
(B) 许多大数据都是以大规划图或网络的方式出现
(C) 图数据结构极好地表达了数据之间的相关性
(D) 相关性计算是大数据计算的中心
6、在Pregel计算模型中,图中的每个极点会对应一个计算单元,下列哪一项不归于计算单元的成员变量?
( ) 极点值( ):极点对应的PR值
( ) 出射边( ):只需求表明一条边,能够不取值
( ) 音讯( ):传递的音讯
( ) 入射边( ):只需求表明一条边,能够不取值
7、 下列关于数据可视化的描绘,哪个是错误的?
(A) 数据可视化是指将大型数据会集的数据以图形图画方式表明
(B) 使用数据剖析和开发东西发现其间不知信息的处理过程
(C) 数据可视化技术的根本思想是将数据库中每一个数据项作为单个图元素表明
(D) 将数据的各个特点值以一维数据的方式表明
8、 下列哪个不归于可视化东西?
(A) 谷歌 Chart API
(B) D3
(C) Visual.ly
(D) Spark
9、下面关于UserCF算法和ItemCF算法的比照,哪个是错误的?
( ) UserCF算法的引荐更倾向社会化:合适应用于新闻引荐、微博论题引荐等应用场景,其引荐成果在新颖性方面有必定的优势
( ) ItemCF算法的引荐更倾向于特性化
( ) ItemCF跟着用户数意图增大,用户类似度计算杂乱度越来越高
( ) UserCF引荐成果有关性较弱,难以对引荐成果作出解说,简单受群众影响而引荐抢手物品
10、下列关于引荐系统的描绘,哪一项是错误的?
( ) 引荐系统是大数据在互联网范畴的典型应用
( ) 引荐系统是自动联系用户和物品的一种东西
( ) 引荐系统能够发明全新的商业和经济形式,协助完成长尾产品的销售
( ) 引荐系统分为根据物品的协同过滤和根据商家的协同过滤

二、多选题
1、 流数据具有以下哪些特征?
( )  数据疾速继续抵达,潜在巨细或许是无量无尽的
( )  数据来历很多,格局杂乱
( )  重视数据的全体价值,不过火重视单个数据
( )  系统能够操控即将处理的新抵达的数据元素的次序
2、 下列关于批量计算和实时计算的说法,正确的有?
( )  批量计算:富余时刻处理静态数据,如Hadoop
( )  静态数据不合适选用批量计算,由于它不合适用传统的关系模型建模
( )  流数据有必要选用实时计算
( )  流数据的呼应时刻一般为秒级,乃至需求毫秒级
3、 企业数据架构的典型方式包含:
( )传统数据处理架构
( )大数据Lambda架构
( )流处理架构
( )循环处理架构
4、Flink的优势包含:
( )一起撑持高吞吐、低推迟、高功能
( )一起撑持流处理和批处理
( )撑持有状况计算
( )具有独立的内存管理
5、许多传统的图计算算法都存在以下哪些典型疑问?
( )  常常体现出对比差的内存拜访部分性
( )  对于单个极点的处理工作过少
( )  计算过程中随同着并行度的改动
( )  计算过程简便
6、对于大型图( )的计算疑问,哪些说法是正确的?
( )  为特定的图应用定制相应的散布式完成:通用性欠好
( )  根据现有的散布式计算渠道进行图计算:在功能和易用性方面通常无法到达最优
( )  运用单机的图算法库,可是,在能够处理的疑问的规划方面具有很大的限制性
( )  运用已有的并行图计算系统,可是,对大规划散布式系统十分重要的一些方面( ),无法供给较好的撑持
7、 在大数据年代,可视化技术能够撑持完成哪些方针?
( )观测、盯梢数据
( )剖析数据
( )辅助了解数据
( )增强数据招引力
8、 信息图表是信息、数据、常识等的视觉化表达,下列哪个说法正确?
( )google公司的制图效劳接口谷歌 Chart API,能够用来为统计数据并自动生成图像
( )D3是最盛行的可视化库之一,是一个用于网页作图、生成互动图形的JavaScript函数库
( ) ECharts是由baidu公司前端数据可视化团队研制的图表库,能够流通地运转在PC和移动设备上
( )大数据魔镜是一款优异的国产数据剖析软件,它丰厚的数据公式和算法能够让用户真实了解探究剖析数据
9、下列哪些归于大数据应用?
( )  引荐系统:为用户引荐有关产品
( )  物流:根据大数据和物联网技术的智能物流
( )  智能交通:使用交通大数据,完成交通实时监控
( )  汽车:无人驾驭汽车,实时收集车辆各种行进数据和周围环境
10、下列关于引荐系统集群的描绘,哪些是正确的?
( )  为了让用户从海量信息中高效地取得自己所需的信息,引荐系统应运而生
( )  引荐系统是大数据在互联网范畴的典型应用
( )  引荐系统是自动联系用户和物品的一种东西
( )  引荐系统是使用大数据调整线下门店布局、操控店内助流量
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

站点统计 | 统计 | QQ | Archiver| 熊猫题库 |网站地图

Copyright © 2001-2013 Comsenz Inc.   All Rights Reserved. Powered by 熊猫题库