20春学期(1709、1803、1809、1903、1909、2003)《大数据导论》在线作业
关注 超前自学网 公众号 获取答案
大数据的特点不包含
A:数据体量大
B:价值密度高
C:处理速度快
D:数据不统一
基础设施即服务的英文简称是
A:IaaS
B:PaaS
C:SaaS
下面哪一项不是中国发展大数据产业的基础()。
A:信息化积累了丰富的数据资源
B:大数据技术创新取得明显突破
C:大数据应用推动势头良好
D:大数据产业支撑薄弱
数据清洗的方法不包括
A:缺失值处理
B:噪声数据清除
C:一致性检查
D:重复数据记录处理
以下不是数据仓库基本特征的是()
A:数据仓库是面向主题的
B:数据仓库是面向事务的
C:数据仓库的数据是相对稳定的
D:数据仓库的数据是反映历史变化的
数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
数据仓库是随着时间变化的,下列不正确的是()
A:数据仓库随时间变化不断增加新内容
B:捕捉到的新数据会覆盖原来的快照
C:数据仓库随事件变化不断删去旧的数据内容
D:数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
购物篮问题是##的典型案例
A:数据变换
B:关联规则挖掘
C:数据分类
PaaS是()的简称
A:软件即服务
B:平台即服务
C:基础设施即服务
D:硬件即服务
下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
A:ggplot2
B:network
C:ggmaps
D:animation
数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
哪个选项不属于大数据4V特点?
A:Volume
B:Valid
C:Variety
D:Value
以下哪项不是数据可视化工具的特性()
A:实时性
B:简单操作
C:更丰富的展现
D:仅需一种数据支持方式即可
()是Microsoft Office的核心组件
A:SQL
B:WORD
C:PPT
D:EXCEL
云计算的特点是()
A:大规模
B:高扩展性
C:虚拟化
D:按需分配
大数据时代预测人类移动行为的数据来源有
A:志愿者定位数据
B:装有导航设备的出租车轨迹数据
C:手机终端定位于通讯记录
D:社会网络签到数据
百度大数据引擎主要包含三大组件()
A:开放云
B:数据工厂
C:百度大脑。
KNIME(Konstanz Information Miner)是一个对用户友好的、智能、开源的平台。该平台包括了##、##、##、##。
A:数据集成
B:数据处理
C:数据分析
D:数据挖掘
大数据时代预测人类移动行为的数据特点是
A:多样化
B:数据量大
C:维数高
D:变化快
大数据采集主要包括()四种。
A:系统日志采集
B:网络数据采集
C:数据库采集
D:其他数据采集
数据工厂包括
A:低能耗数据中心
B:超大规模讲分布式架构
C:新一代智能自动化运维
D:超强云安全
数据分析的类型根据数据分析深度可以分为()
A:描述性分析
B:预测性分析s
C:规则性分析
主流分布式计算平台有()
A:google
B:IBM
C:baidu
D:Amazon
交通数据分析可用于:
A:交通流量实时分析
B:合理进行道路规划
C:信号灯智能调度
D:实时路况查询播报
互连网上出现的海量信息可以划分为三种,分别为( )
A:结构化信息
B:非结构化信息
C:半结构化信息
D:特殊化信息
一个HDFS集群由一个##和##构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。
A:一个名字节点
B:若干个名字节点
C:一个数据节点
D:若干个数据节点
大数据在社交网络中的应用
A:用户偏好、情感、社交网络结构
B:用户画像、精准推荐
C:舆情监控、突发事件预警
D:预测外部趋势
开放云()
A:价值呈现:大数据应用价值呈现和创新不足
B:应用建设:周期长、门槛高、多冗余、体验差
C:组织流程:应用跨部门,缺乏流程贯串和使能业务生产
D:生态建设:无法有效构建和融入新的数字生态圈
大数据在电信中的应用有
A:基于用户、业务及流量分级的多维管控机制
B:精准的客户分析及营销
C:利用位置和轨迹信息服务社会
数据存在形式包括结构化数据和结构化数据
A:对
B:错
数据可视化。将大型数据集中的数据通过图形图像方式表示,并利用数据分析和开发工具发现其中未知信息。
A:对
B:错
Spark是基于内存的大数据并行计算框架
A:对
B:错
非结构化数据是指非纯文本类数据,没有标准格式,无法直接解析出相应的值
A:对
B:错
箱式图用于描述数据的分散情况,主要数据节点包括:均值、中值、等中心值的度 量,标准偏差、方差等可变性度量。
A:对
B:错
Pentaho是最流行的开源商业智能软件之一
A:对
B:错
网络数据采集是利用互联网搜索引擎技术对数据进行针对性、行业性、精准性的抓取,并按照一定规则和筛选标准将数据进行归类,形成数据库文件的一个过程。
A:对
B:错
云存储不仅是存储设备或技术,更是一种服务的创新。
A:对
B:错
当数据量表完全超过BI和传统关系数据库的能力时,我们将用到海量数据分析。
A:对
B:错
IDC给出的大数据定义是大数据(Big Data)是需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
A:对
B:错
Paas:软件即服务。它是一种通过Internet提供软件的模式,用户无需购买软件,而是向提供商租用基于Web的软件,来管理企业经营活动。
A:对
B:错
关联分析是在数据集D中找出大于用户所给定的最大支持度阈值和最大置信度阈值的关联规则。
A:对
B:错
数据的大量聚集,使得黑客一次成功的攻击能够获得更多的数据,无形中降低了黑客的进攻成本,增加了“收益率“。
A:对
B:错
数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术,传感器,交互型社交网络,移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。
A:对
B:错
社交网络一一通常由通过一些特定类型的相互依赖关系(例如,亲属关系、友谊、共同兴趣、信念或金融交换)链接的社会实体(例如,个人、公司、集体社会单位或组织)组成。
A:对
B:错
数据表达是通过计算机图形图像技术来更加友好地展示数据信息,方便人们阅读、理解和运用数据
A:对
B:错
时空数据是指带有地理位置与时间标签的数据。
A:对
B:错
大数据从概念化走向价值化是大数据的发展趋势
A:对
B:错
大数据的应用之一是,促进健康管理的个性化和多元化。
A:对
B:错
FP-growth算法需要对数据库进行三次扫描
A:对
B:错