南开大学22秋学期《大数据导论》在线作业一

奥鹏教育南开大学平时作业

南开大学22秋学期《大数据导论》在线作业一插图

22秋学期(高起本1709-1803、全层次1809-2103)《大数据导论》在线作业-00001

下面哪一项不是中国发展大数据产业的基础()。
A:信息化积累了丰富的数据资源
B:大数据技术创新取得明显突破
C:大数据应用推动势头良好
D:大数据产业支撑薄弱
正确答案获取微信:424329

PaaS是()的简称
A:软件即服务
B:平台即服务
C:基础设施即服务
D:硬件即服务
正确答案获取微信:424329

哪个选项不属于大数据4V特点?
A:Volume
B:Valid
C:Variety
D:Value
正确答案获取微信:424329

DAS代表的意思是()
A:两个异步存储
B:数据归档软件
C:连接一个可选的存储
D:直连存储
正确答案获取微信:424329

数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
正确答案获取微信:424329

下列不属于Google云计算平台技术架构的是()
A:并行数据处理MapReduce
B:分布式锁Chubby
C:结构化数据表BigTable
D:弹性云计算EC2
正确答案获取微信:424329

下列哪个工具常用来开发移动友好地交互地图()
A:Leaflet
B:Visual.ly
C:BPizza Pie Charts
D:Gephi
正确答案获取微信:424329

()是Microsoft Office的核心组件
A:SQL
B:WORD
C:PPT
D:EXCEL
正确答案获取微信:424329

数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
正确答案获取微信:424329

大数据的特点不包含
A:数据体量大
B:价值密度高
C:处理速度快
D:数据不统一
正确答案获取微信:424329

第一个提出大数据概念的公司是( )。
A:麦肯锡公司
B:谷歌公司
C:微软公司
D:脸谱公司
正确答案获取微信:424329

GFS中的文件切分成()的块进行存储
A:32MB
B:64MB
C:128MB
D:1G
正确答案获取微信:424329

数据清洗的方法不包括
A:缺失值处理
B:噪声数据清除
C:一致性检查
D:重复数据记录处理
正确答案获取微信:424329

MapReduce中的Map和Reduce函数使用()进行输入输出
A:key/value对
B:随机数值
C:其他计算结果
正确答案获取微信:424329

数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
正确答案获取微信:424329

下列属于传统统计学展示方法的是()
A:柱状图
B:饼状图
C:曲线图
D:网络图
正确答案获取微信:424329

离群点检测的应用包括()等。
A:欺诈检测
B:入侵检测
C:故障检测
D:疾病的不寻常模式
正确答案获取微信:424329

大数据在电信中的应用有
A:基于用户、业务及流量分级的多维管控机制
B:精准的客户分析及营销
C:利用位置和轨迹信息服务社会
正确答案获取微信:424329

大数据智能感知层:主要包括()及软硬件资源接入系统
A:数据传感体系
B:网络通信体系
C:传感适配体系
D:智能识别体系
正确答案获取微信:424329

去除噪声使得数据光滑的技术主要有:
A:分箱
B:回归
C:离群点分析
正确答案获取微信:424329

传感器工作模式类别包括()
A:基于位置
B:基于活动
C:基于设备
正确答案获取微信:424329

基于大数据的临床决策支持系统的架构包括
A:支撑层
B:大数据分析层
C:网络层
D:应用层
正确答案获取微信:424329

大数据在社交网络中的应用
A:用户偏好、情感、社交网络结构
B:用户画像、精准推荐
C:舆情监控、突发事件预警
D:预测外部趋势
正确答案获取微信:424329

数据归约(Data Reduction)主要有()
A:维度规约
B:样本规约
C:数据聚集
D:离散化概念分层
正确答案获取微信:424329

网络数据采集常用的是通过##或##等方式从网站上获取数据信息。
A:网络爬虫
B:网站公开API
C:手动获取
正确答案获取微信:424329

借助于大数据提供的##和##,政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。
A:消费能力
B:趋势报告
C:购物结果
正确答案获取微信:424329

数据工厂包括
A:低能耗数据中心
B:超大规模讲分布式架构
C:新一代智能自动化运维
D:超强云安全
正确答案获取微信:424329

交通数据处理包括以下几个步骤()
A:数据清洗
B:数据映射
C:数据组织
D:数据聚类
正确答案获取微信:424329

大数据四大特征包括( )
A:数据量大
B:数据类型繁多
C:数据价值密度相对较低
D:处理速度快,时效性要求高
正确答案获取微信:424329

百度大数据引擎主要包含三大组件()
A:开放云
B:数据工厂
C:百度大脑。
正确答案获取微信:424329

概念描述(concept description):对含有大量数据的数据集合进行概述性的总结并获得简明、准确的描述。
A:对
B:错
正确答案获取微信:424329

大数据的挑战仅仅来自于数据的增长。
A:对
B:错
正确答案获取微信:424329

Human mobility 即“人类移动性”,表示人类个体或群体在地理空间中具有特定意义的“移动(Movement)”所隐含的社会系统要素时空分布与演化规律。
A:对
B:错
正确答案获取微信:424329

R语言是闭源的
A:对
B:错
正确答案获取微信:424329

数据存取和共享机制是大数据发展面临的挑战
A:对
B:错
正确答案获取微信:424329

FP-growth算法需要对数据库进行三次扫描
A:对
B:错
正确答案获取微信:424329

大数据处理的关键技术主要包括:数据采集和预处理、数据存储、数据计算架构、数据分析和挖掘、数据可视化展示等。
A:对
B:错
正确答案获取微信:424329

云计算(Cloud Computing)?是一种分布在大规模数据中心、能动态的提供各种服务器资源以满足科研、电子商务等领域需求的计算平台。
A:对
B:错
正确答案获取微信:424329

Pentaho是最流行的开源商业智能软件之一
A:对
B:错
正确答案获取微信:424329

数据缺失是大数据库中常见的问题,产生的原因也是多种多样的。主要包括机械原因和人为原因。
A:对
B:错
正确答案获取微信:424329

用户可以感知不同属性之间的相关性,过滤掉噪声和不相关的轨迹,用于进一步调查有趣的案例。分析人员可以交互式地逐步优化设置以改进结果。
A:对
B:错
正确答案获取微信:424329

数据分析是大数据发展面临的挑战
A:对
B:错
正确答案获取微信:424329

数据预处理的主要内容包括数据清洗、数据集成、数据变换和数据规约
A:对
B:错
正确答案获取微信:424329

共享变量,就是各个节点都可以都共享的变量。
A:对
B:错
正确答案获取微信:424329

一些企业会使用传统的关奥鹏教育南开大学平时作业系型数据库来存储数据。这些数据库中存储的海量结构化数据也是大数据的主要来源之一。
A:对
B:错
正确答案获取微信:424329

累加器只有驱动程序才能读取
A:对
B:错
正确答案获取微信:424329

大数据可视化便于人们对数据的理解
A:对
B:错
正确答案获取微信:424329

大数据从概念化走向价值化是大数据的发展趋势
A:对
B:错
正确答案获取微信:424329

云存储是在云计算(cloud computing)概念上延伸和发展出来的一个新的概念,是一种新兴的网络存储技术。
A:对
B:错
正确答案获取微信:424329

云存储中用户需要按需付费并使用存储服务
A:对
B:错
正确答案获取微信:424329

提供优质的教育资源

公众号: 超前自学网