南开大学23秋学期《数据科学导论》在线作业一

奥鹏南开大学23年秋季新学期作业参考

23秋学期(高起本:1709-2103、专升本/高起专:2003-2103)《数据科学导论》在线作业-00001

通过变量标准化计算得到的回归方程称为()。
A:标准化回归方程
B:标准化偏回归方程
C:标准化自回归方程
D:标准化多回归方程
正确答案问询微信:424329

例如将工资收入属性值映射到[-1,1]或者[0,1]内属于数据变换中的()
A:简单函数变换
B:规范化
C:属性构造
D:连续属性离散化
正确答案问询微信:424329

维克托?迈尔-舍恩伯格在《大数据时代:生活、工作与思维的大变革》一书中,持续强调了一个观点:大数据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系。其中,数据之间的相关关系可以通过以下哪个算法直接挖掘( )
A:K-means
B:Bayes Network
C:C4.5
D:Apriori
正确答案问询微信:424329

为了解决任何复杂的分类问题,使用的感知机结构应至少包含()个隐含层。
A:1
B:2
C:3
D:4
正确答案问询微信:424329

在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。
A:减小,减小
B:减小,增大
C:增大,减小
D:增大,增大
正确答案问询微信:424329

单层感知机是由()层神经元组成。
A:一
B:二
C:三
D:四
正确答案问询微信:424329

某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为^Y=100-1.2X,这说明()。
A:产量每增加一台,单位成本增加100元
B:产量每增加一台,单位成本减少1.2元
C:产量每增加一台,单位成本平均减少1.2元
D:产量每增加一台,单位平均增加100元
正确答案问询微信:424329

哪一项不属于规范化的方法()
A:最小-最大规范化
B:零-均值规范化
C:小数定标规范化
D:中位数规范化
正确答案问询微信:424329

我们需要对已生成的树()进行剪枝,将树变得简单,从而使它具有更好的泛化能力。
A:自上而下
B:自下而上
C:自左而右
D:自右而左
正确答案问询微信:424329

在一元线性回归中,通过最小二乘法求得的直线叫做回归直线或()。
A:最优回归线
B:最优分布线
C:最优预测线
D:最佳分布线
正确答案问询微信:424329

一元线性回归中,真实值与预测值的差称为样本的()。
A:误差
B:方差
C:测差
D:残差
正确答案问询微信:424329

K-means聚类适用的数据类型是()。
A:数值型数据
B:字符型数据
C:语音数据
D:所有数据
正确答案问询微信:424329

单层感知机拥有()层功能神经元。
A:一
B:二
C:三
D:四
正确答案问询微信:424329

具有偏差和至少()个S型隐含层加上一个()输出层的网络能够逼近任何有理数。
A:1,线性
B:2,线性
C:1,非线性
D:2,非线性
正确答案问询微信:424329

在一元线性回归模型中,残差项服从()分布。
A:泊松
B:正态
C:线性
D:非线性
正确答案问询微信:424329

以下哪个不是处理缺失值的方法()
A:删除记录
B:按照一定原则补充
C:不处理
D:随意填写
正确答案问询微信:424329

层次聚类适合规模较()的数据集
A:大
B:中
C:小
D:所有
正确答案问询微信:424329

层次聚类对给定的数据进行()的分解。
A:聚合
B:层次
C:分拆
D:复制
正确答案问询微信:424329

实体识别属于以下哪个过程()
A:数据清洗
B:数据集成
C:数据规约
D:数据变换
正确答案问询微信:424329

下列两个变量之间的关系中,哪个是函数关系()。
A:人的性别和他的身高
B:人的工资与年龄
C:正方形的面积和边长
D:温度与湿度
正确答案问询微信:424329

下列选项是BFR的对象是()
A:废弃集
B:临时集
C:压缩集
D:留存集
正确答案问询微信:424329

层次聚类的方法是()
A:聚合方法
B:分拆方法
C:组合方法
D:比较方法
正确答案问询微信:424329

多层感知机的学习过程包含()。
A:信号的奥鹏南开大学23年秋季新学期作业参考正向传播
B:信号的反向传播
C:误差的正向传播
D:误差的反向传播
正确答案问询微信:424329

数据科学具有哪些性质()
A:有效性
B:可用性
C:未预料
D:可理解
正确答案问询微信:424329

K-means聚类中K值选取的方法是()。
A:密度分类法
B:手肘法
C:大腿法
D:随机选取
正确答案问询微信:424329

系统日志收集的基本特征有()
A:高可用性
B:高可靠性
C:可扩展性
D:高效率
正确答案问询微信:424329

k近邻法的基本要素包括()。
A:距离度量
B:k值的选择
C:样本大小
D:分类决策规则
正确答案问询微信:424329

对于多层感知机,()层拥有激活函数的功能神经元。
A:输入层
B:隐含层
C:输出层
正确答案问询微信:424329

距离度量中的距离可以是()
A:欧式距离
B:曼哈顿距离
C:Lp距离
D:Minkowski距离
正确答案问询微信:424329

相关性的分类,按照相关的方向可以分为()。
A:正相关
B:负相关
C:左相关
D:右相关
正确答案问询微信:424329

获取数据的方式有多种,可以从网页、测量、数据库、传统媒体、监控等等方式
A:对
B:错
正确答案问询微信:424329

决策树内部结点表示一个类,叶结点表示一个特征或属性
A:对
B:错
正确答案问询微信:424329

两个对象越相似,他们的相异度就越高。
A:对
B:错
正确答案问询微信:424329

平均减少的不纯度越大,则特征重要度越高。
A:对
B:错
正确答案问询微信:424329

随着特征维数的增加,特征空间呈指数倍增长,样本密度急剧减小,样本稀疏。
A:对
B:错
正确答案问询微信:424329

一个人的身高与体重之间具有函数关系。
A:对
B:错
正确答案问询微信:424329

在数据预处理时,无论什么情况,都可以直接将异常值删除
A:对
B:错
正确答案问询微信:424329

信息熵越大,数据信息的不确定性越小。
A:对
B:错
正确答案问询微信:424329

方差过小的特征对数据的区分能力强
A:对
B:错
正确答案问询微信:424329

分拆方法是自底向上的方法。
A:对
B:错
正确答案问询微信:424329

在树的结构中,特征越重要,就越远离根节点。
A:对
B:错
正确答案问询微信:424329

探索性数据分析的特点是研究从原始数据入手,完全以实际数据为依据。
A:对
B:错
正确答案问询微信:424329

K-means聚类是发现给定数据集的K个簇的算法。
A:对
B:错
正确答案问询微信:424329

给定关联规则A→B,意味着:若A发生,B也会发生。
A:对
B:错
正确答案问询微信:424329

K-means算法采用贪心策略,通过迭代优化来近似求解。
A:对
B:错
正确答案问询微信:424329

当训练集较大的时候,标准BP算法通常会更快的获得更好的解。
A:对
B:错
正确答案问询微信:424329

一般而言,信息增益越大,则意味着使用属性a来进行划分所获得的“纯度提升越大”,因此我们可用信息增益来进行决策树的最优特征选择。
A:对
B:错
正确答案问询微信:424329

sigmoid函数属于阶跃函数,是神经网络中常见的激活函数。
A:对
B:错
正确答案问询微信:424329

使用SVD方法进行图像压缩不可以保留图像的重要特征。
A:对
B:错
正确答案问询微信:424329

当维度增加时,特征空间的体积增加得很快,使得可用的数据变得稠密。
A:对
B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网