南开大学23年春学期《数据分析》在线作业三
奥鹏南开大学新学期作业参考
23春学期(高起本:1709-2103、专升本/高起专:1909-2103)《数据分析》在线作业-00003
在链接作弊的垃圾农场中,作弊者拥有并完全控制的网页称为()
A:不可达网页
B:可达网页
C:自有网页
正确答案问询微信:424329
非频繁模式( )
A:其置信度小于阈值
B:令人不感兴趣
C:包含负模式和负相关模式
D:对异常数据项敏感
正确答案问询微信:424329
潜在语义分析创新地引入了()
A:单词维度
B:文本维度
C:话题维度
正确答案问询微信:424329
向量空间模型中,用一个()表示语义
A:向量
B:特征
C:数字
D:距离
正确答案问询微信:424329
向量空间模型中,用()来描述一个文档
A:词
B:词袋
C:特征词
D:特征向量
正确答案问询微信:424329
算法中用到了外存的算法是()
A:随机算法
B:外存算法
C:并行算法
D:Anytime算法
正确答案问询微信:424329
使用了随机函数的算法是哪个算法()
A:随机算法
B:外存算法
C:并行算法
D:Anytime算法
正确答案问询微信:424329
置信度(confidence)是衡量兴趣度度量( )的指标
A:简洁性
B:确定性
C:实用性
D:新颖性
正确答案问询微信:424329
以下哪个会降低Apriori算法的挖掘效率( )
A:支持度阈值增大
B:项数减少
C:事务数减少
D:减小硬盘读写速率
正确答案问询微信:424329
针对输入数据、时间与其他资源的要求,给出各种性能的输出结果,得到具有一定预计性的算法模型,被称为()
A:随机算法
B:外存算法
C:并行算法
D:Anytime算法
正确答案问询微信:424329
决策树中的叶结点表示()
A:特征
B:类
C:属性
D:值域输出
正确答案问询微信:424329
pageRank中,将网页链接转化为()“投票”。
A:搜索量
B:评价
C:访问量
D:重要度
正确答案问询微信:424329
聚类过程为()
A:数据准备,特征选择,特征提取,聚类,结果评估
B:数据准备,特征提取,特征选择,聚类,结果评估
C:数据准备,特征提取,聚类,特征选择,结果评估
正确答案问询微信:424329
最小类间距离是()
A:两类中各个个体距离的最小值
B:两类中心距离
C:两类所有样本对距离的平均值
D:所有样本对之间距离的平均值
正确答案问询微信:424329
Apriori算法的加速过程依赖于以下哪个策略( )
A:抽样
B:剪枝
C:缓冲
D:并行
正确答案问询微信:424329
模型参数估计变为以()为目标函数的最优化问题
A:交叉熵损失函数
B:合页损失函数
C:对数似然函数
D:KL散度
正确答案问询微信:424329
评价分类器效果时,表示将正类样本预测为正类数与总预测为正类数之比的指标是()。
A:准确率
B:精确率
C:召回率
D:F1值
正确答案问询微信:424329
数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
正确答案问询微信:424329
类的R型聚类是指()
A:对样本个体进行聚类
B:对指标变量进行聚类。
正确答案问询微信:424329
决策树中的分支表示()
A:特征
B:类
C:属性
D:值域输出
正确答案问询微信:424329
以下哪些统计量可以反映数据的集中趋势
A:均值
B:中位数
C:方差(标准差)
D:众数
正确答案问询微信:424329
链接分析是对网络链接的()等各种现象进行分析
A:自身属性
B:链接对象
C:链接网络
正确答案问询微信:424329
KNN模型由哪些基本要素决定()
A:距离度量
B:特征选择
C:k值的选择
D:分类决策规则
正确答案问询微信:424329
向量空间模型中,是将()看成()
A:文档
B:单词
C:词袋
D:编码
正确答案问询微信:424329
下列属于朴素贝叶斯优点的是()
A:有稳定的分类效率
B:对小规模的数据表现很好
C:对缺失数据敏感
D:分类决策错误率很低
正确答案问询微信:424329
类的特征可以通过不同角度来刻画,包括()
A:类的均值
B:类的直径
C:类的样本散布矩阵
D:样本协方差矩阵
正确答案问询微信:424329
聚类方法中的划分方法包括()
A:K-均值算法
B:凝聚法
C:分裂法
D:K-中心点算法
正确答案问询微信:424329
从训练数据中学习一个()或(),将其称为()。
A:概率分类模型
B:分类决策函数
C:回归模型
D:分类器
正确答案问询微信:424329
聚类的核心是()
A:相似度
B:距离
C:特征
D:数据
正确答案问询微信:424329
基于分类对象的分类有()
A:Q型聚类
B:凝聚方式奥鹏南开大学新学期作业参考 代做2元一门
C:R型聚类
D:分解方式
正确答案问询微信:424329
啤酒与尿布的故事是聚类分析的典型实例。
A:对
B:错
正确答案问询微信:424329
中位数的优势是计算简便,不受极端值的影响
A:对
B:错
正确答案问询微信:424329
大数据可视化的意义在于以简单、友好、易用的图形化、智能化的形式将数据呈现给用户,供其分析使用
A:对
B:错
正确答案问询微信:424329
Kmeans算法的MapReduce实现属于迭代算法。()
A:对
B:错
正确答案问询微信:424329
大数据的速度快体现在数据产生速度快和要求分析处理速度快
A:对
B:错
正确答案问询微信:424329
协同过滤推荐是基于假设,为用户找到真正感兴趣的内容首先找到与此用户有相似兴趣的用户,然后把他们感兴趣的内容推荐给此用户
A:对
B:错
正确答案问询微信:424329
越来越多的企业通过架设海量数据采集系统,多用于系统日志采集,这些工具均采用分布式架构,能满足每秒数百兆的日志数据采集和传输需求。
A:对
B:错
正确答案问询微信:424329
ID3算法的核心是在决策树叶结点上应用信息增益准则选择特征,递归地构建决策树。
A:对
B:错
正确答案问询微信:424329
当一个节点宕机时,本机节点上已经完成运行的Map任务和正在运行中的Map和Reduce任务都将被调度重新执行。()
A:对
B:错
正确答案问询微信:424329
话题,指文本所讨论的内容或主题.()
A:对
B:错
正确答案问询微信:424329
每个网页的PageRank值仅由指向它的网页的PageRank值决定。()
A:对
B:错
正确答案问询微信:424329
大数据分析模型讨论的问题是从大数据中发现什么
A:对
B:错
正确答案问询微信:424329
Apriori算法的优点是速度快。()
A:对
B:错
正确答案问询微信:424329
相比较基于内容的协同过滤,基于用户的协同过滤效果往往更好
A:对
B:错
正确答案问询微信:424329
给定关联规则A?B,意味着:若A发生,B也会发生。
A:对
B:错
正确答案问询微信:424329
Q型聚类主要采取基于距离的相似性度量。
()
A:对
B:错
正确答案问询微信:424329
中文词语之间也有分界符()
A:对
B:错
正确答案问询微信:424329
TrustRank算法中,创建优质网页集合时,不会选择成员受限的域名。
A:对
B:错
正确答案问询微信:424329
在一些特定领域,比如对于企业生产经营数据或学科研究数据等保密性要求较高的数据,可以通过与企业或研究机构合作,使用特定系统接口等相关方式采集数据。
A:对
B:错
正确答案问询微信:424329
SVM是在特征空间上的间隔最大的线性分类器。()
A:对
B:错
正确答案问询微信:424329