南开大学23秋学期《数据分析》在线作业三

奥鹏南开大学23年秋季新学期作业参考

23秋学期(高起本:1709-2103、专升本/高起专:2003-2103)《数据分析》在线作业-00003

逻辑回归优化的目标函数为()
A:极大似然估计
B:对数似然函数
C:特征独立假设
D:贝叶斯定理
正确答案问询微信:424329

Apriori算法的加速过程依赖于以下哪个策略( )
A:抽样
B:剪枝
C:缓冲
D:并行
正确答案问询微信:424329

以下哪个会降低Apriori算法的挖掘效率( )
A:支持度阈值增大
B:项数减少
C:事务数减少
D:减小硬盘读写速率
正确答案问询微信:424329

逻辑斯谛分布的分布函数范围在()
A:(-∞,+∞)
B:(0,1)
C:(-1/2,1/2)
D:(-1,1)
正确答案问询微信:424329

向量空间模型中,将单词在文本中出现的数据用一个()表示
A:单词-文本矩阵
B:单词-向量矩阵
C:距离矩阵
D:权重矩阵
正确答案问询微信:424329

在估计PLSA生成模型的参数时,使用()
A:极大似然估计
B:对数似然函数
C:特征独立假设
D:贝叶斯定理
正确答案问询微信:424329

算法中用到了外存的算法是()
A:随机算法
B:外存算法
C:并行算法
D:Anytime算法
正确答案问询微信:424329

聚合聚类算法的代表是()
A:AGNES
B:Apriori
C:KNN
D:FP-Growth
正确答案问询微信:424329

闵式距离参数是()时代表曼哈顿距离
A:0
B:1
C:2
D:无穷
正确答案问询微信:424329

评价分类器效果时,表示正确分类的样本数与总样本数之比的指标是()。
A:准确率
B:精确率
C:召回率
D:F1值
正确答案问询微信:424329

维克托?迈尔-舍恩伯格在《大数据时代:生活、工作与思维的大变革》一书中,持续强调了一个观点:大数据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系。其中,数据之间的相关关系可以通过以下哪个算法直接挖掘()
A:K-means
B:Bayes Network
C:C4.5
D:Apriori
正确答案问询微信:424329

大数据分析中,面向有用户参与分析决策的分析任务,不要求实时响应,但是也存在响应时间约束,称为()
A:实时分析
B:弱实时分析
C:非实时分析
正确答案问询微信:424329

在网页中增加大量与主题无关的热点作弊词项,并将其文字颜色设置成与背景颜色一致,不可见;提交热点查询给搜索引擎,将排名第一或前列的页面内容复制到其网页中,并隐藏。这样的欺骗搜索引擎技术称为()
A:词项作弊
B:链接作弊
正确答案问询微信:424329

针对输入数据、时间与其他资源的要求,给出各种性能的输出结果,得到具有一定预计性的算法模型,被称为()
A:随机算法
B:外存算法
C:并行算法
D:Anytime算法
正确答案问询微信:424329

数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。
A:运营式系统阶段
B:用户原创内容阶段
C:感知式系统阶段
正确答案问询微信:424329

经典的Apriori算法是逐层扫描的,也就是说它是()优先的
A:宽度
B:深度
正确答案问询微信:424329

以下哪种类型的数据不是大数据分析模型的分类标准
A:结构化数据
B:异构数据
C:半结构化数据
D:非结构化数据
正确答案问询微信:424329

哪个选项不属于大数据4V特点?
A:Volume
B:Valid
C:Variety
D:Value
正确答案问询微信:424329

以下属于关联分析的是( )
A:CPU性能预测
B:购物篮分析
C:自动判断鸢尾花类别
D:股票趋势建模
正确答案问询微信:424329

评估模型的分类预测准确率,使用()进行评估;
A:训练数据集
B:验证数据集
C:测试数据集
D:未知数据
正确答案问询微信:424329

Q型聚类的结果具有()的特点
A:直观
B:细致
C:全面
D:合理
正确答案问询微信:424329

下列属于明显社团的有()。
A:Facebook
B:YouTube
C:数据库网页
D:IMDB
正确答案问询微信:424329

关联分析的作用是什么()
A:用于发现存在于大量数据集中的关联性
B:用于发现存在于大量数据集中的相关性
C:描述了一个事物中某些属性同时出现的规律
D:描述了一个事物中某些属性同时出现的模式
正确答案问询微信:424329

根据输入的特征,可以将大数据分析模型分成()
A:监督学习
B:无监督学习
C:半监督学习
正确答案问询微信:424329

层次方法中,自底向上的方法是哪种()
A:凝聚法
B:分裂法
C:K-均值算法
D:K-中心点算法
正确答案问询微信:424329

以下什么问题可以归为回归问题()
A:市场趋势预测
B:产品质量管理
C:客户满意度调查
D:投资风险分析
正确答案问询微信:424329

决策树中的内部结点表示()
A:特征
B:类
C:属性
D:值域输出
正确答案问询微信:424329

大数据聚类分析中,归并依据的是()
A:特征的相似度
B:特征的距离
C:特征显著性
D:置信度
正确答案问询微信:424329

回归分析方法中,按照输入变量个数分类,可分为
A:一元回归
B:多元回归
C:线性回归
D:非线性回归
正确答案问询微信:424329

聚类的核心是()
A:相似度
B:距离
C:特征
D:数据
正确答案问询微信:424329

SVM是在特征空间上的间隔最大的线性分类器。()
A:对
B:错
正确答案问询微信:424329

大数据可视化的意义在于以简单、友好、易用的图形化、智能化的形式将数据呈现给用户,供其分析使用
A:对
B:错
正确答案问询微信:424329

大数据规则性分析用于预测未来时间发生的概率和演化趋势
A:对
B:错
正确答案问询微信:424329

NewSQL不仅具有NoSQL对海量数据的存储管理,还保持了传统数据库支持ACID和SQL的特性
A:对
B:错
正确答案问询微信:424329

损失函数的期望成为风险函数
A:对
B:错
正确答案问询微信:424329

相比较基于内容的协同过滤,基于用户的协同过滤效果往往更好
A:对
B:错
正确答案问询微信:424329

推荐系统经常被应用于在线商城、个性化阅读以及电影推荐
A:对
B:错
正确答案问询微信:424329

类的直径是任意两个样本间的最大距离。()
A:对
B:错
正确答案问询微信:424329

Apriori算法为完成频繁项集挖掘,需对各项集的支持度进行计数,但在计数之前,需要完成各项集的生成工作。()
A:对
B:错
正确答案问询微信:424329

监督学习中,模型就是索要学习的联合概率分布或决策函数
A:对
B:错
正确答案问询微信:424329

一个样本在特征空间的k个最相邻样本中的均属于某一个类别
A:对
B:错
正确答案问询微信:424329

云计算出现后,数据存储服务衍生出了新的商业模式,数据中心的出现降低了公司的计算和存储成本。
A:对
B:错
正确答案问询微信:424329

通过大数据的分析将会更精确地预测未来的天气,帮助农民做好自然灾害的预防工作,帮助政府实现农业的精细化管理和科学决策。
A:对
B奥鹏南开大学23年秋季新学期作业参考:错
正确答案问询微信:424329

半监督学习通常有大量标注数据、少量未标注数据
A:对
B:错
正确答案问询微信:424329

大数据分析可以分为定性数据分析和定量数据分析
A:对
B:错
正确答案问询微信:424329

PageRank算法不考虑不同链接的重要性。()
A:对
B:错
正确答案问询微信:424329

同义词可以表示同一个话题,而多义词可以表示不同的话题。()
A:对
B:错
正确答案问询微信:424329

kNN算法中,选择较小的k值“学习”的近似误差会减小。()
A:对
B:错
正确答案问询微信:424329

TF-IDF算法中,IDF指的是文档频率
A:对
B:错
正确答案问询微信:424329

正则化项一般是模型复杂度的单调递增函数,模型越复杂,正则化值就越大
A:对
B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网