数据挖掘试题.docx

上传人:H****o 文档编号:13066731 上传时间:2022-04-27 格式:DOCX 页数:10 大小:45.25KB
返回 下载 相关 举报
数据挖掘试题.docx_第1页
第1页 / 共10页
数据挖掘试题.docx_第2页
第2页 / 共10页
点击查看更多>>
资源描述

《数据挖掘试题.docx》由会员分享,可在线阅读,更多相关《数据挖掘试题.docx(10页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -单项题1. 某超市讨论销售纪录数据后发觉,买啤酒的人很大致率也会购买尿布,这种属于数据挖掘的哪类问题?AA. 关联规章发觉B. 聚类C.分类D. 自然语言处理3. 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?CA. 频繁模式挖掘B.分类和猜测C. 数据预处理D.数据流挖掘4. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分别? BA. 分类B. 聚类C. 关联分析D.隐马尔可夫链6. 使用交互式的和可视化的技术,对数据进行探究属于数据挖掘的哪一类

2、任务?(A )A. 探干脆数据分析B.建模描述C.猜测建模D.查找模式和规章11.下面哪种不属于数据预处理的方法?DA 变量代换B 离散化C集合D估量遗漏值12. 假设 12 个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15 在第几个箱子内?BA 第一个B其次个C 第三个D 第四个13.上题中,等宽划分时(宽度为50),15 又在哪个箱子里?AA 第一个B其次个C 第三个D 第四个16. 只有非零值才重要的二元属性被称作: C A 计数属性B 离散属性C 非对

3、称的二元属性D对称属性17. 以下哪种方法不属于特点挑选的标准方法:DA 嵌入B 过滤C包装D抽样18.下面不属于创建新属性的相关方法的是:B A 特点提取B 特点修改C 映射数据到新的空间D 特点构造22. 假设属性income 的最大最小值分别是12000 元和 98000 元。利用最大最小规范化的方法将属性的值映射到0 至 1 的范畴内。对属性income 的 73600 元将被转化为:DA 0.821B 1.224C 1.458D 0.71623.假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序) :13,15,16,16, 19, 20, 20, 21, 22,

4、22,25, 25,25, 30, 33, 33, 35, 35, 36, 40, 45, 46, 52,70, 问题: 使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。其次个箱子值为: AA 18.3B 22.6C 26.8D 27.928. 数据仓库是随着时间变化的,下面的描述不正确选项CA. 数据仓库随时间的变化不断增加新的数据内容;B. 捕获到的新数据会掩盖原先的快照;C. 数据仓库随大事变化不断删去旧的数据内容;D. 数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断的进行重新综合.29. 关于基本数据的元数据是指: DA. 基本元数据与数据源,数据仓库 ,数据集

5、市和应用程序等结构相关的信息;B. 基本元数据包括与企业相关的治理方面的数据和信息;C. 基本元数据包括日志文件和简历执行处理的时序调度信息;D. 基本元数据包括关于装载和更新处理,分析处理以及治理方面的信息.可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 1 页,共 5 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -30. 下面关于数据粒度的描述不正确选项: CA. 粒度是指数据仓库小数据单元的具体程度和级别;B.

6、 数据越具体 ,粒度就越小 ,级别也就越高;C. 数据综合度越高,粒度也就越大,级别也就越高 ;D. 粒度的具体划分将直接影响数据仓库中的数据量以及查询质量.33. OLAP 技术的核心是: DA. 在线性 ;B. 对用户的快速响应;C. 互操作性 .D. 多维分析 ;34. 关于 OLAP 的特性 ,下面正确选项: D1 快速性2 可分析性3 多维性4信息性5共享性 A. 1 2 3B. 2 3 4C. 1 2 3 4D. 1 2 3 4 535. 关于 OLAP 和 OLTP 的区分描述 ,不正确选项 : CA. OLAP主要是关于如何懂得集合的大量不同的数据.它与 OTAP 应用程序不同

7、 .B. 与 OLAP 应用程序不同 ,OLTP 应用程序包含大量相对简洁的事务.C. OLAP 的特点在于事务量大,但事务内容比较简洁且重复率高.D. OLAP是以数据仓库为基础的,但其最终数据来源与OLTP 一样均来自底层的数据库系统,两者面对的用户是相同的.37. 关于 OLAP 和 OLTP 的说法 ,以下不正确选项: AA. OLAP事务量大 ,但事务内容比较简洁且重复率高.B. OLAP 的最终数据来源与OLTP 不一样 .C. OLTP 面对的是决策人员和高层治理人员.D. OLTP 以应用为核心 ,是应用驱动的.38. 设 X=1 ,2, 3 是频繁项集,就可由X 产生 C 个

8、关联规章。A 、4 B 、5 C、6 D 、740. 概念分层图是B 图。A 、无向无环B、有向无环C、有向有环D、无向有环41. 频繁项集、频繁闭项集、最大频繁项集之间的关系是:CA 、频繁项集频繁闭项集=最大频繁项集B、频繁项集= 频繁闭项集最大频繁项集C、频繁项集频繁闭项集最大频繁项集D、频繁项集= 频繁闭项集= 最大频繁项集44. 在图集合中发觉一组公共子结构,这样的任务称为 B A 、频繁子集挖掘B 、频繁子图挖掘C、频繁数据项挖掘D、频繁模式挖掘48. 以下哪些算法是分类算法,A ,DBSCANB ,C4.5C,K-Mean D,EM( B)50. 决策树中不包含一下哪种结点,A,

9、 根结点( rootnode B, 内部结点( internalnode) C,外部结点( external node) D, 叶结点( leaf node) C)53. 以下哪项关于决策树的说法是错误的CA. 冗余属性不会对决策树的精确率造成不利的影响B. 子树可能在决策树中重复多次可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 2 页,共 5 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -C. 决策树算法对于噪声

10、的干扰特别敏锐D. 查找正确决策树是NP 完全问题54. 在基于规章分类器的中,依据规章质量的某种度量对规章排序,保证每一个测试记录都是由掩盖它的 “最好的 ”规格来分类,这种方案称为BA. 基于类的排序方案B. 基于规章的排序方案C. 基于度量的排序方案D. 基于规格的排序方案。57. 假如对属性值的任一组合,R 中都存在一条规章加以掩盖,就称规章集R 中的规章为 BA,无序规章B,穷举规章C, 互斥规章D,有序规章58. 假如规章集中的规章根据优先级降序排列,就称规章集是DA,无序规章B,穷举规章C, 互斥规章D,有序规章61. 以下关于人工神经网络(ANN )的描述错误的有AA ,神经网

11、络对训练数据中的噪声特别鲁棒B ,可以处理冗余特点C,训练ANN是一个很耗时的过程D,至少含有一个隐匿层的多层神经网络二、多项题1. 通过数据挖掘过程所推倒出的关系和摘要常常被称为:A BA. 模型B. 模式C. 模范D.模具2 查找数据集中的关系是为了查找精确、便利并且有价值的总结了数据的某一特点的表示,这个过程包括了以下哪些步骤?A B C DA. 打算要使用的表示的特点和结构B. 打算如何量化和比较不同表示拟合数据的好坏C. 挑选一个算法过程使评分函数最优D. 打算用什么样的数据治理原就以高效的实现算法。4. 数据挖掘算法的组件包括:A B C DA. 模型或模型结构B. 评分函数C.

12、优化和搜寻方法D.数据治理策略5. 以下哪些学科和数据挖掘有亲密联系?A DA. 统计B.运算机组成原理C. 矿产挖掘D.人工智能6. 在现实世界的数据中,元组在某些属性上缺少值是常有的。描述处理该问题的各种方法有: A 忽视元组C 使用一个全局常量填充空缺值B 使用属性的平均值填充空缺值D使用与给定元组属同一类的全部样本的平均值E 使用最可能的值填充空缺值8. 对于数据挖掘中的原始数据,存在的问题有: A 不一样B 重复C 不完整D 含噪声E 维度高12. 下面列出的条目中,哪些是数据仓库的基本特点:ACDA. 数据仓库是面对主题的B. 数据仓库的数据是集成的C. 数据仓库的数据是相对稳固的

13、D.数据仓库的数据是反映历史变化的E. 数据仓库是面对事务的13. 以下各项均是针对数据仓库的不同说法,你认为正确的有(BCDE)。A 数 据 仓 库 就 是 数 据 库B数据仓库是一切商业智能系统的基础 C数据仓库是面对业务的,支持联机事务处理(OLTP )可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 3 页,共 5 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -D数据仓库支持决策而非事务处理 E数据仓库的主要目

14、标就是帮忙分析,做长期性的战略制定14. 数据仓库在技术上的工作过程是:ABCDA.数据的抽取B.储备和治理D.数据仓库设计E.数据的表现C.数据的表现15. 联机分析处理包括以下哪些基本分析功能?BCDA. 聚类B. 切片C. 转轴D.切块E. 分类16. 利用 Apriori算法运算频繁项集可以有效降低运算频繁集的时间复杂度。在以下的购物篮中产生支持度不小于3 的候选 3-项集,在候选2-项集中需要剪枝的是(BD )ID项集1 面包、牛奶2 面包、尿布、啤酒、鸡蛋3 牛奶、尿布、啤酒、可乐4 面包、牛奶、尿布、啤酒5 面包、牛奶、尿布、可乐A 、啤酒、尿布B、啤酒、面包C、面包、尿布D 、

15、啤酒、牛奶18. Apriori算法的运算复杂度受ABCD.影响。 A 、支持度阀值B、项数(维度) C、事务数D、事务平均宽度19. 非频繁模式 AD A 、其支持度小于阈值B、都是不让人感爱好的 C、包含负模式和负相关模式D、对反常数据项敏锐22. 贝叶斯信念网络BBN 有如下哪些特点, A, 构造网络费时费劲B,对模型的过分问题特别鲁棒C, 贝叶斯网络不适合处理不完整的数据D, 网络结构确定后,添加变量相当麻烦(AB )三、判定题1. 数据挖掘的主要任务是从数据中发觉潜在的规章,从而能更好的完成描述数据、猜测数据等任务。对2. 数据挖掘的目标不在于数据采集策略,而在于对于已经存在的数据进

16、行模式的挖掘。(对)3. 图挖掘技术在社会网络分析中扮演了重要的角色。(对)4. 模式为对数据集的全局性总结,它对整个测量空间的每一点做出描述。模型就对变量变化空间的一个有限区域做出描述。(错)5. 查找模式和规章主要是对数据进行干扰,使其符合某种规章以及模式。(错)6. 离群点可以是合法的数据对象或者值。(对)7. 离散属性总是具有有限个值。(错)8. 噪声和伪像是数据错误这一相同表述的两种叫法。(错)9. 用于分类的离散化方法之间的根本区分在于是否使用类信息。(对)10. 特点提取技术并不依靠于特定的领域。(错)12. 定量属性可以是整数值或者是连续值。(对)14. DSS 主要是基于数据

17、仓库.联机数据分析和数据挖掘技术的应用。(对)15. OLAP 技术侧重于把数据库中的数据进行分析、转换成帮助决策信息,是继数据库技术进展之后迅猛进展起来的一种新技术。(对)可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 4 页,共 5 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -17. 数据仓库中间层OLAP 服务器只能采纳关系型OLAP(错)18数据仓库系统的组成部分包括数据仓库,仓库治理, 数据抽取, 分析工

18、具等四个部分. 错21. 关联规章挖掘过程是发觉满意最小支持度的全部项集代表的规章。(错)24. 假如规章不满意置信度阈值,就形如的规章肯定也不满意置信度阈值,其中是 X 的子集。(对)25. 具有较高的支持度的项集具有较高的置信度。(错)26. 聚类( clustering )是这样的过程:它找出描述并区分数据类或概念的模型或函数 ,以便能够使用模型猜测类标记未知的对象类。(错)27. 分类和回来都可用于猜测,分类的输出是离散的类别值,而回来的输出是连续数值。对29. Bayes 法是一种在已知后验概率与类条件概率的情形下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体。错可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 5 页,共 5 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 技术总结

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com