《研究生课程教学大纲-计算机科学与技术学院.doc》由会员分享,可在线阅读,更多相关《研究生课程教学大纲-计算机科学与技术学院.doc(3页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、精品文档,仅供学习与交流,如有侵权请联系网站删除研究生课程教学大纲数据挖掘Data Mining 36 学时; 2 学分一、课程简介数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘是一门与多学科交叉的计算机专业课程,在商业、金融、医学、科学研究、工程与政府部门管理等众多领域都有广泛应用。数据挖掘涉及计算机科学、统计、在线分析处理、情报检索、机器学习、专家系统和模式识别等诸多方法。通过课程的学习,学生可掌握:数据挖掘的基本概念、功能、处理过程及应用领域;数据预处理技术,包括数据样本的缺失处理、数据清理和数据降维等;针对不同挖掘任务的各种算法,包括概念描述、关联规则分析、分
2、类、聚类和离群点的检测等;提取模式的评价和分析;数据挖掘的发展趋势和研究前沿。二、预修课程及适用专业预修课程:算法设计与分析,程序设计适用专业:计算机科学与技术、计算机技术、软件工程、信息安全三、课程内容及学时分配第1章 序论 讲授内容:数据挖掘技术的发展、概念与处理步骤、功能、应用领域及其研究发展方向。教学目标:了解数据挖掘的基本概念、研究方向和应用领域,结合自己研究方向,思考数据挖掘具体可以解决什么问题。学时分配:2学时第2章 认识数据和数据预处理 讲授内容:包括数据对象与属性类型、数据的基本统计描述、度量数据的相似性和相异性、数据清理(缺失数据、噪声或离异点数据的处理),数据集成与转换,
3、数据的约简与降维及其应用实例。教学目标:认识数据,了解数据挖掘过程的第一步数据预处理的重要性和必要性,掌握一些经典算法。学时分配:6学时第3章 挖掘频繁模式讲授内容:讲述频繁模式挖掘的基本概念,讲述Apriori算法的基本思想、算法实现和优缺点分析,讲授模式评估方法。教学目标:了解频繁模式挖掘的基本概念,掌握频繁项集挖掘方法Apriori算法的实现,并进行分析和改进,掌握评估方法。学时分配:6学时第4章 分类 讲授内容:讲述分类基本概念,讲述多种分类算法,如基于概率统计的Bayes分类、基于归纳的决策数分类、基于判别平面或多面体的分类方法、基于统计原理的支撑向量机分类与回归等,并辅以实例描述。
4、教学目标:认识到分类是使用最广泛的数据挖掘方法,掌握几种经典分类技术,实现算法编程与具体应用。学时分配:8学时第5章 聚类分析 讲授内容:讲述聚类基本概念,讲述聚类的主要方法,如聚类分析概述、划分方法、层次方法、基于密度的方法、基于网格的方法等,并辅以实例描述。教学目标:熟悉各种聚类算法,掌握几种经典聚类算法的实现与应用。学时分配:8学时第6章 离群点检测 讲授内容:讲述离群点和离群点分析的基本概念,离群点检测方法:统计学方法、基于邻近性的方法、基于聚类的方法、基于分类的方法,并辅以实例描述。教学目标:掌握离群点的检测方法,并可以将其应用于实际。学时分配:4学时第7章 数据挖掘的发展趋势和研究
5、前沿 讲授内容:挖掘复杂的数据类型、数据挖掘的其他方法、数据挖掘应用、数据挖掘与社会、数据挖掘的发展趋势。教学目标:数据挖掘的发展趋势,了解数据挖掘研究的前沿。学时分配:2学时四、教学方法及要求课堂讲授和课堂讨论相结合,案例教学相结合。教师课堂进行理论和方法的讲授,进行案例分析并启发学生,学生应能够根据应用背景选择相应方法,实现并分析。五、考核办法考核方式:考查。成绩评定:考勤10%,课堂表现20%,案例实现2030%,研究论文4050%。六、参考书籍及阅读文献资料1 Jiawei Han,Micheline Kamber. 数据挖掘概念与技术(原书第3版). 北京:机械工业出版社,2012。
6、2 陈封能,斯坦巴赫,库玛尔. 数据挖掘导论.北京:机械工业出版社,2011。3 威滕,弗兰克,霍尔. 数据挖掘:实用机器学习工具与技术(原书第3版). 北京:机械工业出版社,2014。4 坎塔尔季奇. 数据挖掘:概念、模型、方法和算法(第2版). 北京:清华大学出版社,2014。5 Xindong Wu,Xingquan Zhu, Gong-Qing Wu,“ Dataminingwithbigdata,” Knowledge and Data Engineering, Vol.26 , no. 1,pp. 97 107,2014.6 Wei Fan, Mining big data: cu
7、rrent status, and forecast to the future, ACM SIGKDD Explorations Newsletter archive,Vol.14,no.2, pp.1-5,2012. 7 Ramn Garca-Martnez, Paola Britos, Dario Rodrguez, “Information Mining Processes Based on Intelligent Systems,” Recent Trends in Applied Artificial Intelligence, Vol.7906, pp.402-410,2013.8 Wu He, Examining students online interaction in a live video streaming environment using data mining and text mining, Computers in Human Behavior,Vo.29, no.1,pp.90102, 2013.开课单位:计算机科学与技术学院编 写 人:王煜审 定 人:王亮编写日期:2015年6月3日【精品文档】第 3 页