Python机器学习编程与实战教学教案04pandas进阶.docx

上传人:太** 文档编号:39814624 上传时间:2022-09-08 格式:DOCX 页数:5 大小:14.04KB
返回 下载 相关 举报
Python机器学习编程与实战教学教案04pandas进阶.docx_第1页
第1页 / 共5页
Python机器学习编程与实战教学教案04pandas进阶.docx_第2页
第2页 / 共5页
点击查看更多>>
资源描述

《Python机器学习编程与实战教学教案04pandas进阶.docx》由会员分享,可在线阅读,更多相关《Python机器学习编程与实战教学教案04pandas进阶.docx(5页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第4章pandas进阶教案课程名称:Python机器学习编程与实战课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论36学时,实验28学时)总学分:4.0学分本章学时:8学时一、材料清单(1)Python机器学习编程与实战教材。(2)配套 PPT。(3)数据(4)代码(5)引导性提问。(6)探究性问题。(7)拓展性问题。二、教学目标与基本要求.教学目标介绍文本文件,Excel数据和数据库数据三种常用的数据读取与写入方式。介绍 DataFrame的常用描述性统计分析方法。介绍时间序列的移动窗口方法。剖析分组聚合方法 groupby的原理,用法和三种分组计算方法。展现透视表与交

2、叉表的制作方法。介绍缺失值 与重复数据的检测和处理方法。介绍连续型数据离散化的方法和类别型数据的哑变量处理方 法。为使用pandas进行机器学习中的数据准备工作打下基础。1 .基本要求(1)掌握常见的数据读写方式。(2)掌握常用的描述性统计分析方法。(3)掌握移动窗口的方法。(4)掌握分组聚合的原理与方法。(5)掌握透视表与交叉表的制作。(6)掌握缺失值与重复数据的检测和处理方法。(7)掌握连续型数据离散化的方法。(8)掌握哑变量处理类别型数据的方法。三、问题1 .引导性提问引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问 题,提问,从而达到理解、掌握知识,发展各种

3、能力和提高思想觉悟的目的。(1)常见的结构化数据读取方式有哪些?(2)常见的描述性统计分析指标有哪些?(3) Excel透视表如何制作?2 .探究性问题探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的 基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课 文中又是重要的问题加以设问。(1)读取数据库数据为什么需要别的库?(2)重复值是否一定要处理?(3)以百万级的数据为例,Excel制作透视表和Python制作透视表哪个速度更快?3.拓展性问题拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提 出切实可行的关乎实

4、际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问 题。(1)能否读取word数据,该如何做?(2)除了哑变量处理外,还有那些方法可以处理离散型特征?(3)能否将这些方法写成自定义函数?四、主要知识点、重点与难点1.主要知识点(1)常见的数据读写方式。(2)常用的描述性统计分析方法。(3)时间序列的移动窗口方法。(4)分组聚合的原理与方法。(5)透视表与交叉表的制作。(6)缺失值的检测与处理。(7)重复值的检测与处理。(8)连续型特征离散化。(9)类别型特征哑变量处理。2.重点(1)常见的数据读写方式。(2)常用的描述性统计分析方法。(3)分组聚合的原理与方法。(4)透视表与交叉表

5、的制作。(5)缺失值的检测与处理。(6)重复值的检测与处理。(7)连续型特征离散化。(8)类别型特征哑变量处理。3.难点(1)常见的数据读写方式。(2)分组聚合的原理与方法。(3)透视表与交叉表的制作。(4)类别型特征哑变量处理。五、教学过程设计1.理论教学过程(1)读写文本文件。(2)读写Excel文件。(3)读写数据库数据。(4)介绍DataFrame的常用描述性统计分析方法。(5)使用rolling方法移动窗口。(6)使用groupby方法拆分数据。(7)使用agg方法聚合数据。(8)使用apply方法聚合数据。(9)使用transform方法聚合数据。(10)使用povit_table

6、函数创建透视表。(11)使用crosstab函数创建交叉表。(12)检测与处理缺失值。(13)检测与处理重复值。(14)离散化连续型数据。(15)哑变量处理类别型数据。2.实验教学过程(1)读写文本文件。(2)读写Excel文件。(3)读写数据库数据。(4)描述分析DataFrame数据。(5)移动窗口时间序列。(6)使用groupby方法拆分数据。(7)使用agg、叩ply、transform方法聚合数据。(8)制作透视表。(9)制作交叉表。(10)检测与处理重复值、缺失值。(11)离散化连续型数据。(12)哑变量处理类别型数据。六、教材与参考资料1.教材林耀进,张良均.Python机器学习编程与实战M.北京:人民邮电出版社.2020.2.参考资料1张健,张良均.Python编程基础M.北京:人民邮电出版社.2018.谭立云,2黄红梅,张良均.Python数据分析与应用M.北京:人民邮电出版社.2018.3张良均.Python数据分析与挖掘实战(第2版)M.北京:机械工业出版社.2019.4李明江,张良均,周东平,张尚佳.Python3智能数据分析快速入门M.北京: 机械工业出版社.2016.5张良均.Python与数据挖掘M.北京:机械工业出版社.2016.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 解决方案

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com