机器学习入门机器学习入门 (4).pdf

上传人:刘静 文档编号:52835391 上传时间:2022-10-24 格式:PDF 页数:9 大小:458.41KB
返回 下载 相关 举报
机器学习入门机器学习入门 (4).pdf_第1页
第1页 / 共9页
机器学习入门机器学习入门 (4).pdf_第2页
第2页 / 共9页
点击查看更多>>
资源描述

《机器学习入门机器学习入门 (4).pdf》由会员分享,可在线阅读,更多相关《机器学习入门机器学习入门 (4).pdf(9页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、目目 录录1发展历程发展历程 2应用现状应用现状3初识机器学习初识机器学习基本术语基本术语4基 本 术 语044.1案 例挑西瓜一、如何挑到正熟的好瓜?一、如何挑到正熟的好瓜?1.看颜色?看颜色?2.看外形?看外形?3.听声音?听声音?二、要点二、要点 一般色泽青绿、根蒂蜷缩、敲声浊响,就能判断出是正熟一般色泽青绿、根蒂蜷缩、敲声浊响,就能判断出是正熟的好瓜。为什么呢?的好瓜。为什么呢?(色泽色泽=青绿青绿;根蒂根蒂=蜷缩蜷缩;敲声敲声=浊响浊响),(色泽色泽=乌黑乌黑;根蒂根蒂=稍蜷稍蜷;敲声敲声=沉闷沉闷),(色泽色泽=浅白浅白;根蒂根蒂=硬挺硬挺;敲声敲声=清脆清脆),数据集(数据集(d

2、ata set)样本(样本(sample)特征值特征值(feature va1ue)特征特征(feature)1.数据集4.2 基本概念色泽色泽根蒂根蒂敲声敲声特征空间特征空间(feature space)令令D=x1,x2,.,xm 表示包含表示包含m 个样本的数个样本的数据集。每个样本由据集。每个样本由d 个特征描述。个特征描述。则每个样本则每个样本xi=(xi1,xi2,.xid)是是d 维特征空间维特征空间X 中的一个向量,为中的一个向量,为特征向量特征向量(feature vector)。d称称为特征向量的称称为特征向量的“维数维数”(dimensionality)。x1=(x11,

3、x12,x13)x2=(x21,x22,x23)请问这里的特征向量的维请问这里的特征向量的维数是多少呢?数是多少呢?x3=(x31,x32,x33)(色泽色泽=青绿青绿;根蒂根蒂=蜷缩蜷缩;敲声敲声=浊响浊响),好瓜,好瓜),(色泽色泽=乌黑乌黑;根蒂根蒂=稍蜷稍蜷;敲声敲声=沉闷沉闷),坏瓜,坏瓜),(色泽色泽=浅白浅白;根蒂根蒂=硬挺硬挺;敲声敲声=清脆清脆),坏瓜坏瓜)数据集(数据集(data set)yi Y 是是xi的标签(的标签(label),),Y是标签的集合,称为是标签的集合,称为“标签空间标签空间”(label space)或或“输出空间输出空间”。(xi,yi)表示第表示第

4、i个样个样本本yi 标记标记(label)2.数据集的划分u 构建和训练机器学习模型是希望构建和训练机器学习模型是希望对新的数据做出良好预测对新的数据做出良好预测。如何如何去保证训练的实效,可以应对以前未见过的数据呢?去保证训练的实效,可以应对以前未见过的数据呢?u 一种方法是将数据集分成一种方法是将数据集分成三个三个子集:子集:训练集训练集(train set)用于训练模型的子集用于训练模型的子集验证集验证集(validation set)用于用于评估训练集效果评估训练集效果的子集的子集测试集测试集(test set)用于测试模型的子集用于测试模型的子集训练集训练集 验证集验证集 测试集测试集本章总结0102030405发展历程机器学习的概念基本术语机器学习的典型应用三者的关系感谢聆听!感谢聆听!

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com