《机器学习入门机器学习入门 (4).pdf》由会员分享,可在线阅读,更多相关《机器学习入门机器学习入门 (4).pdf(9页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、目目 录录1发展历程发展历程 2应用现状应用现状3初识机器学习初识机器学习基本术语基本术语4基 本 术 语044.1案 例挑西瓜一、如何挑到正熟的好瓜?一、如何挑到正熟的好瓜?1.看颜色?看颜色?2.看外形?看外形?3.听声音?听声音?二、要点二、要点 一般色泽青绿、根蒂蜷缩、敲声浊响,就能判断出是正熟一般色泽青绿、根蒂蜷缩、敲声浊响,就能判断出是正熟的好瓜。为什么呢?的好瓜。为什么呢?(色泽色泽=青绿青绿;根蒂根蒂=蜷缩蜷缩;敲声敲声=浊响浊响),(色泽色泽=乌黑乌黑;根蒂根蒂=稍蜷稍蜷;敲声敲声=沉闷沉闷),(色泽色泽=浅白浅白;根蒂根蒂=硬挺硬挺;敲声敲声=清脆清脆),数据集(数据集(d
2、ata set)样本(样本(sample)特征值特征值(feature va1ue)特征特征(feature)1.数据集4.2 基本概念色泽色泽根蒂根蒂敲声敲声特征空间特征空间(feature space)令令D=x1,x2,.,xm 表示包含表示包含m 个样本的数个样本的数据集。每个样本由据集。每个样本由d 个特征描述。个特征描述。则每个样本则每个样本xi=(xi1,xi2,.xid)是是d 维特征空间维特征空间X 中的一个向量,为中的一个向量,为特征向量特征向量(feature vector)。d称称为特征向量的称称为特征向量的“维数维数”(dimensionality)。x1=(x11,
3、x12,x13)x2=(x21,x22,x23)请问这里的特征向量的维请问这里的特征向量的维数是多少呢?数是多少呢?x3=(x31,x32,x33)(色泽色泽=青绿青绿;根蒂根蒂=蜷缩蜷缩;敲声敲声=浊响浊响),好瓜,好瓜),(色泽色泽=乌黑乌黑;根蒂根蒂=稍蜷稍蜷;敲声敲声=沉闷沉闷),坏瓜,坏瓜),(色泽色泽=浅白浅白;根蒂根蒂=硬挺硬挺;敲声敲声=清脆清脆),坏瓜坏瓜)数据集(数据集(data set)yi Y 是是xi的标签(的标签(label),),Y是标签的集合,称为是标签的集合,称为“标签空间标签空间”(label space)或或“输出空间输出空间”。(xi,yi)表示第表示第
4、i个样个样本本yi 标记标记(label)2.数据集的划分u 构建和训练机器学习模型是希望构建和训练机器学习模型是希望对新的数据做出良好预测对新的数据做出良好预测。如何如何去保证训练的实效,可以应对以前未见过的数据呢?去保证训练的实效,可以应对以前未见过的数据呢?u 一种方法是将数据集分成一种方法是将数据集分成三个三个子集:子集:训练集训练集(train set)用于训练模型的子集用于训练模型的子集验证集验证集(validation set)用于用于评估训练集效果评估训练集效果的子集的子集测试集测试集(test set)用于测试模型的子集用于测试模型的子集训练集训练集 验证集验证集 测试集测试集本章总结0102030405发展历程机器学习的概念基本术语机器学习的典型应用三者的关系感谢聆听!感谢聆听!