《机器学习入门机器学习入门 (3).pdf》由会员分享,可在线阅读,更多相关《机器学习入门机器学习入门 (3).pdf(22页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、目目 录录1发展历程发展历程 2应用现状应用现状3初识机器学习初识机器学习基本术语基本术语4初识机器学习033.1 案例瑞雪兆丰年u我们中国有一句关于农业生产的古老谚语我们中国有一句关于农业生产的古老谚语:瑞雪兆丰年。瑞雪兆丰年。u就是说,如果前一年的动态下雪很大很多,那么第二就是说,如果前一年的动态下雪很大很多,那么第二年庄稼丰收的可能性比较大。这条谚语是怎么来的呢?年庄稼丰收的可能性比较大。这条谚语是怎么来的呢?我们可以想象一下当时的情景:我们可以想象一下当时的情景:第一年冬天第二年收获时节第二年冬天第三年收获时节第三年冬天第四年收获时节年复一年,若干年后的冬天u这就是瑞雪兆丰年的故事。头
2、年的瑞雪和来年的丰收,本是两这就是瑞雪兆丰年的故事。头年的瑞雪和来年的丰收,本是两个看起来并不相关的现象,但是智慧的农民伯伯通过几十年甚个看起来并不相关的现象,但是智慧的农民伯伯通过几十年甚至几代人的经验,总结出了两个现象之间的规律。至几代人的经验,总结出了两个现象之间的规律。u现代的农业学家通过科学的分析,弄清了瑞雪兆丰年规律背后的现代的农业学家通过科学的分析,弄清了瑞雪兆丰年规律背后的本质原理。但是对于古代农民伯伯来说,知道规律就足够了,可本质原理。但是对于古代农民伯伯来说,知道规律就足够了,可以通过规律来为下一年的生产生活做出有效的调整。以通过规律来为下一年的生产生活做出有效的调整。3.
3、2 案例啤酒和尿不湿u上个世纪上个世纪9090年代,沃尔玛超市已经是美国最大的零售企业,年代,沃尔玛超市已经是美国最大的零售企业,拥有大量的顾客资源。那时候的沃尔玛已经采用了先进的计算拥有大量的顾客资源。那时候的沃尔玛已经采用了先进的计算机技术,随时记录着每天众多顾客购物车中所挑选的商品明细。机技术,随时记录着每天众多顾客购物车中所挑选的商品明细。顾客顾客B:我今天买了一瓶啤我今天买了一瓶啤酒,两包尿不湿。酒,两包尿不湿。顾客顾客A:我今天买了一个网球拍,我今天买了一个网球拍,两瓶啤酒,一包尿不湿。两瓶啤酒,一包尿不湿。顾客顾客C:我今天买了我今天买了两瓶啤酒,一两瓶啤酒,一瓶白酒。本来想买尿
4、不湿,可是瓶白酒。本来想买尿不湿,可是没找到,算了。没找到,算了。顾客顾客D:我今天买了我今天买了四包尿不湿,四包尿不湿,两包烟,一瓶啤酒,五斤苹果。两包烟,一瓶啤酒,五斤苹果。顾客顾客E:我今天本来想买啤酒和尿我今天本来想买啤酒和尿不湿,可是只找到尿不湿,没找不湿,可是只找到尿不湿,没找到啤酒到啤酒。只买一样太麻烦,哎,。只买一样太麻烦,哎,去别的超市看看吧。去别的超市看看吧。就这样经年累月,沃尔玛积累了就这样经年累月,沃尔玛积累了大量的客户购物数据。直到某一大量的客户购物数据。直到某一天,沃尔玛的技术专家发现:天,沃尔玛的技术专家发现:所以,我们可以尝试把超市的啤所以,我们可以尝试把超市的
5、啤酒和尿不湿放在一起。酒和尿不湿放在一起。于是,这一尝试之后顾客顾客C:哈哈,今天找到尿不湿了哈哈,今天找到尿不湿了。啤酒和尿不湿我都买。啤酒和尿不湿我都买。顾客顾客E:啤酒和尿不湿放在一起,啤酒和尿不湿放在一起,真方便,以后都在这里买东西,真方便,以后都在这里买东西,不用去别的超市了。不用去别的超市了。u这就是沃尔玛啤酒和尿不湿的故事。顾客购买啤酒的行为和顾客这就是沃尔玛啤酒和尿不湿的故事。顾客购买啤酒的行为和顾客购买尿不湿的行为,原本是两个看起来没什么关联的现象。购买尿不湿的行为,原本是两个看起来没什么关联的现象。u但是沃尔玛的技术专家以大量的用户购物数据为样本,通过先进但是沃尔玛的技术专
6、家以大量的用户购物数据为样本,通过先进的算法,最终寻找到了两者之间的重要关联和规律。的算法,最终寻找到了两者之间的重要关联和规律。关联规则关联规则经经 验:历史数据验:历史数据挖掘关联挖掘关联推测推测关联、规律关联、规律顾客购物情况顾客购物情况啤酒和尿不湿的关联啤酒和尿不湿的关联3.3 总结规规 律律经经 验:历史数据验:历史数据归纳归纳新的新的问题问题预测预测来年来年收获收获输入输入多年的冬天降雪和收获情况多年的冬天降雪和收获情况常年劳动经验总结常年劳动经验总结假设模型假设模型新一年降雪情况新一年降雪情况预测来年收获预测来年收获模型:学习方法模型:学习方法训练集训练集训练训练新的新的数据数据预测、决策预测、决策未知未知属性属性输入输入评估评估3.4 机器学习 (Machine(Machine Learning)(1 1)机器学习:机器学习:一门学科。一门学科。(2 2)目的:目的:通过计算的手段,利用经验来完善系统自身的性通过计算的手段,利用经验来完善系统自身的性能。能。(3 3)研究内容研究内容:学习算法,即:把经验数据提供给计算机,:学习算法,即:把经验数据提供给计算机,它就能基于这些数据产生模型它就能基于这些数据产生模型;在面对新的情况时,模型会给在面对新的情况时,模型会给我们提供相应的判断。我们提供相应的判断。感谢聆听!感谢聆听!