随机决策理论与方法课件.ppt

上传人:石*** 文档编号:87284681 上传时间:2023-04-16 格式:PPT 页数:68 大小:3.60MB
返回 下载 相关 举报
随机决策理论与方法课件.ppt_第1页
第1页 / 共68页
随机决策理论与方法课件.ppt_第2页
第2页 / 共68页
点击查看更多>>
资源描述

《随机决策理论与方法课件.ppt》由会员分享,可在线阅读,更多相关《随机决策理论与方法课件.ppt(68页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、随机决策理论与方法随机决策理论与方法第1页,此课件共68页哦*决策理论与方法-随机决策理论与方法随机性决策随机性决策vv风险性决策(随机性决策)风险性决策(随机性决策):指有多种未来状态和:指有多种未来状态和相应后果,但只能得到各种状态发生的概率而难以相应后果,但只能得到各种状态发生的概率而难以获得充分可靠信息的决策问题。获得充分可靠信息的决策问题。vv特点特点:状态的随机性;决策结果的效用特性。:状态的随机性;决策结果的效用特性。vv决策的已知变量决策的已知变量:状态空间的概率分布状态空间的概率分布状态空间的概率分布状态空间的概率分布=,后果的效用函数后果的效用函数后果的效用函数后果的效用函

2、数(或损失函数或损失函数或损失函数或损失函数):u u(c(cij ij),c cij ij表示采取方案表示采取方案表示采取方案表示采取方案a ai i时出现状态时出现状态时出现状态时出现状态 j j的后果的后果的后果的后果vv解决问题的主要理论方法解决问题的主要理论方法:概率论与数理统计:概率论与数理统计第2页,此课件共68页哦*决策理论与方法-随机决策理论与方法随机决策理论与方法随机决策理论与方法1、主观概率、主观概率2、效用函数、效用函数3、决策准则、决策准则4、贝叶斯决策分析、贝叶斯决策分析第3页,此课件共68页哦*决策理论与方法-随机决策理论与方法主观概率主观概率概率的定义概率的定义

3、vv古典概率的定义古典概率的定义古典概率的定义古典概率的定义:在相同条件下进行了:在相同条件下进行了:在相同条件下进行了:在相同条件下进行了n n次试验(随机试验),其中次试验(随机试验),其中次试验(随机试验),其中次试验(随机试验),其中事件事件事件事件A A发生的次数发生的次数发生的次数发生的次数n nA A称为事件称为事件称为事件称为事件A A发生的频数,比值发生的频数,比值发生的频数,比值发生的频数,比值n nA A/n n称为事件称为事件称为事件称为事件A A发生的频率,记为发生的频率,记为发生的频率,记为发生的频率,记为f fn n(A)(A),则古典概率的定义为:,则古典概率的

4、定义为:,则古典概率的定义为:,则古典概率的定义为:p p(A)=(A)=limlimn nf fn n(A)(A)vvLaplaceLaplace的定义的定义的定义的定义:p p(A)=(A)=k k/n n;其中;其中;其中;其中k k为事件为事件为事件为事件A A所包含的基本事件数,所包含的基本事件数,所包含的基本事件数,所包含的基本事件数,n n为基本事件为基本事件为基本事件为基本事件e ei i的总数。(基本事件数有限,每个基本事件等概率)的总数。(基本事件数有限,每个基本事件等概率)的总数。(基本事件数有限,每个基本事件等概率)的总数。(基本事件数有限,每个基本事件等概率)vv公理

5、化定义公理化定义公理化定义公理化定义:E E是随机事件,是随机事件,是随机事件,是随机事件,S S是是是是E E的样本空间,对的样本空间,对的样本空间,对的样本空间,对E E的每一事件的每一事件的每一事件的每一事件A A,对应有确定的实数对应有确定的实数对应有确定的实数对应有确定的实数p p(A)(A),若,若,若,若p p(A)(A)满足:满足:满足:满足:非负性:非负性:非负性:非负性:p p(A)0(A)0;规范性:规范性:规范性:规范性:p p(S)=1(S)=1;列可加性:对两两不相容事件列可加性:对两两不相容事件列可加性:对两两不相容事件列可加性:对两两不相容事件A Ak k,有,

6、有,有,有p p(k kA Ak k)=)=k kp p(A(Ak k)。(A(Ai iAAj j=,=,i i j j)第4页,此课件共68页哦*决策理论与方法-随机决策理论与方法主观概率主观概率概率的定义概率的定义vv客观客观客观客观(Objective)(Objective)概率概率概率概率:上述三种定义的概率是在多次重复试验:上述三种定义的概率是在多次重复试验:上述三种定义的概率是在多次重复试验:上述三种定义的概率是在多次重复试验(随机试验)中,随机事件(随机试验)中,随机事件(随机试验)中,随机事件(随机试验)中,随机事件A A发生的可能性的大小的度量,称为发生的可能性的大小的度量,

7、称为发生的可能性的大小的度量,称为发生的可能性的大小的度量,称为客观概率。客观概率。客观概率。客观概率。vv主观主观主观主观(Subjective)(Subjective)概率概率概率概率:在实际管理决策中,许多事件的发生概率:在实际管理决策中,许多事件的发生概率:在实际管理决策中,许多事件的发生概率:在实际管理决策中,许多事件的发生概率是无法通过随机试验获得的,或条件不允许,或事件本身不允许。是无法通过随机试验获得的,或条件不允许,或事件本身不允许。是无法通过随机试验获得的,或条件不允许,或事件本身不允许。是无法通过随机试验获得的,或条件不允许,或事件本身不允许。因此需要一种方法来人为设定事

8、件发生的概率,称为主观概率。因此需要一种方法来人为设定事件发生的概率,称为主观概率。因此需要一种方法来人为设定事件发生的概率,称为主观概率。因此需要一种方法来人为设定事件发生的概率,称为主观概率。主观概率是人们根据经验、各方面的知识以及了解到的客观情况主观概率是人们根据经验、各方面的知识以及了解到的客观情况主观概率是人们根据经验、各方面的知识以及了解到的客观情况主观概率是人们根据经验、各方面的知识以及了解到的客观情况进行分析、推理、综合判断,对特定事件发生的可能性的信念进行分析、推理、综合判断,对特定事件发生的可能性的信念进行分析、推理、综合判断,对特定事件发生的可能性的信念进行分析、推理、综

9、合判断,对特定事件发生的可能性的信念(或意见、看法)的度量(或意见、看法)的度量(或意见、看法)的度量(或意见、看法)的度量(Savage,1954)(Savage,1954)。第5页,此课件共68页哦*决策理论与方法-随机决策理论与方法主观概率主观概率先验分布与先验假设先验分布与先验假设vv先验分布先验分布先验分布先验分布(Prior Distribution)(Prior Distribution):根据先验信息所确定的概率分布叫:根据先验信息所确定的概率分布叫:根据先验信息所确定的概率分布叫:根据先验信息所确定的概率分布叫先验分布,获得先验分布是贝叶斯分析的基础。先验分布,获得先验分布是

10、贝叶斯分析的基础。先验分布,获得先验分布是贝叶斯分析的基础。先验分布,获得先验分布是贝叶斯分析的基础。决策中先验分决策中先验分决策中先验分决策中先验分布的获得具有高度的主观性布的获得具有高度的主观性布的获得具有高度的主观性布的获得具有高度的主观性。vv先验假设先验假设先验假设先验假设:为使先验分布估计规范化,需要做一定的假设。:为使先验分布估计规范化,需要做一定的假设。:为使先验分布估计规范化,需要做一定的假设。:为使先验分布估计规范化,需要做一定的假设。连通性假设连通性假设连通性假设连通性假设:指事件:指事件:指事件:指事件A A和事件和事件和事件和事件B B发生的可能性是可比的,即发生的可

11、能性是可比的,即发生的可能性是可比的,即发生的可能性是可比的,即p p(A)(A)p p(B),(B),p p(A)(A)p p(B),(B),p p(A)(A)(A)p p(B),(B),p p(B)(B)p p(C),(C),则则则则p p(A)(A)p p(C)(C)。(满足连通性和传递性的二元关系才能构成完全序)。(满足连通性和传递性的二元关系才能构成完全序)。(满足连通性和传递性的二元关系才能构成完全序)。(满足连通性和传递性的二元关系才能构成完全序)部分与全体关系假设部分与全体关系假设部分与全体关系假设部分与全体关系假设:若事件:若事件:若事件:若事件A A是事件是事件是事件是事件

12、B B的一部分,则的一部分,则的一部分,则的一部分,则p p(B)(B)p p(A)(A)。第6页,此课件共68页哦*决策理论与方法-随机决策理论与方法主观概率主观概率先验分布估计先验分布估计:比较法比较法vv比较法比较法1-离散型离散型(对事件发生的各种状态加以比较确定相对似对事件发生的各种状态加以比较确定相对似对事件发生的各种状态加以比较确定相对似对事件发生的各种状态加以比较确定相对似然率然率然率然率)某气象专家对当年的气候状况进行评估,认为当年气候某气象专家对当年的气候状况进行评估,认为当年气候某气象专家对当年的气候状况进行评估,认为当年气候某气象专家对当年的气候状况进行评估,认为当年气

13、候正常正常正常正常(1 1)与受灾的可能性之比约为与受灾的可能性之比约为与受灾的可能性之比约为与受灾的可能性之比约为3:23:2;如果受灾,则水;如果受灾,则水;如果受灾,则水;如果受灾,则水灾灾灾灾(2 2)、旱灾、旱灾、旱灾、旱灾(3 3)的可能性相当。据此,我们可推算出的可能性相当。据此,我们可推算出的可能性相当。据此,我们可推算出的可能性相当。据此,我们可推算出当年气候状况的先验分布:当年气候状况的先验分布:当年气候状况的先验分布:当年气候状况的先验分布:(1 1)+)+(2 2)+)+(3 3)=1;)=1;(1 1)/()/(2 2)+)+(3 3)=3/2;)=3/2;(2 2)

14、=)=(3 3)解得:解得:解得:解得:(1 1)=0.6)=0.6,(2 2)=0.2)=0.2,(3 3)=0.2)=0.2思考:设某决策问题有思考:设某决策问题有思考:设某决策问题有思考:设某决策问题有n n个状态,有个状态,有个状态,有个状态,有mm个专家对各状态发个专家对各状态发个专家对各状态发个专家对各状态发生的可能性进行了比较评估,我们如何综合利用所有专生的可能性进行了比较评估,我们如何综合利用所有专生的可能性进行了比较评估,我们如何综合利用所有专生的可能性进行了比较评估,我们如何综合利用所有专家的评估结果得到最终的先验分布?家的评估结果得到最终的先验分布?家的评估结果得到最终的

15、先验分布?家的评估结果得到最终的先验分布?第7页,此课件共68页哦*决策理论与方法-随机决策理论与方法主观概率主观概率先验分布估计:打赌法先验分布估计:打赌法vv打赌法(离散型)打赌法(离散型)设打赌者设打赌者设打赌者设打赌者(A)(A)的个人财产为的个人财产为的个人财产为的个人财产为WW。设事件。设事件。设事件。设事件E E发生时发生时发生时发生时A A获得收入获得收入获得收入获得收入为为为为p p,(0(0p p11;p pW:a a b b表示表示表示表示a a优于优于优于优于b b。满足传递性和非对称性。满足传递性和非对称性。满足传递性和非对称性。满足传递性和非对称性。无差异无差异无差

16、异无差异:a a b b表示表示表示表示a a与与与与b b无差异。满足自反性、对称性和无差异。满足自反性、对称性和无差异。满足自反性、对称性和无差异。满足自反性、对称性和传递性。传递性。传递性。传递性。弱序弱序弱序弱序:a a b b表示表示表示表示a a不劣于不劣于不劣于不劣于b b。满足自反性、传递性和反对。满足自反性、传递性和反对。满足自反性、传递性和反对。满足自反性、传递性和反对称性。称性。称性。称性。展望展望展望展望/前景前景前景前景(prospect)(prospect)(事态体事态体事态体事态体):各种后果):各种后果):各种后果):各种后果(n n种种种种)及后果出及后果出及

17、后果出及后果出现的概率的组合,记为:现的概率的组合,记为:现的概率的组合,记为:现的概率的组合,记为:P Pj j=,(j j=1,2,m;m=1,2,m;m为行动的可能种数为行动的可能种数为行动的可能种数为行动的可能种数)第21页,此课件共68页哦*决策理论与方法-随机决策理论与方法效用函数效用函数效用的定义效用的定义复合展望:当无法确定采取某个行动时,可随机选择一复合展望:当无法确定采取某个行动时,可随机选择一复合展望:当无法确定采取某个行动时,可随机选择一复合展望:当无法确定采取某个行动时,可随机选择一种行动,设选择行动种行动,设选择行动种行动,设选择行动种行动,设选择行动a aj j的

18、概率为的概率为的概率为的概率为q qj j。则决策的展望就是一。则决策的展望就是一。则决策的展望就是一。则决策的展望就是一种复合展望,记为种复合展望,记为种复合展望,记为种复合展望,记为P=P=。所有展望。所有展望。所有展望。所有展望(包括简单展望和复合展望)构成展望空间。(包括简单展望和复合展望)构成展望空间。(包括简单展望和复合展望)构成展望空间。(包括简单展望和复合展望)构成展望空间。vv效用的定义效用的定义若展望空间上的实值函数若展望空间上的实值函数若展望空间上的实值函数若展望空间上的实值函数u u对于展望空间的任意两个展望对于展望空间的任意两个展望对于展望空间的任意两个展望对于展望空

19、间的任意两个展望P P1 1、P P2 2,有,有,有,有P P1 1PP2 2 iffiff u u(P(P1 1)u u(P(P2 2),则称,则称,则称,则称u u为效用函数。为效用函数。为效用函数。为效用函数。第22页,此课件共68页哦*决策理论与方法-随机决策理论与方法效用函数效用函数效用的定义效用的定义vv效用存在性公理(效用存在性公理(理性行为公理理性行为公理)连通性:任意两个展望的优劣都是可比的连通性:任意两个展望的优劣都是可比的连通性:任意两个展望的优劣都是可比的连通性:任意两个展望的优劣都是可比的传递性:展望的优劣满足传递性传递性:展望的优劣满足传递性传递性:展望的优劣满足

20、传递性传递性:展望的优劣满足传递性复合保序性:展望的优劣关系是可以复合的,且复合不复合保序性:展望的优劣关系是可以复合的,且复合不复合保序性:展望的优劣关系是可以复合的,且复合不复合保序性:展望的优劣关系是可以复合的,且复合不会破坏原有的优劣关系会破坏原有的优劣关系会破坏原有的优劣关系会破坏原有的优劣关系展望的优劣是相对的,没有无限优的展望,也不存在无展望的优劣是相对的,没有无限优的展望,也不存在无展望的优劣是相对的,没有无限优的展望,也不存在无展望的优劣是相对的,没有无限优的展望,也不存在无限劣的展望。限劣的展望。限劣的展望。限劣的展望。第23页,此课件共68页哦*决策理论与方法-随机决策理

21、论与方法效用函数效用函数效用的定义效用的定义vv效用的公理化定义效用的公理化定义:在上述公理系统中,若展望空:在上述公理系统中,若展望空间上存在实值函数间上存在实值函数u,有:,有:对展望空间中的任意展望对展望空间中的任意展望对展望空间中的任意展望对展望空间中的任意展望P P1 1、P P2 2,P P1 1PP2 2 iffiff u u(P(P1 1)u u(P(P2 2)u u(P P1 1+(1-+(1-)P)P2 2)=)=u u(P(P1 1)+(1-)+(1-)u u(P(P2 2)()(复合展望的效用等复合展望的效用等复合展望的效用等复合展望的效用等于展望效用的复合于展望效用的

22、复合于展望效用的复合于展望效用的复合)对满足上述条件的对满足上述条件的对满足上述条件的对满足上述条件的u u1 1,u u2 2,必有必有必有必有u u1 1(P(Pi i)=)=bubu2 2(P(Pi i)+)+c c,其中其中其中其中b b,c cR R1 1,b b00。(。(。(。(任意两个决策人的效用是任意两个决策人的效用是任意两个决策人的效用是任意两个决策人的效用是线性相关线性相关线性相关线性相关的的的的)第24页,此课件共68页哦*决策理论与方法-随机决策理论与方法效用函数效用函数基数性和序数性基数性和序数性vv前述定义的效用是一种基数效用,不仅能够反映决前述定义的效用是一种基

23、数效用,不仅能够反映决策者的偏好次序,还能够反映决策者的偏好强度。策者的偏好次序,还能够反映决策者的偏好强度。vv但在实际决策中,有时只需要偏好次序而不一定需但在实际决策中,有时只需要偏好次序而不一定需要知道偏好强度就可以决策。此时只需要序数效用要知道偏好强度就可以决策。此时只需要序数效用就可以了。有关序数效用的应用在多属性决策中介就可以了。有关序数效用的应用在多属性决策中介绍。绍。vvHicks对效用函数的基数性和序数性的比喻对效用函数的基数性和序数性的比喻:如果:如果知道两个人的身高,那么我们可以把高个儿排在第知道两个人的身高,那么我们可以把高个儿排在第一位;如果不知道他俩的身高也没关系,

24、让他们比一位;如果不知道他俩的身高也没关系,让他们比一下就可以了。一下就可以了。第25页,此课件共68页哦*决策理论与方法-随机决策理论与方法效用函数效用函数效用函数值的估计效用函数值的估计vv概率当量法概率当量法概率当量法概率当量法(Von Neumann,Morgenstern(Von Neumann,Morgenstern,N-MN-M法法法法):设决策系设决策系设决策系设决策系统的自然状态集统的自然状态集统的自然状态集统的自然状态集=1 1,n n、行动集行动集行动集行动集A=A=a a1 1,a amm、后果集、后果集、后果集、后果集C=C=c cij ij=c c(a ai i,j

25、 j),最优后果为,最优后果为,最优后果为,最优后果为c c*=max*=max c cij ij,最劣后果为,最劣后果为,最劣后果为,最劣后果为c c0 0=min=min c cij ij。则对于任意后果。则对于任意后果。则对于任意后果。则对于任意后果c cij ij的效用值的效用值的效用值的效用值u(u(c cij ij),可按以下步骤获得:,可按以下步骤获得:,可按以下步骤获得:,可按以下步骤获得:设设设设u(c*)=1,u(cu(c*)=1,u(c0 0)=0)=0;建立简单展望建立简单展望建立简单展望建立简单展望p,c*;1-p,c,p p可调可调可调可调反复向决策人提问,改变可调

26、概率反复向决策人提问,改变可调概率反复向决策人提问,改变可调概率反复向决策人提问,改变可调概率p p,使得当,使得当,使得当,使得当p=pp=pij ij时得到如下的无差异时得到如下的无差异时得到如下的无差异时得到如下的无差异关系:关系:关系:关系:c cij ijp 测得后果测得后果测得后果测得后果c cij ij的效用值为:的效用值为:的效用值为:的效用值为:u(u(c cij ij)=p)=pij ij*u(c*)+(1-p*u(c*)+(1-pij ij)*u(c)*u(c0 0)=p)=pij ij第26页,此课件共68页哦*决策理论与方法-随机决策理论与方法效用函数效用函数效用函数

27、值的估计效用函数值的估计vv确定当量法确定当量法(修正(修正N-M法)法):设设设设u(c*)=1,u(cu(c*)=1,u(c0 0)=0)=0;建立简单展望建立简单展望建立简单展望建立简单展望p,c*;1-p,c,p p为为为为0-10-1间的给定值,如间的给定值,如间的给定值,如间的给定值,如p=0.5p=0.5反复向决策人提问,改变反复向决策人提问,改变反复向决策人提问,改变反复向决策人提问,改变c ci ij j得到如下的无差异关系:得到如下的无差异关系:得到如下的无差异关系:得到如下的无差异关系:c cij ijp,c*;1-p,c 测得后果测得后果测得后果测得后果c cij ij

28、的效用值为:的效用值为:的效用值为:的效用值为:u(u(c cij ij)=p*u(c*)+(1-p)*u(c)=p*u(c*)+(1-p)*u(c0 0)=p)=pvv增益当量法增益当量法:已知:已知u(cij)和和u(c0),确定,确定u(c*)的方法的方法vv损失当量法损失当量法:已知:已知u(cij)和和u(c*),确定,确定u(c0)的方法的方法第27页,此课件共68页哦*决策理论与方法-随机决策理论与方法效用函数效用函数效用函数的构造(离散型)效用函数的构造(离散型)vv看球的效用函数构造(不考虑经济成本)看球的效用函数构造(不考虑经济成本)看球的效用函数构造(不考虑经济成本)看球

29、的效用函数构造(不考虑经济成本)1.1.构建问题的决策树,根据一般偏好,四种后果的优劣构建问题的决策树,根据一般偏好,四种后果的优劣构建问题的决策树,根据一般偏好,四种后果的优劣构建问题的决策树,根据一般偏好,四种后果的优劣是是是是C2C3C4C1C2C3C4C1;2.2.令令令令u(C1)=0,u(C2)=1u(C1)=0,u(C2)=1;3.3.询问询问询问询问1 1:“下雨看电视转播下雨看电视转播下雨看电视转播下雨看电视转播”的后果与的后果与的后果与的后果与“现场现场现场现场看球看球看球看球”时有多大的概率下雨被淋相当?时有多大的概率下雨被淋相当?时有多大的概率下雨被淋相当?时有多大的概

30、率下雨被淋相当?(例如:例如:例如:例如:0.30.3,则,则,则,则u(C3)=0.7)u(C3)=0.7)4.4.询问询问询问询问2 2:“天晴看电视转播天晴看电视转播天晴看电视转播天晴看电视转播”的后果与的后果与的后果与的后果与“现场看球现场看球现场看球现场看球”时有多大的概率下雨被淋相当?时有多大的概率下雨被淋相当?时有多大的概率下雨被淋相当?时有多大的概率下雨被淋相当?(例如:例如:例如:例如:0.60.6,则,则,则,则u(C4)=0.4)u(C4)=0.4)5.5.一致性检验:用一致性检验:用一致性检验:用一致性检验:用C3C3,C4C4加上加上加上加上C1(C1(或或或或C2)

31、C2)进行校进行校进行校进行校验,直至一致性得到满足。验,直至一致性得到满足。验,直至一致性得到满足。验,直至一致性得到满足。现场现场现场现场看球看球看球看球a a1 1电视电视电视电视看球看球看球看球a a2 2C4:C4:天晴看电视天晴看电视天晴看电视天晴看电视C3:C3:下雨没被淋下雨没被淋下雨没被淋下雨没被淋C2:C2:天晴未被淋天晴未被淋天晴未被淋天晴未被淋C1:C1:下雨被淋下雨被淋下雨被淋下雨被淋第28页,此课件共68页哦*决策理论与方法-随机决策理论与方法效用函数效用函数效用函数的构造(连续型)效用函数的构造(连续型)vv若后果是连续型,则可通过分析若后果是连续型,则可通过分析

32、u(c)的若干特征值,的若干特征值,求出特征点的效用后再连成光滑曲线。求出特征点的效用后再连成光滑曲线。vv例:试作出每天投入学习的时间例:试作出每天投入学习的时间t对应的效用曲线。对应的效用曲线。分析特征点:分析特征点:分析特征点:分析特征点:u(t=0)=0;u(tTu(t=0)=0;u(tTMM)=0(T)=0(TMM=?)=?);状态导入期;状态导入期;状态导入期;状态导入期(0 0t t0 0),效用增加较慢;状态稳定期),效用增加较慢;状态稳定期),效用增加较慢;状态稳定期),效用增加较慢;状态稳定期(t(t0 0t t1 1),效用与,效用与,效用与,效用与投入学习的时间基本成比

33、例关系;效率下降,效用增加投入学习的时间基本成比例关系;效率下降,效用增加投入学习的时间基本成比例关系;效率下降,效用增加投入学习的时间基本成比例关系;效率下降,效用增加期期期期(t(t1 1ttmm),效用是投入学习的时间的单调增函数,但增长,效用是投入学习的时间的单调增函数,但增长,效用是投入学习的时间的单调增函数,但增长,效用是投入学习的时间的单调增函数,但增长率小于状态稳定期且随着时间的增加越来越小,最终达率小于状态稳定期且随着时间的增加越来越小,最终达率小于状态稳定期且随着时间的增加越来越小,最终达率小于状态稳定期且随着时间的增加越来越小,最终达到零到零到零到零(t=t(t=tmm)

34、,此时效用达到最大;当投入的学习时间大于,此时效用达到最大;当投入的学习时间大于,此时效用达到最大;当投入的学习时间大于,此时效用达到最大;当投入的学习时间大于t tmm时,将会得不偿失,学习效率急剧降低,效用减少。时,将会得不偿失,学习效率急剧降低,效用减少。时,将会得不偿失,学习效率急剧降低,效用减少。时,将会得不偿失,学习效率急剧降低,效用减少。第29页,此课件共68页哦*决策理论与方法-随机决策理论与方法效用函数效用函数效用函数的构造(连续型)效用函数的构造(连续型)t t0 0t t1 1t tmmt tMM0 02424U U(t t)U Umaxmaxt t第30页,此课件共68

35、页哦*决策理论与方法-随机决策理论与方法效用函数效用函数风险与效用风险与效用vv风险风险:遇到破坏或损失的机会或危险遇到破坏或损失的机会或危险。“风险风险风险风险”:以打鱼捕捞为生的渔民们在长期的捕捞实践:以打鱼捕捞为生的渔民们在长期的捕捞实践:以打鱼捕捞为生的渔民们在长期的捕捞实践:以打鱼捕捞为生的渔民们在长期的捕捞实践中,深深的体会到中,深深的体会到中,深深的体会到中,深深的体会到“风风风风”给他们带来的无法预测无法确给他们带来的无法预测无法确给他们带来的无法预测无法确给他们带来的无法预测无法确定的危险,他们认识到,在出海捕捞打鱼的生活中,定的危险,他们认识到,在出海捕捞打鱼的生活中,定的

36、危险,他们认识到,在出海捕捞打鱼的生活中,定的危险,他们认识到,在出海捕捞打鱼的生活中,“风风风风”即意味着即意味着即意味着即意味着“险险险险”,因此有了,因此有了,因此有了,因此有了“风险风险风险风险”一词的由来。一词的由来。一词的由来。一词的由来。风险包含两个方面的内容:风险包含两个方面的内容:风险包含两个方面的内容:风险包含两个方面的内容:一是后果的损失严重程度;一是后果的损失严重程度;一是后果的损失严重程度;一是后果的损失严重程度;二是损失出现的可能性大小二是损失出现的可能性大小二是损失出现的可能性大小二是损失出现的可能性大小。参考:参考:参考:参考:http:/ a的后果为收益的后果

37、为收益的后果为收益的后果为收益y y,y y的概率密度函数的概率密度函数的概率密度函数的概率密度函数为为为为f f(y y),期望值为,期望值为,期望值为,期望值为E(E(y y),则方差,则方差,则方差,则方差可用来度量风险,方差越大风险越大。可用来度量风险,方差越大风险越大。可用来度量风险,方差越大风险越大。可用来度量风险,方差越大风险越大。协方差协方差协方差协方差:若期望收益为决策人设定的目标收益:若期望收益为决策人设定的目标收益:若期望收益为决策人设定的目标收益:若期望收益为决策人设定的目标收益c c,则可用,则可用,则可用,则可用协方差度量风险。协方差度量风险。协方差度量风险。协方差

38、度量风险。临界概率临界概率临界概率临界概率:小于目标收益的概率。:小于目标收益的概率。:小于目标收益的概率。:小于目标收益的概率。第32页,此课件共68页哦*决策理论与方法-随机决策理论与方法效用函数效用函数风险与效用风险与效用vv效用与风险效用与风险:效用反映的就是决策人对风险的一种:效用反映的就是决策人对风险的一种态度。态度。U(t)Umax=1C(万元)风险厌恶型风险厌恶型风险中立型风险中立型风险追求型风险追求型0.50912.51425风险酬金k第33页,此课件共68页哦*决策理论与方法-随机决策理论与方法随机决策理论与方法随机决策理论与方法1、主观概率、主观概率2、效用函数、效用函数

39、3、决策准则、决策准则4、贝叶斯决策分析、贝叶斯决策分析第34页,此课件共68页哦*决策理论与方法-随机决策理论与方法决策准则决策准则决策问题的表示决策问题的表示vv决策树表示法决策树表示法决策点决策点决策点决策点机会点机会点机会点机会点C1C1决策枝决策枝决策枝决策枝机会枝机会枝机会枝机会枝后果点后果点后果点后果点C2C2C3C3C4C4后果值后果值后果值后果值a a1 1a a2 2 (1 1)(2 2)(1 1)(2 2)第35页,此课件共68页哦*决策理论与方法-随机决策理论与方法决策准则决策准则决策问题的表示决策问题的表示vv决策表表示法决策表表示法 1 1 2 2 j j n n

40、(j j)(1 1)(2 2)(j j)(n n)a a1 1c c1111c c1212c c1j1jc c1n1na a2 2c c1111c c1212c c1j1jc c1n1na ai ic ci1i1c ci2i2c cij ijc cinina am mc cm1m1c cm2m2c cmjmjc cmnmn状态状态行动行动后果后果后果后果(效用值、损失值、价值效用值、损失值、价值效用值、损失值、价值效用值、损失值、价值)第36页,此课件共68页哦*决策理论与方法-随机决策理论与方法决策准则决策准则最大可能值准则最大可能值准则vv决策者决策时都需要根据某种准则来选择决策方案决策者

41、决策时都需要根据某种准则来选择决策方案决策准则。准则不同,决策结果就可能不同。决策准则。准则不同,决策结果就可能不同。下面介绍风险型决策中常用的几种决策准则。下面介绍风险型决策中常用的几种决策准则。vv最大可能值准则最大可能值准则:(众数原则):(众数原则)j j 1 1 2 2 3 3E(E(a ai i)=)=i i(j j)c)cij ij(j j)0.20.20.50.50.30.3a a1 17 73 34 44.14.1a a2 26.56.54 41 13.63.6a a3 36 65 50 03.73.7注:后果为损失值注:后果为损失值注:后果为损失值注:后果为损失值此准则在状

42、态出现的概率差距不此准则在状态出现的概率差距不此准则在状态出现的概率差距不此准则在状态出现的概率差距不大时的决策效果可能很差!大时的决策效果可能很差!大时的决策效果可能很差!大时的决策效果可能很差!第37页,此课件共68页哦*决策理论与方法-随机决策理论与方法决策准则决策准则贝叶斯准则贝叶斯准则vv贝叶斯准则贝叶斯准则:期望效用最大或期望损失最小期望效用最大或期望损失最小。在实际决策中,一般先确定后果对决策人的实际价值即在实际决策中,一般先确定后果对决策人的实际价值即在实际决策中,一般先确定后果对决策人的实际价值即在实际决策中,一般先确定后果对决策人的实际价值即效用函数(若是损失则使用效用函数

43、(若是损失则使用效用函数(若是损失则使用效用函数(若是损失则使用负效用负效用负效用负效用)(称为)(称为)(称为)(称为伯努利过程伯努利过程伯努利过程伯努利过程),然后再应用贝叶斯准则。,然后再应用贝叶斯准则。,然后再应用贝叶斯准则。,然后再应用贝叶斯准则。j j 1 1 2 2 3 3E(E(a ai i)=j j(j j)c)cij ij(j j)0.20.20.50.50.30.3a a1 17 73 34 44.14.1a a2 26.56.54 41 13.63.6a a3 36 65 50 03.73.7注:后果为损失值注:后果为损失值注:后果为损失值注:后果为损失值第38页,此课

44、件共68页哦*决策理论与方法-随机决策理论与方法决策准则决策准则E-V准则准则vvE-VE-V准则准则准则准则:用期望与方差(度量风险)共同判决一个方案的优:用期望与方差(度量风险)共同判决一个方案的优:用期望与方差(度量风险)共同判决一个方案的优:用期望与方差(度量风险)共同判决一个方案的优劣。劣。劣。劣。帕累托优帕累托优帕累托优帕累托优:若不存在方案:若不存在方案:若不存在方案:若不存在方案a al l,使得方案,使得方案,使得方案,使得方案a ak k的期望与风险均的期望与风险均的期望与风险均的期望与风险均劣于劣于劣于劣于a al l,称,称,称,称a ak k为为为为有效方案有效方案有

45、效方案有效方案或或或或帕累托优帕累托优帕累托优帕累托优。评价函数评价函数评价函数评价函数:f fi i(E,V)=E(E,V)=E(a ai i)+)+i i2 2。反映了决策人的风险态反映了决策人的风险态反映了决策人的风险态反映了决策人的风险态度,度,度,度,00风险厌恶;风险厌恶;风险厌恶;风险厌恶;=0=0风险中立(对应于贝叶斯准则);风险中立(对应于贝叶斯准则);风险中立(对应于贝叶斯准则);风险中立(对应于贝叶斯准则);00.6)0.6时,方案时,方案时,方案时,方案a a1 1最优;当最优;当最优;当最优;当 (1 1)0.6)0,(AkAl)=0(kl);j(Aj)=S。称。称A

46、j是样本是样本空间的一个划分。则对任一事件空间的一个划分。则对任一事件B,有:,有:第44页,此课件共68页哦*决策理论与方法-随机决策理论与方法贝叶斯决策分析贝叶斯决策分析贝叶斯定理贝叶斯定理vv贝叶斯定理贝叶斯定理贝叶斯定理贝叶斯定理:已知:已知:已知:已知 (B|A(B|Aj j)、(A(Aj j)()(先验概率先验概率先验概率先验概率)()(j j=1,=1,n n),求当事件,求当事件,求当事件,求当事件B B发生发生发生发生(随机试验的结果或观察值随机试验的结果或观察值随机试验的结果或观察值随机试验的结果或观察值)时时时时A Ak k发生的概率发生的概率发生的概率发生的概率(后验概

47、率后验概率后验概率后验概率)。vv贝叶斯定理在决策分析中的意义贝叶斯定理在决策分析中的意义贝叶斯定理在决策分析中的意义贝叶斯定理在决策分析中的意义:在实际决策中,我们需要准确估计:在实际决策中,我们需要准确估计:在实际决策中,我们需要准确估计:在实际决策中,我们需要准确估计的随机变量是未来的自然状态的随机变量是未来的自然状态的随机变量是未来的自然状态的随机变量是未来的自然状态,而通,而通,而通,而通过过过过随机随机随机随机试验试验试验试验所所所所观观观观察到的往往察到的往往察到的往往察到的往往是与之相关的另一个随机是与之相关的另一个随机是与之相关的另一个随机是与之相关的另一个随机变变变变量。例

48、如,疾病量。例如,疾病量。例如,疾病量。例如,疾病诊诊诊诊断往往是通断往往是通断往往是通断往往是通过观过观过观过观察察察察症状如症状如症状如症状如发烧发烧发烧发烧、咳嗽等来判断其疾病如感冒、甲流。、咳嗽等来判断其疾病如感冒、甲流。、咳嗽等来判断其疾病如感冒、甲流。、咳嗽等来判断其疾病如感冒、甲流。贝贝贝贝叶斯定理可叶斯定理可叶斯定理可叶斯定理可以帮助我以帮助我以帮助我以帮助我们们们们判断当出判断当出判断当出判断当出现发烧时现发烧时现发烧时现发烧时患甲流的概率。患甲流的概率。患甲流的概率。患甲流的概率。第45页,此课件共68页哦*决策理论与方法-随机决策理论与方法贝叶斯决策分析贝叶斯决策分析贝叶

49、斯定理贝叶斯定理vv例例例例:经临床观察,患甲流的病人约:经临床观察,患甲流的病人约:经临床观察,患甲流的病人约:经临床观察,患甲流的病人约70%70%发烧超过发烧超过发烧超过发烧超过3838度,患感冒的度,患感冒的度,患感冒的度,患感冒的病人约病人约病人约病人约40%40%发烧超过发烧超过发烧超过发烧超过3838度,而肺炎病人中有度,而肺炎病人中有度,而肺炎病人中有度,而肺炎病人中有60%60%发烧超过发烧超过发烧超过发烧超过3838度。度。度。度。统计表明当前甲流发病率约统计表明当前甲流发病率约统计表明当前甲流发病率约统计表明当前甲流发病率约0.60.6,感冒,感冒,感冒,感冒0.70.7

50、 ,肺炎,肺炎,肺炎,肺炎0.10.1 。现有。现有。现有。现有一病人发烧超过一病人发烧超过一病人发烧超过一病人发烧超过3838度,请诊断该病人最可能患上哪种疾病。度,请诊断该病人最可能患上哪种疾病。度,请诊断该病人最可能患上哪种疾病。度,请诊断该病人最可能患上哪种疾病。解:记发烧超过解:记发烧超过解:记发烧超过解:记发烧超过3838度的事件为度的事件为度的事件为度的事件为X X;患甲流、感冒、肺炎分别记为;患甲流、感冒、肺炎分别记为;患甲流、感冒、肺炎分别记为;患甲流、感冒、肺炎分别记为A A、B B、C C。先验概率分别为。先验概率分别为。先验概率分别为。先验概率分别为 (A)=0.000

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com