信息论与生命科学概要.ppt

上传人:可**** 文档编号:17235878 上传时间:2022-05-22 格式:PPT 页数:37 大小:106.50KB
返回 下载 相关 举报
信息论与生命科学概要.ppt_第1页
第1页 / 共37页
信息论与生命科学概要.ppt_第2页
第2页 / 共37页
点击查看更多>>
资源描述

《信息论与生命科学概要.ppt》由会员分享,可在线阅读,更多相关《信息论与生命科学概要.ppt(37页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、l1.DNA1.DNA到蛋白质的通信系统到蛋白质的通信系统 遗传学认为每种生命都具备一个储存遗传学认为每种生命都具备一个储存和处理信息的系统,以便在它们代代相传和处理信息的系统,以便在它们代代相传和发展的过程中能准确地复制自身。和发展的过程中能准确地复制自身。现在已基本确定脱氧核糖核酸(现在已基本确定脱氧核糖核酸(DNADNA)是遗)是遗传的物质基础。传的物质基础。遗传信息储存在遗传信息储存在DNADNA的结构中。的结构中。 DNADNA有两个螺旋形结构,是由一系列核苷有两个螺旋形结构,是由一系列核苷酸绕某一长中心轴形成的螺旋梯状结构。每酸绕某一长中心轴形成的螺旋梯状结构。每个核苷酸所含的碱基

2、不同,由四种碱基配对个核苷酸所含的碱基不同,由四种碱基配对联接。每个生命系统的联接。每个生命系统的DNADNA中都有它们各自中都有它们各自的特定的由的特定的由4 4个碱基排列而成成的碱基序列个碱基排列而成成的碱基序列长链。长链。l不同的碱基序列形成不同的不同的碱基序列形成不同的DNADNA分子,形成不分子,形成不同同的生命体。从信息论的观点来看的生命体。从信息论的观点来看DNADNA分子中的分子中的4 4种种不同的碱基相当于将遗传信息编成不同的碱基相当于将遗传信息编成“密码密码”的的4 4个个“字母字母”,即遗传信息源中的,即遗传信息源中的4 4个个“字母字母”这这遗传信源的符号表为:遗传信源

3、的符号表为:元素符号元素符号 a1 a2 a3 a4 a1 a2 a3 a4 碱基符号碱基符号 A G C T A G C T 碱基名称碱基名称 腺嘌呤腺嘌呤 鸟嘌呤鸟嘌呤 胞嘧啶胞嘧啶 胸腺嘧啶胸腺嘧啶 由这由这“字母字母”表中的字母排列成不同的字母表中的字母排列成不同的字母序列就组成核苷酸系列,也就组成了不同的序列就组成核苷酸系列,也就组成了不同的DNADNA结构。所以遗传密码就是记载在亲代结构。所以遗传密码就是记载在亲代DNADNA分子核苷酸序列上的遗传信息,而分子核苷酸序列上的遗传信息,而DNADNA分子中分子中的特定的核苷酸顺序就决定了生物体的遗传的特定的核苷酸顺序就决定了生物体的遗

4、传性状。性状。 实验表明,实验表明,DNADNA的碱基序列是非常长的。因此的碱基序列是非常长的。因此遗传信源总共可能有不同碱基序列的总数较大。遗传信源总共可能有不同碱基序列的总数较大。据估计人类基因的数目在据估计人类基因的数目在2.62.6万到万到3.93.9万。虽然万。虽然比原先估计的比原先估计的1010万要低,但是对于万要低,但是对于DNADNA作为遗传作为遗传信息的存储系统来说,它的信息容量还是很大。信息的存储系统来说,它的信息容量还是很大。 生物生长过程经常要发生生物生长过程经常要发生DNADNA的复制。只有的复制。只有遗传信息快速准确地复制和传递才能保证生物遗传信息快速准确地复制和传

5、递才能保证生物性状性状的继承和再现。的继承和再现。DNADNA的复制过程是:亲代的复制过程是:亲代DNADNA的的两条长链被打开,每条核苷酸链作为模板,在两条长链被打开,每条核苷酸链作为模板,在周围、充满与周围、充满与4 4种碱基相对应的三磷酸底物中,种碱基相对应的三磷酸底物中,不断提供核苷酸与模板中的核苷酸按互补原则不断提供核苷酸与模板中的核苷酸按互补原则配对形成新的配对形成新的DNADNA链。互补配对原则是腺嘌呤链。互补配对原则是腺嘌呤(A)(A)与胸腺嘧啶与胸腺嘧啶(T)(T)配对,鸟嘌呤(配对,鸟嘌呤(G G)与胞嘧啶)与胞嘧啶(C)(C)配对配对. . 这个复制的信息传递过程可以看成

6、是一个输这个复制的信息传递过程可以看成是一个输入和输出的单向、单符号的信息传递。入和输出的单向、单符号的信息传递。信道的输入信源为信道的输入信源为X,xA=aX,xA=a1 1=A,a=A,a2 2=G,a=G,a3 3=C,a=C,a4 4=T=T输出端为输出端为Y,yB=bY,yB=b1 1=A,b=A,b2 2=G,b=G,b3 3=C,b=C,b4 4=T=T根据核苷酸互补配对原则,有:根据核苷酸互补配对原则,有:P(bP(b4 4|a|a1 1)=1,P(b)=1,P(b3 3|a|a2 2)=1,P(b)=1,P(b2 2|a|a3 3)=1,P(b)=1,P(b1 1|a|a4

7、4)=1)=1其余其余P(bP(bj j|a|ai i)=0)=0。 可用概率空间可用概率空间X,P(bX,P(bj j|a|ai i),Y),Y来描述来描述DNADNA的复制的复制过程,其复制矩阵信道为:过程,其复制矩阵信道为:0001001001001000TCGAPTCGA 从生物学知道,蛋白质是生命的基本物质,它从生物学知道,蛋白质是生命的基本物质,它由由2020种不同的氨基酸以各种方式排列而成的,不种不同的氨基酸以各种方式排列而成的,不同的氨基酸的排列组合构成不同的蛋白质。另外,同的氨基酸的排列组合构成不同的蛋白质。另外,现在又认为不同的蛋白质分子是按照现在又认为不同的蛋白质分子是按

8、照DNADNA的分子的分子结构来合成的。也就是按照结构来合成的。也就是按照DANDAN传递出去的遗传传递出去的遗传信息合成的。由前分析,遗传信息存储在这信息合成的。由前分析,遗传信息存储在这4 4中中碱基的序列中,问题是:怎样将碱基的序列中,问题是:怎样将DNADNA中的遗传信中的遗传信息传递到合成的蛋白质分子中去?息传递到合成的蛋白质分子中去? 蛋白质在生物体内的合成需经转录和翻译两个蛋白质在生物体内的合成需经转录和翻译两个阶段。转录是按照阶段。转录是按照DNADNA的模板生成带遗传信息的的模板生成带遗传信息的单链核糖核酸,称为信使核糖核酸。记为单链核糖核酸,称为信使核糖核酸。记为mRNAm

9、RNA。它的基本结构也是它的基本结构也是4 4种核苷酸配对联接的长链,种核苷酸配对联接的长链,但与但与DNADNA不同的是以尿嘧啶不同的是以尿嘧啶(U)(U)替代胸腺嘧啶替代胸腺嘧啶(T).(T).这个转录过程也可认为是一个单向、单符号的信这个转录过程也可认为是一个单向、单符号的信息传输信道,信道输入端符号集为息传输信道,信道输入端符号集为A,G,C,T,A,G,C,T,输输出端符号集为出端符号集为A,G,C,U,A,G,C,U,根据它们的互补原则:根据它们的互补原则:AU,TA,GAU,TA,GT,T,可用概率空间可用概率空间X,P,YX,P,Y来描述转来描述转录过程,其信道矩阵为:录过程,

10、其信道矩阵为:0001001001001000TCGAPUCGA 蛋白质合成的翻译阶段中以带有遗传信息的信使核蛋白质合成的翻译阶段中以带有遗传信息的信使核糖核酸糖核酸mRNAmRNA长链为模板,靠转移核糖核酸长链为模板,靠转移核糖核酸tRNAtRNA将各种将各种需要的氨基酸带人核糖体,在核糖体内按照需要的氨基酸带人核糖体,在核糖体内按照mRNAmRNA模板模板提供的信息将确定的氨基酸逐个加在合成的肽链上,提供的信息将确定的氨基酸逐个加在合成的肽链上,合成蛋白质肽链。合成蛋白质肽链。 遗传信息经遗传信息经DNARNADNARNA蛋白质合成过程称蛋白质合成过程称为遗传信息传递的中心法则。为遗传信息

11、传递的中心法则。4 4种碱基序列怎么排列才能控制种碱基序列怎么排列才能控制2020种氨基酸合种氨基酸合成蛋白质呢?成蛋白质呢? 由于信息熵反映的是系统的多样性。现在由于信息熵反映的是系统的多样性。现在碱基序列要能控制着碱基序列要能控制着2020种氨基酸的合成,在种氨基酸的合成,在必须必须碱基的集合的多样性要不小于氨基酸集合的碱基的集合的多样性要不小于氨基酸集合的多样性。也就是碱基集合的信息熵必须要不多样性。也就是碱基集合的信息熵必须要不小于氨基酸集合的信息熵。小于氨基酸集合的信息熵。 用用X X表示核酸中表示核酸中4 4种不同的碱基(元素)的种不同的碱基(元素)的集合,当元素等概率时,其熵值为

12、集合,当元素等概率时,其熵值为H(X)=2bit.H(X)=2bit.令令Y Y表示被控方组成蛋白质的表示被控方组成蛋白质的2020种氨基酸的集合。种氨基酸的集合。当元素等概率时,当元素等概率时,H(Y)=log20=4.32bit,H(Y)=log20=4.32bit,因此因此H(X)H(X)H(Y)H(Y),不满足所述要求。这表明输入信,不满足所述要求。这表明输入信源中不同元素不能对被控源的各元素进行控制。源中不同元素不能对被控源的各元素进行控制。必须将输入信息扩展成必须将输入信息扩展成3 3次扩展信源次扩展信源X X3 3。可得,。可得,这三重扩展信息源的信息熵(多样性)为这三重扩展信息

13、源的信息熵(多样性)为H(XH(X3 3) )=3H(X)=6bit,=3H(X)=6bit,此时有此时有H(XH(X3 3) )H(Y)H(Y),这就满足了,这就满足了要求,输入方有足够的不同消息来控制被控方要求,输入方有足够的不同消息来控制被控方的不同元素。因此,人们提出了核苷酸三联体的不同元素。因此,人们提出了核苷酸三联体的概念。即由三个单核苷酸(三个碱基)编码的概念。即由三个单核苷酸(三个碱基)编码组成一个遗传密码。这种三联体就代表各种不组成一个遗传密码。这种三联体就代表各种不同氨基酸的密码。同氨基酸的密码。 科学实验结果证实了这种想法,科学实验结果证实了这种想法,2020种氨基酸种氨

14、基酸中的每一个都是由三个碱基的不同排列所代表。中的每一个都是由三个碱基的不同排列所代表。现在已确认三联体共有现在已确认三联体共有6464个(个(3 34 4=64=64)个遗传密)个遗传密码,其中码,其中6161个代表个代表2020种氨基酸的密码,而种氨基酸的密码,而3 3个代个代表终止密码,这密码的对应关系已由退化的密表终止密码,这密码的对应关系已由退化的密码字典给出,如下表所示:码字典给出,如下表所示:氨基酸密码氨基酸密码 氨基酸氨基酸Bj 密码密码1.丙氨酸GCU GCC GCA GCG2.精氨酸CGU CGC CGA CGG AGA AGG3.天门冬氨酸AAU AAC4.天门冬氨酸GA

15、U GAC5.半胱氨酸UGU UGC6.谷氨酸GAA GAG7.谷酰酸CAACAG8.甘氨酸GGU GGC GGA GGG9.组氨酸CAU CAC 氨基酸氨基酸BJ 密码密码10.异亮氨酸AUU AUC AUA11.亮氨酸UUA UUG CUU CUC CUA CUG12.赖氨酸AAA AAG13.甲硫氨酸+起步信号AUG14.苯丙氨酸UUU UUC15.脯氨酸CCU CCC CCA CCG16.丝氨酸UCU UCC UCA UCG AGU AGC17.苏氨酸ACU ACC ACA ACG18.色氨酸UGG19.酪氨酸UAU UAC20.缬(xie)氨酸GUU GUC GUA GUG* 起步信

16、号AUG 终止信号UAA UAG UGA* 其中其中GUGGUG在起点试则代表在起点试则代表甲硫氨酸,否则代表缬氨酸甲硫氨酸,否则代表缬氨酸 从信息论无失真编码的角度来看,遗传密码从信息论无失真编码的角度来看,遗传密码是一种可分离的唯一可译等长码。生物学研究是一种可分离的唯一可译等长码。生物学研究表明,信使核糖核酸(表明,信使核糖核酸(mRNAmRNA)中的遗传密码就)中的遗传密码就是一种没有空隙的可分离代码。所以,一系列是一种没有空隙的可分离代码。所以,一系列密码组合代表一种确定的、唯一的遗传密码,密码组合代表一种确定的、唯一的遗传密码,它能控制一定的、唯一的蛋白质的合成。但这它能控制一定的

17、、唯一的蛋白质的合成。但这种码不是最优码。这是因为几个不同的码同时种码不是最优码。这是因为几个不同的码同时对应于同一种蛋白质。当然解码时合成的蛋白对应于同一种蛋白质。当然解码时合成的蛋白质仍然是唯一的。生物学家称具有这种映射结质仍然是唯一的。生物学家称具有这种映射结果的性质为遗传密码的退化性。果的性质为遗传密码的退化性。 为什么在遗传密码中要有这种多对一的对为什么在遗传密码中要有这种多对一的对应关系呢?应关系呢? 人们从两种角度来考虑这种问题:一种可能人们从两种角度来考虑这种问题:一种可能是由于遗传通道中的某种特性,要求遗传密码是由于遗传通道中的某种特性,要求遗传密码具有这种形式的剩余度,以保

18、证信息传递的可具有这种形式的剩余度,以保证信息传递的可靠性;另一种可能是我们现今所发现的遗传密靠性;另一种可能是我们现今所发现的遗传密码。只不过是生命系统在不断发展和完善它的码。只不过是生命系统在不断发展和完善它的遗传功能过程的某一阶段。遗传密码的退化性遗传功能过程的某一阶段。遗传密码的退化性问题正是当代生物学界研究的一个问题。问题正是当代生物学界研究的一个问题。 这个蛋白质合成翻译信道我们有可以看成一这个蛋白质合成翻译信道我们有可以看成一个个DNADNA到蛋白质的通信系统。系统的输入是到蛋白质的通信系统。系统的输入是DNA DNA 的碱基序列,输出的是蛋白质的氨基酸序列,可的碱基序列,输出的

19、是蛋白质的氨基酸序列,可称它为称它为DNA-DNA-蛋白质通信系统。蛋白质通信系统。 对于所有的生命机体(无论是细菌和人)都对于所有的生命机体(无论是细菌和人)都可以用这个系统来描述。因为所有机体遗传信息可以用这个系统来描述。因为所有机体遗传信息传输过程和结构都是相同的。而且所有生命机体传输过程和结构都是相同的。而且所有生命机体都由相同的两类主要成分即蛋白质和核苷酸组成,都由相同的两类主要成分即蛋白质和核苷酸组成,而蛋白质都是由这而蛋白质都是由这2020种氨基酸组成,核苷酸都包种氨基酸组成,核苷酸都包含相同的碱基。另外,根据分子遗传学的中心法含相同的碱基。另外,根据分子遗传学的中心法则,则,D

20、NADNA分子的遗传信息传向蛋白质是严格地不分子的遗传信息传向蛋白质是严格地不可逆的,所以,这个通信系统模型也是不可逆的。可逆的,所以,这个通信系统模型也是不可逆的。X X3 3 Y Y 遗传通道遗传通道X A P ( y | xX A P ( y | x1 1x x2 2x x3 3) ) YBYBl 首先研究输入信源首先研究输入信源X3,输入信源是遗传密码输入信源是遗传密码的集合,它就是碱基信源的的集合,它就是碱基信源的3次扩展信源,次扩展信源,X的符号集为的符号集为A=A,G,C,U,对于不同的生命体,对于不同的生命体,碱基符号集的分布是不同的。根据碱基符号集的分布是不同的。根据L.L.

21、Gatlin 对对60多种机体中的多种机体中的DNA和和mRNA的碱基序列的碱基序列 统计分析研究,确定了碱基序列并非是统计独统计分析研究,确定了碱基序列并非是统计独立的。它们之间是由依赖的,可以证实它们是立的。它们之间是由依赖的,可以证实它们是一阶一阶Markov信源。通常还假设它具有时齐性和信源。通常还假设它具有时齐性和遍历性。遍历性。AxxUUPUCPUGPUAPCUPCCPCGPCAPGUPGCPGGPGAPAUPACPAGPAAPxxPUPCPGPAPUCGAxP,)|()|()|()|()|()|()|()|()|()|()|()|()|()|()|()|()| ()()()()(

22、)(X? 以上分别为遗传信源和转移概率矩阵,以上分别为遗传信源和转移概率矩阵,从而可以确定各碱基的概率分布。从而可以确定各碱基的概率分布。l 由于信源由于信源X3是一阶是一阶Markov信源的三次扩展信信源的三次扩展信源,因此,信源源,因此,信源X3也是一阶也是一阶Markov信源信源信源信源X3的符号集为的符号集为A3=x1x2x3,xiA,i=1,2,3,其个其个数为数为64个,所以遗传信道的输入信源为:个,所以遗传信道的输入信源为:) ()()| (1) (, 1)(, , , , ) | () | ()| ()| (, )|()|()()( here)| (),(,321321,321

23、321,321,321321321231231321321321231213213213213213321321321xxxPxxxPxxxxxxPxxxPxxxPAxxxAxxxxxPxxPxxPxxxxxxPandAxxxxxPxxPxPxxxPxxxxxxPxxxPXAxxxAxxxAxxx?对于对于DNA-DNA-蛋白质信道,遗传信道为:蛋白质信道,遗传信道为: XX3 3,P(y|x,P(y|x1 1x x2 2x x3 3),Y),Y)输出的符号集为输出的符号集为B=BB=B1 1,B,B2 2,.B,.B2020,B,B2121 共有共有2121个符个符号。其中号。其中2020个

24、代表个代表2020种不同的氨基酸,而种不同的氨基酸,而B B2121代表代表终止密码。终止密码。 可以认为此信道是平稳的。信道的传递概率可以认为此信道是平稳的。信道的传递概率P(y|xP(y|x1 1x x2 2x x3 3) )完全可以用退化的密码表给出。完全可以用退化的密码表给出。 例如例如B1B1代表丙氨酸则:代表丙氨酸则:P(BP(B1 1|GUC)=P(B|GUC)=P(B1 1|GCC)=P(B|GCC)=P(B1 1|GCA)=P(B|GCA)=P(B1 1|GCG)=1|GCG)=1而而x x1,1,x x2,2,x x3 3取其他符号时取其他符号时P(BP(B1 1|x|x1

25、 1x x2 2x x3 3)=0,=0,其他也可类似求得。其他也可类似求得。l根据信道传递特性可求得符号根据信道传递特性可求得符号Y Y的概率分布为:的概率分布为:)|()()(321,3213321xxxBPxxxPBPjXxxxj由此求得此遗传信道的信道容量为:由此求得此遗传信道的信道容量为:3321321211321321321)()()|(log)()(supXxxxijjjxxxPBPxxxBPxxxBPxxxPCl因为信道的传输概率是已知的,完全可以求因为信道的传输概率是已知的,完全可以求出信道容量出信道容量C C,据信息论分析,这信道的最大,据信息论分析,这信道的最大信息传输率

26、为信息传输率为C=log 21=4.3920(bit)C=log 21=4.3920(bit)l但这要求氨基酸是统计独立分布的但这要求氨基酸是统计独立分布的, ,这种要求这种要求在实际情况中是不存在的在实际情况中是不存在的, ,所以前面的公式是所以前面的公式是对所有可能存在的对所有可能存在的P(xP(x1 1x x2 2x x3 3) )求上界值。求上界值。l也就是在信道固定的条件下,求某种核苷酸也就是在信道固定的条件下,求某种核苷酸的概率分布使的概率分布使DNADNA到蛋白质的传递的信息量到蛋白质的传递的信息量达到最大。自然界的选择必定造就了生物遗传达到最大。自然界的选择必定造就了生物遗传信

27、息传输的最佳状态。因此有可能运用信息理信息传输的最佳状态。因此有可能运用信息理论对自然界生命体遗传现象的某些机理作出一论对自然界生命体遗传现象的某些机理作出一些准确的解释。些准确的解释。l在生命世世代代相传的过程中,各种类型的在生命世世代代相传的过程中,各种类型的生物,绝大多数保持了它们的遗传特性。这说生物,绝大多数保持了它们的遗传特性。这说明遗传信息的传递时准确可靠的。但也存在变明遗传信息的传递时准确可靠的。但也存在变异,有变异才会出现自然界生物的多样性,生异,有变异才会出现自然界生物的多样性,生物才有进化。这变异我们可以认为是遗传信息物才有进化。这变异我们可以认为是遗传信息传递过程中发生错

28、误引起的,因此。从传递过程中发生错误引起的,因此。从DNADNA到蛋白质的通信系统并不是无噪信道。到蛋白质的通信系统并不是无噪信道。l应该认为是由噪信道。考虑到遗传密码与氨基应该认为是由噪信道。考虑到遗传密码与氨基酸的对应关系,我们把这个有噪信道看作由两个酸的对应关系,我们把这个有噪信道看作由两个信道串联而成,即:信道串联而成,即:ByxxyxPAxxxxxxxxxPAxxxYXX)(3)|(33211332132132113321322132213221)|()|()|()()|()()(,)| () |()|(321*23211321*3213213213211321321*AxxxjAx

29、xxjjAxxxxxxBPxxPxxPxPxxxBPxxxPBPAxxxBYxxxxxxPxxxyPxxxyPl生命机体在遗传信息传输过程中具有一定的生命机体在遗传信息传输过程中具有一定的抗干扰能力,从信息论的角度看,增加信源抗干扰能力,从信息论的角度看,增加信源的剩余度可以提高信道的抗干扰能力。因此的剩余度可以提高信道的抗干扰能力。因此的碱基序列中不但存储遗传密码,指导的碱基序列中不但存储遗传密码,指导蛋白质合成,而且还存储着较为复杂的蛋白质合成,而且还存储着较为复杂的“遗传遗传语言语言”,控制遗传正确地进行。人们的实验研究,控制遗传正确地进行。人们的实验研究证明确实如此。证明确实如此。lG

30、atlinGatlin研究和确定了研究和确定了6060多种机体内多种机体内DNADNA和和mRNAmRNA的碱基序列是一阶的碱基序列是一阶MarkovMarkov链,另外链,另外有人对个别噬菌体的有人对个别噬菌体的DNADNA序列的研究,证实序列的研究,证实了它的碱基序列至少是二阶了它的碱基序列至少是二阶MarkovMarkov链。链。l为了分析碱基序列的剩余度,为了分析碱基序列的剩余度,GatlinGatlin引进了引进了两个偏离指标:一阶偏离指标两个偏离指标:一阶偏离指标D1,D1,表示与等概表示与等概率分布信源的偏离。率分布信源的偏离。二阶偏离指标二阶偏离指标D1,D1,表示与统计独立分

31、布信源的表示与统计独立分布信源的偏离。即:偏离。即:21212121max14,4log)| (log)| ()()(log)()()()(log)(4log)(DDlobDDxxPxxPxPxPxPDXHXHDxPxPXHHDAxAxAXmAxl我们称我们称D D1 1+D+D2 2为信息密度,它是信息源的最为信息密度,它是信息源的最大熵与实际碱基序列信源之差。它反映了碱基大熵与实际碱基序列信源之差。它反映了碱基序列之间的约束程度。我们可以用这个量来度序列之间的约束程度。我们可以用这个量来度量碱基序列的约束程度和量碱基序列的约束程度和“遗传语言遗传语言”的复杂程的复杂程度。人们大量比较了不同

32、等级的机体中,碱基度。人们大量比较了不同等级的机体中,碱基序列的信息密度数值。实验数据表明:脊椎序列的信息密度数值。实验数据表明:脊椎动物的偏离指标动物的偏离指标D2D2一般高于低级生物的一般高于低级生物的l实验还表明:若要使脊椎动物的实验还表明:若要使脊椎动物的“遗传语遗传语言言”结构有较高值的剩余度时,主要是保持结构有较高值的剩余度时,主要是保持D D1 1不不变而增加变而增加D D2 2, ,相反地,在低级生物体中,要相反地,在低级生物体中,要使它具有较高值的剩余度时,主要是增加使它具有较高值的剩余度时,主要是增加D D1 1。因此可用。因此可用D D2 2作为区分脊椎动物与其他作为区分

33、脊椎动物与其他低级生物体的指标,所以,也称低级生物体的指标,所以,也称D D2 2为进化为进化指标。指标。l在生物遗传过程中,必然会引起适应新的自在生物遗传过程中,必然会引起适应新的自然环境的变异存在,是生物不断进化,然环境的变异存在,是生物不断进化,19801980年生物学家吧信息论中的信息率失真理论应用年生物学家吧信息论中的信息率失真理论应用到遗传进化研究中,研究了两个等位基因群体到遗传进化研究中,研究了两个等位基因群体产生的遗传信息的自复制机体等效于一个通信产生的遗传信息的自复制机体等效于一个通信系统。引入了遗传信息被复制中的失真概念和系统。引入了遗传信息被复制中的失真概念和失真函数,用率失真理论对系统进行数值计算。失真函数,用率失真理论对系统进行数值计算。l得出在多大的允许失真范围内新的基因存在的得出在多大的允许失真范围内新的基因存在的可能。并指出对于群体的进化存在一个最佳的可能。并指出对于群体的进化存在一个最佳的失真度。表明信息论的概念对于生物遗传和进化失真度。表明信息论的概念对于生物遗传和进化理论研究有重要意义。理论研究有重要意义。 当然,自然界生物遗传信息传输的机理是高度当然,自然界生物遗传信息传输的机理是高度复杂的。遗传信息在传输过程中,信道可能随时复杂的。遗传信息在传输过程中,信道可能随时在变,以适应新的自然环境。在变,以适应新的自然环境。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作计划

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com