超图(Hypergraph)理论与应用.ppt

上传人:wuy****n92 文档编号:66707644 上传时间:2022-12-19 格式:PPT 页数:41 大小:416.50KB
返回 下载 相关 举报
超图(Hypergraph)理论与应用.ppt_第1页
第1页 / 共41页
超图(Hypergraph)理论与应用.ppt_第2页
第2页 / 共41页
点击查看更多>>
资源描述

《超图(Hypergraph)理论与应用.ppt》由会员分享,可在线阅读,更多相关《超图(Hypergraph)理论与应用.ppt(41页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、超图(Hypergraph)理论与应用刘未鹏动机(Motivation)什么是共指消解(Coreference Resolution)共指消解的各种方法图分割(Graph Partitioning)方法简单图简单图分割方法的潜在缺陷潜在缺陷引入超图引入超图(Hypergraph)的意义的意义超图(Hypergraph)超图的定义超图的定义超图的分割超图的分割超图真比简单图优越吗?超图真比简单图优越吗?如何将超图运用到共指消解中什么是共指消解李明i 怕高妈妈j 一人呆在家里寂寞,他i 便将他自己i家里的电视搬了过来给她j。共指消解的方法规则方法 利用句法层面的知识,进行启发式消解。统计方法 基于

2、训练语料库,统计出概率分布,然后进行预测。机器学习 决策树、朴素贝叶斯、规则学习等等。图方法图方法 以节点表示名词短语,以边表示名词短语间的共指关联度。图方法图方法节点表示名词短语边表示短语与短语之间的某种关联(这种关联必须要对“共指”起到贡献,如人称、性别、单复数等属性)边的权值用来表示这种关联对共指起到的贡献的大小简单图一条边只能连接两个顶点超图一条边可以连接多个顶点为什么引入超图为什么引入超图(一个例子一个例子)简单图版本丢失了“同一作者的多篇文章同一作者的多篇文章”这一信息,而超图版本则保存了这一信息。在共指消解里面,也有类似的信息,比如“多个指代的性别(gender)相同”、“多个指

3、代的数量相同”(即同为单数或同为复数)等。顶点代表文章,每条边代表两个顶点(文章)享有同一个作者为什么引入超图为什么引入超图(一个例子一个例子)假设有三篇文章,v1,v2,v3。它们的作者分别是:v1:A,B v2:B,C v3:C,D如果v1:A,B v2:A,C v3:A,D简单图的分割目标目标:使分割出来的两个子图之间的关联最小 问题问题:如何定义“关联最小关联最小”?简单图分割的数学表达分割子图间关联最小关联最小=跨分割边界的所有边的跨分割边界的所有边的权值之和最小权值之和最小邻接矩阵(Adjacency Matrix)A(i,j)=顶点i和顶点j之间的所有边的权值之和Min Cut(

4、G+,G-),根据二次型表达式二次型表达式等价于:等价于:MaxY YTAY,其中Yi +1,-1;简单图分割的问题问题问题:导致退化的分割Normalized-Cut仅仅做到跨边界的权值和最小还不够,因为可能存在一些孤立点,它们跟外界的联系本身就极小,于是很可能被独立分割出来。Normalized-Cut解决思想解决思想:一个cut是“好的”当且仅当对任意一个子图来说,从子图中的节点出发跨越分割边界的边的权值和相比于从子图节点出发的所有边的权值和的比例越小越好。通俗来说就是:任一分割出来的子图跟外界的联系主要来自该子图内部。Normalized-CutNP-Hard拉普拉斯矩阵(Laplac

5、ian Matrix)谱(Spectrum)方法NP-Hard谱方法谱方法逼近解minz(ZTLZ/ZTZ)其中 Zi r+,r-;r+=|i:zi0|r-=|i:zi0|/|i:zi0|不变式:ZTZ=n;ZT1=0;含义:L是拉普拉斯矩阵 L=B A 超图理论的目标 将简单图的表达泛化为超图表达,将简单图分割算法推广到超图分割之上,并证明超图分割和简单图分割的内在标准内在标准(criteria)是一致的是一致的超图的表示关键是超边如何表示:用一个点集来表示。令V是一个顶点集合V=v1,v2,v3,v4,v5,v6,v7;则每一条超边都是每一条超边都是V的一个子集的一个子集E=e1,e2,e

6、3,e4=v1,v2,v3,v2,v3,v3,v5,v6,v4 超图的矩阵表达顶点的度d(v)超边的度超图的矩阵表达 超图的邻接矩阵其中W是一对角阵,对角线元素为各超边的权值。A是超图的邻接矩邻接矩阵阵按右边方法表示的A(超图的邻接矩阵),A(i,i)为0,A(i,j)为为vi和和vj共享的所有超边的权值和共享的所有超边的权值和。Dv为一对角阵,对角线元素为各顶点的度d(v)。超图的分割(cut)如何将简单如何将简单图的分割标图的分割标准推广到超准推广到超图上面?图上面?理解超图理解超图cut的含义的含义将被切割的每一条超边看作一个子图每一条超边看作一个子图,其中每两个顶点都是两两相连的,连接

7、的权值皆为w(e)/(e的度)。该子图被切割为eG+和eG-个顶点,因此被切断的边一共有|eG+|eG-|个。超图的Normalized-Cut超图和简单图超图和简单图的的Normailzed-cut是形式一是形式一致的致的 超图的Normailzed-Cut随机游走(Random Walk)超图分割的随机游走随机游走解释意义意义:证明超图分割的确是简单图分割的一个妥善的推广,这对超图分割算法的有效性至关重要。图分割的随机游走解释图分割的随机游走解释:一个最优分割须使得随机游走落在同一个子图中的概率最大,同时随机游走跨越分割边界的几率最小。目标目标:证明超图分割也满足同样的随机游走性质。什么是

8、随机游走随机游走(Random Walk)Google Pagerank算法算法Google Pagerank算法基本模型:用一个向量I来代表所有页面的重要性,I的第i个分量Ii就是第i个页面的重要性;另,假设一个页面有lj个向其它页面的链接,那么每个被指向的页面都得到该页面的1/lj的重要性;同时假设一个页面的重要性完全来自指向它的页面的贡献数学表达:其中Pj表示第j个页面。lj表示第j个页面上的链接数,PjBi表示第j个页面指向Pi。这么多页面,它们互相之间都有一堆链接,我怎么知道一我怎么知道一个特定的页面个特定的页面的重要性是多的重要性是多少呢?少呢?Google PageRank算法G

9、oogle Pagerank算法如何计算I=HI中的I?(I是H的一个特征向量,对应特征值为1)迭代法:Ik+1=HIkGoogle Pagerank算法Google Pagerank算法问题:链接黑洞问题:链接黑洞(只进不出只进不出)Google Pagerank算法解决解决:随机游走随机游走(Random Walk)理论假设你是一个网络爬虫,在网络上跟着页面链接随机的游走。那么,当你发现自己停在一个页面Pj上,而Pj共有lj个链接,其中一个指向Pi,那么你下一步游走到Pi的几率就是1/lj。在你随机游走的整个过程中,假设你停留在Pj上的时间是Tj,那么你停留在Pi上的时间就是:随机游走模随

10、机游走模型跟页面重型跟页面重要性模型是要性模型是一致的一致的随机游走模随机游走模型跟页面重型跟页面重要性模型是要性模型是一致的一致的Google Pagerank算法随机游走到页面2(一个链接黑洞链接黑洞)的时候,尽管没有链接,但我们可以假设下一步游走等概率游走到任意一个其它页面,即于是 超图分割超图分割de随机游走解释随机游走解释p(u,v)表示从顶点表示从顶点u随机游走到顶点随机游走到顶点v的概率。的概率。pi(v)表示随机游表示随机游走停留在走停留在v上的概上的概率。率。超图分割超图分割de随机游走解释随机游走解释 超图分割的随机游走解释超图分割的随机游走解释随机游走留在分割子图内的几率尽可随机游走留在分割子图内的几率尽可能大,跨越分割边界的几率尽可能小能大,跨越分割边界的几率尽可能小超图真的比简单图优越吗?超图真的比简单图优越吗?如何将超图运用在共指消解中跟把简单图运用在共指消解中一样,因为 超图是简单图的推广。半指导聚类:惩罚矩阵问题讨论问题讨论:在共指消解里面,超图的超边表示什么,超边的权值又如何确定超边的权值又如何确定(这在那这在那篇论文里面也是一个未决问题篇论文里面也是一个未决问题)。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com