基于熵权灰色关联模型的重大突发舆情意见领袖识别研究-朱志国.pdf

上传人:1890****070 文档编号:111087 上传时间:2018-05-13 格式:PDF 页数:9 大小:4.31MB
返回 下载 相关 举报
基于熵权灰色关联模型的重大突发舆情意见领袖识别研究-朱志国.pdf_第1页
第1页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《基于熵权灰色关联模型的重大突发舆情意见领袖识别研究-朱志国.pdf》由会员分享,可在线阅读,更多相关《基于熵权灰色关联模型的重大突发舆情意见领袖识别研究-朱志国.pdf(9页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、情报学报 2017年7月 第36卷 第7期 Journal of the China Society for Scientific and Technical Information, July 2017, 36(7): 706-714 收稿日期: 2016-11-10; 修回日期: 2017-03-20 基金项目: 国家自然科学基金面上项目(多维兴趣图谱建模下的社会化营销精准“推送 -扩散”研究:兴趣表征、用户聚合与匹配扩散,No.71672023) ,教育部人文社会科学研究规划项目(社会化营销中的精准“推送 -扩散”研究:基于多维兴趣图谱建模,No.16YJAZH083) ,国家自然科学基

2、金青年项目(社会化媒体中突发公共卫生事件网络舆情的传播演化机制及干预策略研究,No.71503033) 。 作者简介: 朱志国,男, 1977 年生,博士,副教授,博士生导师,主要研究方向为社会化媒体用户建模与信息扩散;张翠,女, 1985 年生,硕士,研究方向为社交网络用户影响力测度, E-mail: ;丁学君,女, 1978 年生,博士,副教授,研究方向为突发事件网络舆情;苗蕊,女, 1982 年生,博士,讲师,研究方向为社交媒体与社会化商务。 基于熵权灰色关联模型的重大突发舆情 意见领袖识别研究 朱志国1,2,张 翠1,丁学君1,苗 蕊1( 1. 东北财经大学管理科学与工程学院,大连 1

3、16025; 2. 大连理工大学管理与经济学部,大连 116024) 摘 要 在线社会化媒体中意见领袖的准确测度与识别,对于重大突发舆情的情报研判、引导干预与妥善处置具有重要的研究意义。为此,首先从用户的静态网络结构特征与动态信息交互两方面入手,选择 7 项测度指标,基于熵权灰色关联方法,建立综合测度指标体系中的关联系数、指标权重以及加权关联度的计算模型。接下来,爬取天涯社区国际观察板块中,有关“ 522 新疆暴恐事件”话题讨论中的用户关系与交互数据,对提出的意见领袖测度计算模型进行全面的实验分析。最终得出结论,与单一考虑某个测度指标的方法相比,提出的综合意见领袖测度模型能够更加全面、准确地识

4、别出在线社会化媒体中的高影响力用户群体。研究成果将为我国在重大突发舆情监控、应对处置等方面提供有力的方法支持。 关键词 重大突发舆情;灰色关联分析;熵权法;意见领袖测度 Identifying Opinion Leaders in Major Sudden Public Opinion Spread Based on Entropy-weighted Grey Correlation Model Zhu Zhiguo1,2, Zhang Cui1, Ding Xuejun1and Miao Rui1(1. School of Management Science and Engineering

5、, Dongbei University of Finance and Economics, Dalian 116025; 2. Faculty of Management and Economics, Dalian University of Technology, Dalian 116024) Abstract: It has been an important research issue for information analysis, government intervention, and proper dis-posal during major sudden public o

6、pinion spreads to accurately measure and identify opinion leaders on online social networks. Seven metrics for identifying opinion leaders are selected from two aspects of users static network struc-ture characteristics and dynamic information interactions. Subsequently, based on Grey relational ana

7、lysis and en-tropy value method, the computational model of correlation coefficient, metric weight, and weighted correlation de-gree in the measurement system is constructed. Finally, this paper fetches the data of users relationship and interac-tions in the topic discussions about “522 incident of

8、violence and terrorism in Xinjiang” in the international review forum of Tianya and subsequently conducts elaborate experiments to verify the proposed computational model for discovering opinion leaders. In summary, compared with the other methods with a single metric, the proposed inte-grated model

9、 can more comprehensively and accurately identify opinion leaders on online social network platforms. This achievement can provide powerful methodological support to our country to monitor and handle major sudden public opinions. 万方数据第 7 期 朱志国等:基于熵权灰色关联模型的重大突发舆情意见领袖识别研究 707 Key words: major sudden p

10、ublic opinion; grey correlation analysis; entropy-weighted method; opinion leader meas-urement 1 引 言 当前,中国正处于激烈的社会转型期,社会矛盾与社会冲突凸显,突发重大公共安全事件呈直线上升趋势1。更为严峻的是,借助大量涌现的在线社会化媒体平台(博客、在线论坛、社交网站等) ,广大网民通过发帖、评论、转发等行为方式,使得事件在短时间通过情绪合流、共振后,呈现病毒传播般快速扩散开来,进而引发了新的网络舆情危机2。这种从“线下重大突发事件”引发“线上舆情扩散”再到“进一步恶化事态”的模式 , 使得重

11、大突发事件更加难以控制、引导和处置,极大影响了社会公共安全和稳定形势。 在线社会化媒体中,意见领袖( Opinion Leader)在舆情信息发布、转发、深度评论等方面,对其他成员施加深刻影响,是重大突发舆情形成、扩散、演化中的主力军3-4。 因此,有关在线社会化媒体中意见领袖的测度与识别,对于重大突发舆情扩散中的精准情报研判、有效引导干预乃至后期的妥善处置,具有重大的现实意义5。同时,对于我国政府在当前日益严峻的危机管理方面,也具有重要的研究意义与价值6。 意见领袖的测度与识别作为一个典型的交叉学科研究热点问题,已经吸引了来自情报科学、营销科学、计算机应用等多个领域学者的广泛关注7-9。 2

12、 相关研究工作 20 世纪 40 年代, 美国哥伦比亚大学著名传播学先驱 Paul F Lazarsfeld 最早提出了意见领袖概念与理论10。他经过研究发现,在选举过程中多数选民获取信息并接受影响的主要来源是意见领袖,并不是大众传媒。此后,一些学者分别从政治参与、市场营销等方面对意见领袖进行了研究11-12。而今,在不断涌现、形态各异的在线社会化媒体中,逐步汇聚形成了具有海量关系、行为等可感知、可计算的人类数字足迹虚拟社会。在此背景下,为意见领袖的测度与识别研究工作,从数据的广泛采集、大容量存储到先进的计算方法等方面提供了绝佳的机遇。目前,对于在线社会化媒体中的意见领袖测度与识别研究工作,主

13、要从以下三个方面来开展: ( 1) 基于社会网络结构分析的测度方法。 这方面的研究主要从社交网络关系结构中,发现占据重要位置的节点及节点群,并将这些节点视为具有重要影响力的意见领袖13。其中,最为简单的方法为:计算网络结构中节点的入度和出度值,将其作为节点影响力的测度指标,进而识别意见领袖15。同 时 ,PageRank 作为成功应用于搜索引擎的著名算法,也被许多学者借鉴,并应用于社会网络分析中的意见领袖测度与发现研究中15。此外, Cha 等16基于Twitter 平台研究用户的个人影响力,通过计算“关注” 、 “转发” 、 “提及”三种网络结构的点度中心度,利用皮尔逊相关系数对用户影响力进

14、行排序。刘堪等17以新浪微博为例,以链路结构计算视角,根据领域中心值和权威值,对用户节点进行排序,从而筛选出微博领域中的专家。 ( 2 ) 基于用户交互信息分析的测度方法。Agarwal 等18将博文的被引用及评论次数、博文长度,以及博文内容新颖程度等因素,作为评价博主与追随者互动的指标,进而识别出最受欢迎者。 Zhu等19从用户生成内容 UGC 出发, 构建了社会化媒体中的“用户生成内容”二分图模型,准确识别出在线社会化媒体中的高影响力用户与流行生成内容。台湾学者 Li 等20根据博客的特点,提出以网络结构、内容因素及活跃度因素为基础的 MIV 影响力评估模型,并利用人工神经网络方法挖掘博客

15、圈中的有影响力领导者。张星等21从个体动机和社会资本两个角度出发,发现社会互动关系、信任、认同等行为,对意见领袖识别均有显著影响。 ( 3 ) 测度指标设计与灰色关联分析( Grey Correlation Analysis) 。 通过构建科学、准确的评价指标体系,从而发现、测度在线社会化媒体中的意见领袖研究,也是一个重要的研究方向。 20 世纪 50年代,学者 Katz22就从能力、个性、社会地位三个方面,构建了面向现实社会的意见领袖评价体系。目前,丁汉青等23以豆瓣网为例,构建了 SNS 社区意见领袖的评判指标体系。 王佳敏等3从影响力和活跃度两个维度出发,应用一种改进的层次分析法,构建识

16、别微博意见领袖的权重指标体系。灰色关联分析是灰色系统理论中的一种重要分析方法。在处理信息不完整、多属性等情况下的评价指标设计中,此方法具有很好的优势24-25。熵权法则是根据指标信息熵值来确定客观权重的科学方法26。有关这两万方数据708 情 报 学 报 第 36 卷 种方法结合的工作有:陈卫静等27采用熵权法确定指标权重,提出基于熵权的灰色关联分析法测度作者影响力,并以 ACM SIGKDD 合作网络为例,测度和分析了科学合作网络中具有较强影响力的节点;谢新洲等28运用灰色统计法,对初始评判指标集进行筛选,最终建立了一个由 4 个一级指标、 12 个二级指标构成的网络意见领袖舆情引导能力评判

17、指标体系。 总体分析,以上有关在线社交媒体意见领袖识别与测度方法,各有优、劣势。进一步地分析可知,如果单从网络拓扑结构分析入手,虽然数据获取便利、测度指标简单,测量结果客观。但由于其属于静态的结构分析方法,因此不能得到反映动态性与实时性的结果。而如果单纯从用户间的动态交互信息来分析、测度,准确获取与迅速分析用户间海量的交互信息与行为数据,实现起来又将困难重重。为此,本文探求将三种研究视角有效结合,首先选取静态结构分析与动态用户交互行为中的一些重要指标,进一步利用科学的灰色关联分析方法进行测度指标设计,并通过熵权法计算指标权重,从而提出精确的意见领袖发现模型。 最后,本文通过抓取天涯社区国际观察

18、板块的“ 522 新疆暴恐事件”用户关系与交互数据,对提出的意见领袖影响力测度计算模型进行详尽、深入的实验验证与讨论。 3 意见领袖测度指标选取与建模 3.1 测度指标选取 本文首先综合静态社交网络结构分析与动态用户交互行为,选取“网络中心性”与“用户活跃度”两个方面,作为意见领袖的判定依据。具体如表 1所示。这两个方面中进一步的指标选取依据与重要意义为: 用户网络中心性 。基于静态网络结构分析,用户在社交网络中的中心性越高,表明其在社交网络中具有重要的地位。 本文选取了 “度中心度” 、“接近中心度” 、 “中介中心度”和“特征向量中心度”四个指标对用户影响力进行测度和评价。 用户自身活跃度

19、 。从动态用户交互行为分析,用户在社交网络中与其他用户的互动性越强,这样就更加有利于传递自己的观点,从而对他人产生更深的影响。为此,本文选取了“发帖量” 、 “发出评论量 ”和“经验值”三个指标。 3.2 基于灰色关联分析的测度指标分析 灰色关联分析法是一种定量分析两对象之间关联程度的方法。在本文的测度模型中,设置理想意见领袖为参考对象,利用灰色关联分析方法,计算参与话题讨论的用户与参考对象间的关联程度。如果两者间的关联度值较大,则可以考虑将该用户作为 表 1 意见领袖影响力测度的指标选取 静态结构与动态交互 类型 度量标准 计算公式 度量标准描述 基于中心度 度中心度 DEGdeg( )()

20、1iinCng其中, deg( )in 表示与该节点直接相连的节点数量和。本项研究中:该指标越大,表征用户在论坛中的好友众多,权威性也越高,是意见领袖识别的重要指标。接近中心度 CLO11()(, )i gijjcndn n表示节点 i 到其他各节点的距离之和,其中 (, )ijdn n代表节点 i 到 j 的距离,在 0,1。本项研究中:衡量用户到论坛中其他用户的距离远近以及接近能力。基于最短路径 中介中心度 BET()/()(1)/2ik ik ikikig ngCnnnikg 表示节点 i 到节点 k 的捷径数。本项研究中:该指标表示用户是论坛中其他用户进行信息传递的依赖节点。可以衡量用

21、户转接关系的能力。 用户网络中心性16基于随机游走 特征向量中心度 11, 2, ,niijjin 矩阵形式为:l j 为各节点的中心度向量值。这是一个全局概念,本项研究中:该指标大,意味着该用户与论坛中心程度高的用户关系紧密。 发帖量 ()Pi niCn P本项研究中:表示论坛中用户所发表的帖子数量。发出评论量 ()Ci niCn C本项研究中: 表示论坛中用户对他人所发表帖子的评论数量。 用户自身活跃度 活跃度 经验值 ()ei niCn E本项研究中:衡量用户活跃度的一项指标(用天涯社区中用户活跃时间衡量) 。 万方数据第 7 期 朱志国等:基于熵权灰色关联模型的重大突发舆情意见领袖识别

22、研究 709 意见领袖来考虑。测度的具体步骤和计算方法如下: 1)关联分析 第一步,确定意见领袖序列和用户序列。设样本序列中有 n 个参与用户, m 个评价指标, 000 0 0(1), (2), , ( ), , ( )km ( 1) (1), (2), , ( ), , ( )iii i ikm ( 2) 其中, 1, 2, , ; 1, 2, ,inkm。0 为参考序列,即具备意见领袖特质的理想序列,公式0()k 表示代表意见领袖的理想序列中的第 k 个指标值;i 为用户序列, ()ik 表示第 i 个用户的第 k 个指标的实际值。 第二步,由于各评价指标含义不同,量纲也必然存在差别,因

23、此需要对序列数据进行规范化处理。如公式( 3)所示: min ( )max ( ) min ( )iiikkk ( 3) 第三步,根据规范化处理后的指标值,计算指标关联系数。如公式( 4)所示: 00()minmin () () maxmax () ()() () maxmax () ()iik i i k iiikikkk kkkk kk ( 4) 其中, 1, 2, , ; 1, 2, ,inkm, ()ik 代表第 i 个用户的第 k 个指标与意见领袖对应指标间的关联系数;0()k 代表意见领袖中的第 k 个指标值; 为分辨系数,用于提高灰色关联分析中的分辨率。分辨系数的取值与分辨率成反

24、比, 越小,分辨率越大; 越大,分辨率越小。通常 0,1 。从公式( 4)可以分析得到, 的取值决定着 max maxik0()k ()ik 对关联系数 ()ik 的贡献。对于本项研究的主题, 0maxmax () ()ik ikk 与 0() ()ikk 差别不大。这时若 取值很小,难以有效分辨待检序列与标准序列间的相似性。因此,在本文设定 0.5 。 第四步,计算指标的综合加权关联度,如公式( 5)所示: 1() ()miikkk( 5) 其中, ()k 表示第 k 个指标的权重值。 2)利用信息熵法计算指标的权重 进一步地,对本文提出的意见领袖影响力测度指标,通过信息熵的计算,进而得到各

25、指标的权重值。在 n 个参与用户, m 个评价指标情况下,第 k个评价指标的熵值 Hk的定义和计算公式, 如公式 ( 6)所示: 1ln( )nkkjjHp f( 6) 其中: 1kjkjnkjjf( 7)1ln( )pn ( 8) 其中,kj 表示第 j 个参与用户的第 k 个指标的规范值; p 为指标信息熵系数,一般令 p=1/lnn; fkj表示第 j 个评价对象下,第 k 个评价指标的特征权重。进一步地进行规范化计算,如公式( 9)所示: min ( )max ( ) min ( )jjkjkkk ( 9) 因此,第 k 个指标的熵权值计算如公式( 10)所示: 11()kmkkkm(

26、 10) 其中, ()k 为第 k 个指标的权重。 m 个指标的权重值加和为 1,如公式( 11)所示: 1() 1mkk( 11)3)意见领袖测度函数 综上所述,基于灰色关联分析方法,可以给出用户 i 的影响力测度公式,如公式( 12)所示: 1() ()miiKI kk( 12) 其中, 1, 2, ,km , ()k 表示指标权重,指标权重之和等于 1; ()ik 为指标关联系数。 4 实验数据获取与结果分析 4.1 实验数据的获取与预处理 本研究中,采用火车采集器软件对天涯社区的国际观察版块中,以 2014 年 5 月 22 日突发的新疆暴力恐怖事件为原始语料,进 行相关信息的采集。事

27、件起于 5 月 22 日,话题讨论高峰在 22 日、 23 日、24 日,之后话题讨论趋于平稳,话题基本在 6 月 1日趋于平淡,回帖量显著变少。通过清除无效回复、万方数据710 情 报 学 报 第 36 卷 重复回复等数据预处理工作,最终得到有关“ 522 新疆暴恐事件”热议帖子记录 735 条,有 289 位有效用户参与话题讨论。得到的原始表(部分)如图 1所示。 接下来,针对“新疆暴恐事件”讨论中的用户互动关系数据,为了便于在 UCINET 软件中进行分析,首先对用户昵称进行编码。表 2 显示了部分的用户编码和相关行为特征数据。 图 1 部分原始数据 表 2 用户的行为特征信息表(部分

28、) 编码 用户昵称 发帖量 发出 评论量 经验值 粉丝数XHDK 星河钓客 952 0 18 66 SSQN 蜀山青牛 25 0 14 8 QLGZ 起立鼓掌十分钟 55 1104 6 5 FYC 风隐尘 325 4052 14 18 LLD 李李达 2 30 17 0 4.2 主要的实验结果 1)指标间的关联系数计算 首先利用 UCINET 软件,基于 SNA 计算用户的四个网络中心性指标值,同时计算用户的三个活跃度指标值。在此基础上,利用公式( 3)进行规范化处理,消除数据之间量纲的差异。 根据灰色关联分析原理,需要设定一个理想参考序列,即基准母序列,将其作为与各个用户序列进行关联度分析的

29、参考标准。目前,基准母序列的选取方法有两种:一种是正则基准序列:选择各性能指标的最优值作为基准母序列;另一种是负则基准序列: 选择各性能指标的最劣值作为基准母序列26。在本项研究中,采用正则基准序列,即设定意见领袖影响力指标的最优值(值为 1) ,作为参考序列标准:0 =1.000,1.000,1.000,1.000,1.000,1.000, 1.000。与此参考序列关联度越大,表示对象与理想意见领袖越接近。最后,根据公式( 4)确定各个指标之间的关联系数,如表 3 所示。 2)利用熵值法确定各指标权重值 利用熵值法公式对影响力评价指标中心性和活跃度等赋权值,如表 4 所示。 3)计算指标加权

30、关联度 根据如公式( 12)所示的影响力测度函数,计算得到与理想意见领袖序列之间,关联度最高的前10 名意见领袖用户。具体的排序结果如表 5 所示。 4)网络结构的可视化展现 ( 1)有意见领袖存在时的网络结构图 从图 2 可以看出,在本项研究中,有关“新疆暴恐事件”话题讨论所形成的网络结构,意见领袖居于中间位置,占据着重要的“桥”的位置,关系呈放射状向外发散。用户之间的关系也因为意见领袖的存在而更加紧密。因此,意见领袖在对信息传播和控制起着导向作用。 ( 2)无意见领袖时的网络结构图 本文还尝试将网络中的主要意见领袖节点删除,如图 3 所示。进一步,通过 UCINET 软件分析网络密度、凝聚

31、子群等指标,发现删除意见领袖的网络密度变小。网络密度降低反映出信息传播范围缩小,信息传递效率降低。同时,删除意见领袖节点后,同时网络距离也在增大,反映出信息传递难 万方数据第 7 期 朱志国等:基于熵权灰色关联模型的重大突发舆情意见领袖识别研究 711 表 3 指标关联系数( = 0.5) (部分结果) 参与者 度中心度 接近中心度 中介中心度 特征向量中心度 发帖量 发出评论量 经验值 1 XHDK 1.0000 1.000 1.000 1.0000 0.3515 0.3333 0.5333 2 SSQN 0.3393 0.3363 0.4608 0.3527 0.3525 0.3333 0

32、.4706 3 FXXP 0.3491 0.3389 0.4697 0.3590 0.3456 0.3649 0.6154 4 QLGZ 0.3384 0.3343 0.4608 0.3548 0.3343 0.3408 0.3810 5 DFHR 0.3333 0.3333 0.4631 0.3548 0.4962 0.5334 0.5714 6 KN38607 0.3333 0.3333 0.4553 0.3514 0.3403 0.3420 0.4706 7 Babyvox1982 0.3437 0.3375 0.4614 0.3536 0.3333 0.3352 0.3902 8 Cc

33、st123 0.3359 0.3333 0.4608 0.3525 0.3337 0.3360 0.4444 9 DSSL 0.3547 0.3386 0.4805 0.3621 0.3338 0.3403 0.4571 10 MXD 0.3359 0.3333 0.5289 0.3582 0.3452 0.3510 0.6400 11 KSRS 0.3333 0.3333 0.4553 0.3514 0.3333 0.3368 0.4000 12 Wcnmty2013 0.3371 0.3338 0.3772 0.3374 0.3333 0.3365 0.3810 13 Seannatenz

34、a 0.3397 0.3353 0.4597 0.3529 0.3604 0.3624 0.5333 14 HGMSK 0.3450 0.3368 0.4310 0.3412 0.3974 0.3970 0.6957 15 ZGXH 0.3359 0.3333 0.3682 0.3347 0.3365 0.3546 0.3721 表 4 各指标权重值 指标 度中心度 接近中心度 中介中心度 特征向量中心度 发帖量 发出评论量 经验值 ()k (1) (2) (3) (4) (5) (6) (7) 权重 0.1783 0.3503 0.1053 0.0323 0.1506 0.1241 0.05

35、91 表 5 用户影响力关联度(前 10 名) 名次 用户 关联度 1 XHDK 0.6704 2 TSDXGSPZ 0.5797 3 GMKSF 0.5726 4 DFR 0.4651 5 LSSCDF 0.4507 6 CC2011 0.4289 7 SWY 0.4348 8 BCDZ 0.4246 9 TYMN 0.4105 10 WUZYSXJ 0.3951 度增大。通过图 2 与图 3 的对比,可以得出结论,意见领袖在社交网络中,对于信息传播扩散的范围与速度起到了至关重要的作用。 4.3 实验结果的验证分析 1)与实际观察数据的对比分析 对实验中排在前 5 位的意见领袖用户(如表 4

36、所示) ,本文从天涯论坛获取到他们的一些实际数据,如表 6 所示。具体的比较分析如下: XHDK 是话题讨论的发起者,随后 TSDXGSPZ又单独针对 XHDK522 新疆暴恐话题发表言论, 毫无意外他们具有较高的网络中心性,可以判定为意见领袖。除此之外,对 GMKSF, DFR, LSSCDF 三人进行实际观察。发现他们虽然均没有职位权力;但在天涯论坛中经验值(根据其活跃度,发帖及回帖测得)高,主贴及回复贴的数据都在千条以上。由此可见 GMKSF, DFR, LSSCDF 等用户也具有“草根意见领袖”的特质。 2)综合指标加权关联度与单一指标的对比分析 如图 4 所示,本文提出的意见领袖综合

37、指标加权关联度与点度中心度的关系散点图(限于篇幅,仅展示与“点度中心度”指标方法的对比)可以看出,综合指标加权关联度并非简单地随着点度中心度值的变动而变动。也就是说,对一些节点的点度中心度值较高,但其综合加权关联度反而却较低,例如, “ 522 新疆暴恐事件”中,节点 FYC 的点度中心度值较高, 但是他的影响力综合排名却只在第24 位。 由此可以得出结论,与考虑某个单一指标来测度意见领袖影响力的方法相比,本文基于灰色关联分析的综合加权测度指标,能够更加准确、全面地测度并识别出具有强大影响力的意见领袖用户。 万方数据712 情 报 学 报 第 36 卷 图 2 存在意见领袖的网络结构图 图 3

38、 无意见领袖的结构图 表 6 用户实际数据(取前 5 名) 序号 用户 职位 主贴数 回帖数 网龄(年)粉丝数1 XHDK 版主 952 2662 4 202 TSDXGSPZ 无 318 659 6 103 GMKSF 无 6367 21207 4 157254 DFR 无 3287 8120 4 126995 LSSCDF 无 11209 33545 4 181为了验证模型的有效性与准确性,本文还抓取天涯论坛中,有关“舌尖上的中国第二季”热点话题数据作为原始语料进行计算。有效时期内共抓取用户讨论数据 1031 条,有效参与人数 112 人,计算得到影响力关联度最大的前五位用户 ID(由于篇

39、幅限制以及计算过程类似,此处不再展开讨论) ,如表7 所示。从实际观察情况分析,排序前 5 位的用户确 万方数据第 7 期 朱志国等:基于熵权灰色关联模型的重大突发舆情意见领袖识别研究 713 实在论坛中,主动发帖,积极回帖,且具有众多粉丝关注。可以进一步证实,本文提出的意见领袖识别模型,可以准确、有效地发现在线社会化媒体中的高影响力用户。 图 4 综合测度指标与点度中心度的散点图 表 7 用户影响力关联度排名(取前 5 名) 名次 用户 关联度 1 XGR 0.9605 2 ZD 0.4103 3 YWBA 0.3999 4 SHUMCHONG 0.3822 5 TMTXZF 0.3722

40、5 结论与展望 5.1 研究结论 在借鉴现有研究基础上,本文从用户的网络结构特征和动态用户交互两方面入手,提出了包含 7项指标的意见领袖测度体系,然后基于经典的灰色关联分析法,提出了综合用户影响力测度中的关联系数、指标权重以及加权关联度三方面的计算模型。最后,本文抓取天涯社区国际观察板块中有关“ 522新疆暴恐事件”话题讨论中的用户关系与交互数据,对提出的意见领袖影响力测度模型进行了实验分析。通过实证分析,本文提出的模型方法能够准确、全面地识别出,在线社会化媒体中突发舆情扩散的高影响力意见领袖。 5.2 未来工作展望 未来进一步的研究工作可以从考虑从以下两个方面开展: ( 1)出于研究模型简洁

41、和可操作性的考虑,本研究仅选取了中心性、用户活跃度等因素作为意见领袖影响力测度指标。在未来的研究中,可以将其他的影响因素,如文本中的情感因素,也纳入研究模型。这样,可以使得对意见领袖的测度更加精准、全面。 ( 2)不同社交网站中,用户间影响力的表现方式各有不同。因此,本文提出的在线社会化媒体中意见领袖影响力测度模型,在其他社交类网站上是否也具有良好的测度效果?这需要在未来的工作中进一步分析与完善。 参 考 文 献 1 康伟 . 突发事件舆情传播的社会网络结构测度与分析基于 “ 1116 校车事故” 的实证研究 J. 中国软科学 , 2012(7): 169- 178. 2 王世雄 , 祝锡永

42、, 潘旭伟 , 等 . 网络舆情演化中群体极化的形成机理研究 J. 情报学报 , 2014, 33(6): 614-622. 3 王佳敏 , 吴鹏 , 陈芬 , 等 . 突发事件中意见领袖的识别和影响力实证研究 J. 情报学报 , 2016, 35(2): 169-176. 4 罗晓光 , 溪璐路 . 基于社会网络分析方法的顾客口碑意见领袖研究 J. 管理评论 , 2012, 24(1): 75-81. 5 裘江南 , 杨书宁 , 翟劼 , 等 . 基于扫描统计量的微博中突发事件舆情动态监测方法 J. 情报学报 , 2015, 34(4): 414-423. 6 谢起慧 , 褚建勋 . 基于社

43、交媒体的公众参与政府危机传播研究中美案例比较视角 J. 中国软科学 , 2016(3): 130-140. 7 Aral S. Identifying social influence: A comment on opinion lead-ership and social contagion in new product diffusionJ. Market-ing Science, 2011, 30(2): 217-223. 8 蔡淑琴 , 马玉涛 , 王瑞 . 在线口碑传播的意见领袖识别方法研究 J. 中国管理科学 , 2013, 21(2): 185-192. 9 樊兴华 , 赵静 ,

44、 方滨兴 , 等 . 影响力扩散概率模型及其用于意见领袖发现研究 J. 计算机学报 , 2013, 36(2): 360-367. 10 Lazarsfeld P F. The peoples choice: How the voter makes up his mind in a presidential campaignM. New York: Duell, Sloan Pierce, 1944. 11 Mergel I. Social media adoption and resulting tactics in the U.S. federal governmentJ. Governm

45、ent Information Quarterly, 2013, 30(2): 123-130. 12 Van den Bulte C, Joshi Y V New product diffusion with influ-entials and imitatorsJ. Marketing Science, 2005, 26(3): 400-421. 13 马宁 , 田儒雅 , 刘怡君 , 等 . 基于动态网络分析 (DNA)的意见领袖识别研究 J. 科研管理 , 2014, 35(8): 83-92. 14 Zhu Z G. Discovering the influential users

46、 oriented to viral mar-keting based on online social networksJ. Physica A: Statistical Mechanics and its Applications, 2013, 392(16): 3459-3469. 15 Weng J S, Lim E P, Jiang J, et al. TwitterRank: finding topic- sensitive influential twitterersC/ Proceedings of the Third ACM International Conference

47、on Web Search and Data Mining. New 万方数据714 情 报 学 报 第 36 卷 York: ACM Press, 2010: 261-270. 16 Cha M, Haddadi H, Benevenuto F, et al. Measuring user influ-ence in Twitter: the million follower fallacyC/ Proceedings of the 4th International AAAI Conference on Weblogs and Social Media. Washington D C, USA, 2010: 10-17. 17 刘勘 , 范琴 . 基于链路结构的微博领域专家识别研究 J. 情报学报 , 2016, 35(1): 66-76. 18 Agarwal N, Liu H, Tang L, et al. Identifying the influential blog-gers in a communityC/ Proceedings of the 2008 Internatio

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 研究报告 > 论证报告

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com