舆情管理软件介绍(共40页).doc

上传人:飞****2 文档编号:7215530 上传时间:2022-02-21 格式:DOC 页数:40 大小:1.65MB
返回 下载 相关 举报
舆情管理软件介绍(共40页).doc_第1页
第1页 / 共40页
舆情管理软件介绍(共40页).doc_第2页
第2页 / 共40页
点击查看更多>>
资源描述

《舆情管理软件介绍(共40页).doc》由会员分享,可在线阅读,更多相关《舆情管理软件介绍(共40页).doc(40页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、精选优质文档-倾情为你奉上总体框架网络舆情监控系统以基础硬件为支撑,海量互联网数据源为采集对象,以标准、规范和安全体系为保障,提供给客户集舆情信息的采集、分析、展示、预警、管理、应急导控处置于一体的监控平台。系统总体框架由硬件支撑层、数据采集层、应用层和操作层组成。采用面向服务的思想,利用松散耦合的分层方式将系统整体上分为四个层次和两个体系,各层间的界限清晰,功能明确而不交叉,具有较高的可配置性和伸缩性。1 硬件支撑层硬件支撑层所需设备由客户投入建设,主要由服务器(若干)、存储设备、路由器、网络、安全基础设备等构成,一般放置在信息中心的机房中,也可托管于网通或电信机房,为整个系统提供基础的硬件

2、支撑。互联网信息采集设备需接入互联网,内部用户访问可使用局域网。2 数据采集层实现对上万个全国知名网站及论坛、地方性网站及论坛、行业网站及论坛、境外重点中文网站及论坛信息的实时监控;实现对国内外著名博客、微博、贴吧、SNS、QQ群、带文字的音视频、手机网站的信息监控采集。对重点来源网站信息实现5分钟频率更新,一般网站信息更新频率为30-60分钟内。3 应用层应用层是整个系统的核心,采用面向服务的思想,为用户输出舆情监测结果和用户对信息的查询、管理等任务。应用层由五大应用平台组成,包括舆情搜索展示平台、舆情管理工作台、应急导控处置平台、用户管理平台和通讯平台,利用Web Services技术为系

3、统升级服务或为其他外部系统提供基于SOAP的远程方法调用接口,用以完成异构系统之间的数据交换和同步。4 操作层系统为操作员提供友好的操作界面,易操作、易使用。5 安全保障体系从技术安全、运行安全和管理安全三方面构建安全防范体系,切实保护系统的可用行、机密性、完整性、抗抵赖性、可审计性、可控性。6 标准规范体系为保证系统有效运行及与后续建设系统有效的集成,在系统建设和运行中,需遵循和制定相关的业务规范、技术标准和运行管理规范。此外系统还满足高可扩展性和易操作的特性。可根据用户单位的业务需求变化对软件功能进行扩充与拓展;同时软件操作和维护操作简单,便于使用。技术路线及系统架构在技术实现上,本互联网

4、舆情监测系统是采用目前最流行的B/S架构,使用面向对象的JAVA开发语言研发而成,具有高扩展性、高移植性和良好的跨平台性。系统总体架构图如下:舆情搜索和采集系统互联网信息采集技术是舆情监控系统的基础技术,考察采集技术优劣有及时性和全面性两个指标,及时性要求重要网站信息的5分钟采集入库,一般性网站信息的30分钟采集入库;全面性要求采集来源能覆盖全国性、地方性及行业性的知名网络,凡对舆论传播有着影响力的新闻站点、知名论坛、博客、微博、视频均需纳入监控范围。此外还要求采集引擎具有可操作性,用户可对采集环节进行调整和优化。及时性和全面性是一组对立指标。客户自建的网络舆情项目,一般投入有限,设备和网络建

5、设不可能支撑到对整个互联网的监测,而要追求采集的及时性,需采集频率快,势必会减少监控的采集范围,将舆情采集范围更多地优化为具有舆论传播价值的网络媒体,而非整个互联网。本果网络舆情采集引擎,主要帮助客户监测重点舆论发布及传播网站、跟踪传播内容、分析首发媒体及事件传播演变过程,通过信息和数据为舆情预警、研判和应急处置提供支持,我司舆情产品具有以下采集特色及优势:(一) 重点采集对舆情高发网站和主流网站设置最高采集优先级权重,以5分钟的采集频率采集信息,这些重点网站包括:1. 地方性、行业性新闻网站及论坛:一般情况下,地方性、行业性新闻网站及论坛是舆情的首发地,以普通网友为发布人,表现为各种爆料求证

6、信息,是舆情的重要监测来源,这类信息的发现有助于传播早期的舆论控制和引导;2. 全国性的新闻及社区网站:这些网站的用户量大,浏览量大,是舆情最重要的传播渠道,因能快速形成关注和传播,且扩大传播面,如在这类网站上出现报道,也表示舆情事件的传播进入了发展或爆发期,需采取和早期不同的应对和处置办法,也是舆情的重要监测来源;3. 重点人的网络ID:对于重点人的网络(包括论坛、博客及微博账户)发言和活动, 能代表网上大部分人的言论,或是煽动言论,或是有害言论,是舆情的重要监测源;4. 自动启动重点采集任务:在设置专题和导控任务后,会自动启动重点采集任务,调整其优先级和采集频率,确保重点任务的完成;5.

7、重点文章回复数/评论数及内容的采集,用于分析网友观点及态度;6. 导控任务采集:追踪文章在网络上的发展动态,u 文章是否存在,u 在各大搜索引擎是否存在快照,快照是否被删除,u 点击/回复数量的增幅情况;7. 热词采集:采集百度热词。(二) 采集任务可操作性用户可手动调整采集任务:1. 自定义采集频率:用户可自定义网站的采集频率,为不同权重的网站设置不同采集频率;2. 自主添加采集网站:用户可自行添加采集的网站;3. 自定义网站权重及优先级:监测网站的权重可维护,用户也可为不同权重网站设置采集优先级;4. 自定义采集任务:用户不仅可以调整单个网站的采集频率,也可对其采集进程进行管理,关停或暂停

8、网站的采集任务;5. 自定义微博地址:用户可添加微博地址到采集库,系统还提供导入模板供用户批量导入微博地址。6. 自主全网搜索添加:在全网搜索功能中,用户可指定关键词随时搜索互联网,并可将搜索结果形成结构化数据加入数据库。7. 定制搜索:提供关键词、来源、时间、网站性质等多种条件,供用户定制搜索方案,用于经常性的搜索请求。(三) 核心采集技术采用定点采集和全网搜索相结合的采集机制,定点采集可确保第一时间采集到重点网站的信息,全网搜索可进行传播全面性的补充采集;1. 定点采集:系统内置的重点监测网站,采用定点采集方式;2. 全网搜索:通过关键词对新闻类搜索引擎、论坛类搜索引擎、博客类搜索引擎、微

9、博类搜索引擎及大型网站的站内搜索工具的信息聚合搜索;3. 内嵌脚本执行引擎:随着Web2.0相关技术的发展,脚本语言越来越多地应用于论坛、新闻评论、博客等类型网站的建设。内嵌脚本引擎对脚本语言的自动解析和执行,实现对采用脚本语言的论坛、博客以及新闻评论网站的采集;4. 7X24小时不间断采集,5分钟采集频率,信息更新扫描最小间隔为1分钟;5. 关联采集:在针对QQ群监测中,系统可以自动将QQ群内成员的腾讯微博加入到采集源中;6. 对新浪微博、腾讯微博、境外推特、Facebook实行无限制、无屏蔽访问搜索。(四) 支持网络媒体形式网络媒体形式全:本系统内置上万个网站,可以对各类网络媒体进行监测:

10、1. 门户网站:系统可采集以媒体发布为主的新闻网站的信息;2. 论坛:各种形式的BBS、贴吧、论坛、社区;3. 博客:各博客网站的博客信息;4. 微博:国内外微博网站信息监测;5. 电子报:各类报纸的电子报的信息监测;6. QQ群:可监测QQ群内的聊天记录;7. 问答:对问答类网站的采集;8. 视频:对视频网站文字信息的采集;9. 境外信息:集成代理技术,通过代理服务器采集屏蔽访问的境外网站,监控涉及国家安全、煽动等信息;10. RSS:对RSS聚合信息的采集;11. WAP:对WAP网站信息的采集;12. 搜索引擎:对搜索引擎信息的聚合。(五) 采集内容丰富通过自动识别技术识别并抽取网页的要

11、素,包括:标题、来源网站、来源频道、发布人、发布时间、链接(URL)、正文、图片、快照、表格,自动剔除广告(图片或flash)等垃圾部分,除此以外,针对不同媒体,还采集了其他要素:1. 新闻:是否头版,专题,评论数,评论内容;2. 论坛:点击数,回帖数,是否论坛首页、置顶,加精,推荐,热帖,回帖人,回帖内容; 3. 博客:回帖数,回帖人,回帖时间,回帖内容;4. 微博:转发次数,评论数,粉丝数,评论人,评论内容,博主信息,粉丝名,话题;5. 视频网站:播放次数,评论数,评论内容;6. QQ群:群内发言,群内成员,发言时间,发言QQ,发言图片;7. 附件采集:支持对.doc/.xls/.pdf/

12、.txt文档的监测8. 网站属性:TCP/IP信息,采集网站TCP/IP备案信息,网站所属地域;采集存储:系统抽取各类网络媒体的信息要素,统一形成结构化信息,供后续分析、检索、查询、统计和展示。(六) 其他采集技术1. 支持验证码采集;2. 支持多页合并采集。(七) 支持多语言采集自动识别多种字符集编码,支持对中文、英文、中文简体、中文繁体、彝文、维文、藏文、蒙文、朝鲜语、韩国语、日语、西班牙语等语言的采集,并可以转换为统一编码格式。(八) 智能采集1. 需要登录与需要验证码的网站信息采集,采集过程完全仿人工,实现了“登录验证”采集。2. 长期大量采集网站信息,会引起网站重视并可能导致封锁IP

13、,通过自动获取代理IP地址并及时替换代理IP地址等技术,防止个别网站进行反采集,反监测。支持多种网站的信息的编码,GBK、BIG5、UNICODE、UTF8,软件会自动转换成GBK码进行统一的处理。软件即会自动识别网站的组织结构,自动识别网站的编码。(九) 增量采集与自动更新对于初次采集目标网站,软件支持完全采集。而对于已采集过的站点支持增量采集。自动检测站点是否发生更新,并不会遗漏任何一个重要信息。(十) 带宽占用优化可采用分布式多线程并发指令执行体系结构、增量实时索引、智能分词等多项先进技术,提高采集和数据管理效率,管理员可以灵活设置更新周期。客户端采用可视化的配置工具,灵活配置应用属性页

14、的抓取信息。(十一) 主题跟踪采集针对热点话题进行信息跟踪采集,自动启动更高的优先级,调动全网搜索模式,进行信息量的快速聚合。跟踪内容包括:信息来源、转载量、转载地址、地域分布、发布人等元素。根据新闻来源的权威度、评论数、发言时间频率等参数,识别出设定时间段内的热门话题。数据处理及分析技术分析技术包括信息及数据处理技术及与舆情分析技术,其中舆情分析技术主要包括热点识别能力、自动分类、聚类分析、倾向性分析与统计、主题跟踪、截取证据、趋势分析、突发事件分析等。(一) 信息及数据处理技术主要是针对采集入库后的数据进行整理、处理。主要技术和功能包括:1. 漏斗式过滤技术:采用漏斗式多重过滤技术,逐层过

15、滤掉无关干扰信息,呈现给用户精准的舆情信息和热点资讯。 第一层:URL和广告类信息过滤。采用URL规则和广告类信息规则将无关信息过滤掉; 第二层:舆情过滤。按照设定的舆情词规则提取舆情信息。 第三层:舆情排除。以舆情排除规则将初步筛选的舆情信息中的干扰类信息过滤掉。 第四层:相似性聚合。采用相似性分析技术判断相关、相似的文章,用于传播过程及路径分析,减少舆情工作者的阅读量。2. 相似性分析技术:采用“文章相似性技术”根据文档内容的匹配程度确定是否重复,比利用网页标题和大小等规则判断具有更强的准确性、实用性以及运行效率。采用中文分词技术对文章关键字比较计算,得出文章相似度,相似度高于0.75以上

16、的文章系统默认处理为“已处理”,无需再进行任何操作,相似度位于 0.5-0.75 之间的相似转载文章需要用户在页面进行再次确认,确保文章无漏处理。3. 自动摘要功能:以各维度分类的关键词为基础,根据不同等级关键词的频次归纳全文的摘要,以100字左右的摘要归纳文章大意,减少客户阅读时间。4. 中文分词:采用基于自然语言处理技术的中文分词技术,对全文做文本处理,为舆情分类、专题聚类、自动摘要、语义分析、检索等提供基础。5. 要素分析对所有采集信息,在抽取标题、来源网站、来源频道、发布人、发布时间、链接、正文、图片等元素后,形成结构化数据存储于舆情库中,针对文章要素的分析如下:n 标题:可用于相似性

17、判断,以标题的相似度判断文章的相似度;n 来源网站及频道:包含以下分析项目: 地域分析:自动采集网站的ICP备案信息,按不同来源网站或地区进行统计并生成来源网站或地区表,直观展现舆情或专题的地域分布,同时以报表形式直观显示各网站的报道量排序。 舆情高发网站分析:通过对负面舆情的发生量统计,分析出舆情的高发网站和频道,可设置对这些网站和频道的优先级采集,及设置分站浏览。 网站及频道发布排行版:在指定时间段内统计舆情发布量的网站排行榜统计,同时还统计该网站的发布人排行榜。n 发布人:发布人信息提取用于重点人分析、炒手分析及溯源分析,追踪分析第一原创发布人。n 发布时间:发布时间是分析传播情况的重要

18、参数。 系统根据各分类每天采集信息生成图形化分析报表,可按每日、每周、每月、每季统计信息的更新情况,可按每日、每周、每月、每季统计信息的更新情况,以小时或天为最小粒度展示更新情况,并可按工作日、节假日、白天、晚上分时段浏览; 用于专题分析:时间参数和发布人用于溯源分析,时间参数也是专题发展趋势的重要指标,以传播量分析出重要的时间节点,便于掌握时机对敏感信息开展处置工作。n 正文:对正文中重要数据的提取和分析: 提取出文章中提及的地域; 提取出文章中提到的QQ号码,手机号码,邮箱等信息; 提取出文章中涉及的领导人; 提取出文章中的敏感信息; 对分页展示的正文进行合并处理。n 图表解析:文章中的图

19、片和表格,采集后的信息会保留图表的原始样式。n 点击数:系统会存储点击数的增量值。系统会分析单位时间内较大增量的帖子,重点展示给客户;同时还对敏感信息进行等级预警。n 回复数:系统会存储回复数的增量值。系统会分析单位时间内较大增量的帖子,重点展示给客户;同时还对敏感信息进行等级预警。n 重点人微博分析:实时跟踪重点人微博的最新发言,以及被转发和评论的情况,同时还对重点人微博的个人信息,如备注、关注数、博文数、粉丝数、等信息进行记录。6. 数据挖掘:关键词是本系统筛选舆情信息的主要规则,此外还采用数据挖掘措施分析出重要舆情: 分析出舆情高发网站及频道; 挖掘专题事件的传播途径、过程及数据; 挖掘

20、文本中的重要信息,如联系电话、QQ号码、邮件地址等信息; 分析出舆情高发人群; 推荐网民关注度高的舆情; 筛选新词、热门话题;7. 关联性分析:采用智能关联技术将与一条新闻相关的新闻、论坛评论、博客评论等信息关联到一起,帮助用户多方位地了解新闻事件的进展和其他报道情况,以及相关的网民评论等信息,全面地掌握各种相关信息。相关性和相似性分析:本果具有业界领先的相关性引擎模块,基于语境框架和领域框架的COS相似度计算方式,自动抽取每则信息的代表特征,并加以存储和处理,建立信息间的相关性模型网络,算出每条信息间的相关度系数。通过设定的相似度阈值,由机器自动对文章相似度分析,计算相同文章及数量、相似文章

21、及数量、相关文章及数据,同时在舆情搜索展示平台的各模块展现,用户进入系统即可看到,从而查阅转载传播情况。与“人”的关联性分析:自动聚合关注人在网上的活动轨迹,监控其个人网页、论坛账号、博客账号及微博账号上发布的信息,以及涉及此人的网络信息,按时间要素进行汇总,同时还形成其人际关系归纳,进行关联分析。(二) 舆情分析技术舆情分析技术是用于舆情信息分类和判断,按照关注的人物、地域、单位、事件、主题等要素进行舆情分类,并对敏感舆情的传播情况包括传播源头、发布人、传播媒体、传播内容、传播路径进行抽取和分析,提供各类统计数据和图表,掌握舆情事件在网络中传播的全貌。1. 分类技术:系统内置一套较为科学和完

22、整的舆情分类体系,通过自动分类技术,对用户关注的敏感信息和国计民生的各个重点领域进行实时监控,及时发现负面、有害信息。系统还提供灵活的多维度信息分类自定义设置,展示给客户丰富的舆情分类浏览: 按主题分类:按关注主题自定义分类,如政法、医疗卫生、教育等,进行常规的监测过滤分析; 按照特定的人物分类:设置关注人名,包括党政机关领导人、政治人物或敏感人,对人的网络活动进行分析; 按网站性质分类:按照网站性质如新闻、论坛等方式分类信息; 按特定的机构:设置各级国家党政机构,以及特定地区的机构; 按照地域分类:按照地域提取各地舆情; 按关注网站分类:设置关注的网站分析相关信息; 按有害信息:如法轮功、色

23、情、民运等反动信息; 按定制搜索分类:设置关注网站和关键词规则进行过滤分析。2. 敏感信息分析技术:负面敏感信息分析是本系统最重要的功能之一,通过预警功能在第一时间将负面或敏感信息告知用户。支持对负面信息分等级预警,参考关注度和负面内容来划分四个预警等级(初级、中级、高级、特级)。系统还提供对有害信息原始网页快照存留来提供证据存取。3. 热点发现与跟踪热点自动发现:自动识别热点新闻事件,发现网民的关注焦点和热点,提供1天、3天、7天等时间序列的符合用户精确度要求的分类热点排序。热点自动追踪:对热点信息的持续追踪,并通过趋势分析图和传播链分析图等技术帮助用户了解热点事件的报道趋势。网络热词自动挖

24、掘:从互联网寻找热度较高的短语,如人名、地名、机构名和其他常见短语,并收录入词库。4. 专题分析技术:专题分析技术用于分析舆情事件或热点事件在网络中的传播情况。根据用户设定的专题条件,自动聚合该专题的相关信息,并对传播媒体、每日传播情况、传播全过程进行分析,分析指标包括: 总传播量及每日、每时段传播量、设定时间内的传播量及其发展趋势; 来源报道分布:新闻报道篇数、主贴报道数、回帖报道数、博客报道数; 溯源分析; 阶段性传播媒体类型分布; 汇总发布网站、媒体及个人网络ID; 分析专题设计的热点人名、地名机构名; 媒体关注度和网友关注度分析。5. 炒手分析技术:通过对发布者网络发言倾向、发言的网友

25、关注情况和媒体关注情况的综合分析,对发布人进行打分,分析出疑似炒手和关注炒手。6. 导控技术:导控技术又称为信息探针,用于追踪舆论的传播影响力和检验处置结果。传播影响力的指标包括:各时段点击数增减情况、各时段回复数增减情况、转载量、搜索引擎快照搜录情况;处置结果检验包括:原文删除、快照删除。7. 趋势分析及预警:根据结构化信息分析热点话题、敏感主题在不同的时间段内,网友和媒体的关注程度,对舆情事件进行跨时间、跨空间综合分析,以图表方式展现主题事件信息量趋势,获知事件发生的全貌并预测事件发展的趋势。提供实时信息预警机制,可将短时间内发生的突发热点事件以及敏感新闻通过短信、邮件或者弹窗方式通知用户

26、,并帮助用户快速制作出关于此热点事件的统计简报。8. 舆情统计分析动态生成日报、周报、月报,同时为用户提供强大的自定义统计报表,可自己定义监测范围、监测时段、监测对象、图表显示方式(可定义横坐标、纵坐标以及图形)等,以生成不同报表满足多种个性化需求。Zebra系统客户端功能客户端是“鹰隼网络舆情监控系统”的分析结果展示平台,展示了重要的舆情信息、统计数据,也可按用户需求定制展示信息,同时也是个人舆情工作台,对信息和数据进行管理,并输出所需的舆情报告。此外还提供舆情应急导控处置功能,如舆情上报、账户分析、信息探测和网评员管理功能,为处置决策提供数据参考和流程管理。客户端支持PC机和移动终端两种登

27、陆方式,其中PC客户端支持多主流浏览器登陆访问,各导航功能可自定义,还可根据需求配置相关LOGO及图片,形成整体风格一致,但又个性化的舆情工作台,真正为舆情工作者解决舆情监测日常工作及管理问题。客户端主要包括以下功能模块:舆情搜索展示平台舆情搜索展示平台主要功能是展示各种舆情,从海量的互联网信息中搜索并过滤出“与客户相关”及“客户关注”的信息,及时通报重大、敏感舆情,起到舆情第一时间发现的目的。(一) 个性化首页用户可在首页定制个人舆情工作台,将日常舆情工作内容、最关注的信息和统计数据等定义在首页上展示,更新信息以5分钟频率自动刷新。首页采用分栏显示,可显示为两栏,也可切换成三栏,通过鼠标自由

28、拖拽显示栏调整其显示顺序,以便将重要信息显示在最直观的位置。此外提供多种皮肤切换选择,可方便地调整系统的显示风格。首页显示的内容包括公共信息栏及个性化定制信息栏,公共信息栏由管理员统一设置,以权限和角色分配给各用户。其中公共信息栏如下:(1) 快速通道:显示系统采集和分析数据,也是进入专题和搜索方案的快速入口。显示采集信息总数、舆情总数、最近一周舆情数、该用户定义专题信息总量及当日信息量、搜索方案的搜索记录。(2) 统计图表:显示该用户定义专题在最近30天的每日舆情走势图,可直观查阅舆情月传播趋势和舆情量最大日。可根据用户舆情工作需要定制个性化信息,如定制专题、定制网站、定制标签、定制排行榜等

29、。 (1) 定制专题:可以人名、地名、单位名、事件、话题等关键词定制首页显示的专题信息,同时在专题中还可定义信息的来源,如网站性质,或指定网站名称,使分析结果更贴近使用。(2) 定制网站:可以网站性质及网站名称定制网站,如定制来源于TOP100新闻网站的信息、来源于TOP10论坛的信息、来源于TOP50网站的头条信息等、来源于指定微博重点人的信息、来源于某个栏目的信息、来源于某个省份属地网站的信息。(3) 定制标签:在同一个显示栏中支持标签订阅,标签可定义为网站名称、网站性质、姓名等关注的关键词,在同一显示栏中展示同类信息的对比信息。(4) 排行榜:提供热点新闻、论坛和博客的排行榜,各榜单显示

30、最近7天的9条信息,用户可自定义排行版: 新闻评论排行榜:倒叙显示新浪、搜狐、网易、腾讯、人民网、东方网和凤凰网最近7天的新闻评论数排行,支持网站和栏目的按需选择; 新闻点击排行榜:倒叙显示新浪、搜狐、网易、腾讯、人民网、东方网和凤凰网最近7天的新闻点击数排行,支持网站和栏目的按需选择; 论坛点击排行榜:倒叙显示新浪论坛、腾讯论坛、凯迪社区、强国社区、天涯论坛最近7天的帖子点击数排行,支持网站和栏目的按需选择; 论坛回复排行榜:倒叙显示新浪论坛、腾讯论坛、凯迪社区、强国社区、天涯论坛最近7天的帖子回复数排行,支持网站和栏目的按需选择; 博客点击排行榜:倒叙显示新浪博客、腾讯博客、网易博客、强国

31、博客最近7天的博文点击数排行,支持网站和栏目的按需选择; 博客评论排行榜:倒叙显示新浪博客、腾讯博客、网易博客、强国博客最近7天的博文点击数排行,支持网站和栏目的按需选择。(二) 信息分类信息分类可自定义二级导航条目,主要用于以“关键词”为核心的信息分类展示。信息分类的二级导航一般由管理员在后台配置,用户可在前台页面设置下级分类。 支持多级自定义分类:系统支持多层级分类设置,逐级展示舆情,分类更加细化; 支持多维度分类:提供灵活的多维度分类展示,如可按人名、地名、单位等进行分类设置,展示多个维度的舆情信息; 提供“列表”和“统计”两种展示风格。其中“列表”风格是以文字倒叙以“标题+摘要”要素展

32、示最新舆情,无需查阅全文,阅读摘要和高亮的关键词能直观了解文章大意;“统计”风格是以日趋势图展示该分类信息,可直观查看该分类每日信息发布走势、每日信息发布走势。 分类设置:支持正则表达式的关键词配置方式,并可配置分类信息的来源(如:指定网站、或某种类型的网络媒体、或全部网站),同时可对历史数据进行回溯分析。 个人信息提取:可提取文章中包含的个人信息,如QQ号码、邮件地址、手机号码等。(三) 专题浏览专题浏览是以“事”为线索来跟踪客户关注的热点、敏感事件在网络中的全过程传播情况,包括专题聚类、专题数据分析、专题报告三个功能。 专题聚类:设置专题可自动聚类与专题相关的网络信息,回溯已发生的信息、聚

33、合后续产生的相关信息。可查阅与专题相关的全部信息,并导出、管理相关信息。 专题数据分析:提供分析数据供用户了解专题的发展情况:l 传播路径分析:以直观图展示信息首发及传播路径。l 舆情分布:以地图模式展现舆情的分布情况;l 总量统计:可查看指定时间内的舆情总量;l 信息来源分布图:用饼图表现信息来源分布图;l 发展趋势折线图:用折现图表现专题每日的舆情量走势,用于判断信息发布趋势;l 每日发布分布统计:按日统计每日专题信息发布来源的分布数量和比例,用于定位当日主要的传播媒体;l 发布媒体排行榜:统计指定时间内各媒体的发布总量,并以柱状图展示媒体的发布排行榜。 专题报告:提供专题的报告自动生成及

34、导出功能,报告的形式、内容及组成可参考舆情管理工作台的舆情报告模块。(四) QQ群监测采集已加入QQ群的实时聊天情况,用于实时监测重要、敏感QQ群的聊天记录和成员,采集内容包括QQ群信息、群成员信息及聊天内容,主要功能如下: QQ群成员查询:根据监测的QQ群号查询该群内成员信息。包括群成员的QQ号、使用的群名片、群内身份等。 QQ群聊天内容查询:根据输入关键字、QQ昵称、QQ号码查询聊天记录。同时支持关联搜索,如对网易论坛上某一个管理员或普通ID感兴趣,可以用他的ID在系统中搜索,是否等同于某个QQ号码,用于追踪网易论坛上这个ID的其他身份。 QQ号实名分析:通过对QQ号在不同群中的群名片进行

35、分析,实现对QQ号所有者的实名分析,及查询所加入的QQ群。(五) 微博监控系统监测三类常见微博:一,四大门户微博,新浪微博、腾讯微博、网易微博、搜狐微博;二,新闻网站微博,天涯微博、凤凰网微博、人民网微博等;三,境外微博,如twitter,采用不同技术和方法采集这三类微博信息。其中四大门户微博,因信息更新量快、数据量大、防屏蔽采集机制多,采集全面的信息难度较大,需结合API接口和模拟登陆方式下采集信息,同时采用关键词和采集指定重点人更新信息相结合的方式采集获得微博信息、博主信息;针对新闻网站微博,一般采用关键词搜索最新信息,信息相对容易获得;针对境外微博,需采用境外代理方式方可采集舆情信息。系

36、统提取微博的各元素,包括:作者、发布时间、发布介质、文章链接、来源网站、内容、图片、内容链接、视频、博文类型(原创/转发/提及)、转发数、评论数。同时系统也采集博主的信息,如备注、粉丝数、关注数、微博数等。微博信息分类提供关键词和重点人两种分类方法,以关键词分类,可查看与该关键词相关的全部信息,配置关键词时,支持关键词的组合及排除;以重点人分类,可查看该重点人所发布的全部微博。(六) 分站舆情分站舆情是按照舆情来源的网站展示舆情的分类方法,是一种信息分类维度方案。在分站舆情中,提供两种分类方法: 按网站性质分类:按照系统采集的不同类型网站,可按照新闻、论坛、博客、微博、视频、境外、电子版、搜索

37、、手机、问答类型分类,查阅各类型的信息。 按指定网站:用户可定制关注网站及其频道,逐一展示定制网站的舆情信息。(七) 地域舆情地域舆情以文章中主要提及地名作为舆情的分类方法。按照省内、省外分类,省内舆情还可细分到地市、区县级,省外信息按省份展开。可直观查阅各省市的最新舆情。(八) 境外信息系统采集上千个境外中文网站的最新信息,并显示在境外信息栏目中,也可定制显示在首页。用户可通过配置查阅全部信息,也可以通过舆情词库过滤境外舆情。分类配置多样化。可配置舆情或非舆情,配置单个网站或一批网站,充分满足个性化境外信息查看需求。(九) 境外监测如客户获得有关部门允许访问境外网站的授权,可将境外监测技术开

38、放给用户使用。即境外网站访问代理服务,通过该项功能,用户无需配置可直接跳转访问境外网站导航中的列出的网站。(十) 信息检索提供分布式检索和负载均衡集群服务器,实现分布式检索和负载均衡功能,满足大数据量和高并发的检索要求。实时动态索引:在数据增删改时快速同步更新索引,无需重建索引,更新数据立即可检索。支持中文的字词混合索引:中文存在字、词索引问题,按“字索引”保证百分之百的查全率;按“词检索”保证一定的查准率,且可维护分词词典,通过对词典的训练,逐步提高检索查准精度。支持检索结果的统计和浏览:显示检索结果的分布情况,支持对检索结果的Excel报告导出,及添加到分类、专题或简报等操作。支持对检索结

39、果的各种排序:基于文章内容与检索表达式的相关度计算的相关性排序;基于一个或多个特征属性的字段排序。提供入库舆情和实时互联网信息的全文检索服务,实现结构化和非结构化数据的统一检索,基于元数据(meta-data)和基于全文(full-text)的联合查询。系统支持三种检索服务: 舆情检索:该功能从舆情库中检索信息,多种条件设置优化检索结果:l 快速搜索:通过输入关键词从舆情库中检索包含关键词的信息,支持关键词组合输入,多字段“与或非”组合检索、二次检索(渐进检索) 、大小写敏感检索、中文简繁体扩展检索、支持超长检索表达式(例如长度为2K)等,搜索结果更贴近检索要求。l 配置搜索:该功能和快速搜索

40、组合使用,可配置搜索时间、范围、排除、过滤等条件,过滤快速搜索结果。l 高级检索:组合关键词的检索结果更贴近使用要求,因组合规则较为复杂不易书写,系统提供高级检索功能,简化关键词输入方案。提供多种过滤条件供输入或选择,如标题包含、标题不包含、正文包含、正文不包含、检索范围、时间等参数,让检索结果更精准。l 发布人检索:以发布人名称检索信息,如发帖人,检索出该发帖人所发布的信息。 搜索方案:需频繁地用某些固定条件搜索舆情时,可将搜索条件设置为搜索方案,不需每次搜索时配置搜索条件。在搜索时,点击方案名称,系统会启动检索并展示结果。有别于信息分类,在点击搜索后才启动检索功能,而信息分类是在舆情入库时

41、根据规则随时分析至各分类中。 全网检索:该功能是针对互联网的实时搜索,检索时从互联网中搜索结果,而非从舆情库中检索。l 搜索来源:搜索结果来源于谷歌、百度、必应、搜狗、搜搜、有道、雅虎、中搜等搜索引擎,在搜索时支持按类型搜索,如网页、新闻、论坛、博客。l 支持搜索结果导入采集库:支持将搜索结果导入至采集数据库中,这些信息将同自动采集入库的信息一样,经过系统对数据的处理和分析机制,进行舆情的过滤、分析、分类、统计等处理。舆情管理工作台舆情管理工作台是为日常舆情工作者提供的操作平台,对舆情进行操作管理,包括自定义分类设置、跟踪评论、线索提取、翻译、舆情报告、舆情预警、统计图表、收藏夹等功能组成。(

42、一) 自定义舆情为便于舆情工作者更好地利用信息,提供舆情分类自定义功能,可将个人日常的舆情工作内容定制成工作台: 个性化设置:用户可定义不同的首页栏目和导航条,配置显示内容、样式、摆放位置、信息条数、栏目高度、分栏显示等。提供首页复制功能,将某用户定制的首页栏目复制给其他用户使用。 自定义分类:系统管理员统一设置的舆情分类外,各用户可自定义需显示的分类,可显示在首页、信息分类、专题浏览、微博监控、分站舆情、境外信息栏目中,操作简便,设置灵活。 自定义关注网站:每个用户可将自己负责的责任网站,设置为自定义的关注网站,用于有针对性地展示信息。 自定义专题:用户可自主设置关注的专题信息,并对专题的网

43、络发展进行追踪。(二) 跟踪评论 对于热点、敏感信息,用户可通过“跟踪评论”功能来对评论、回帖内容和数量进行跟踪。启动此功能的文章,系统会自动采集相关评论(回帖)内容、数量、作者ID、发布时间等,用于分析网友关注情况。(三) 线索提取提取舆情信息中的手机号、QQ号、邮箱、地址等相关情报信息,并对相关的情报信息进行分析、统计,为事件的处理及时有效的提供情报线索。(四) 母语翻译支持对多语言采集和分析,能采集到中文简体、中文繁体、英文、维文、拉丁维文、蒙文、藏文、日本语、韩语等多种语言。提供多语言显示界面,以网络中原始语言显示;并可将外文或少数民族语言通过翻译工具译成中文简体并显示。(五) 舆情报

44、告系统提供自动舆情报告功能,可将重要舆情通过舆情报告输出。根据用户对报告的需求,系统提供三种类型的报告,并为每种报告设计了模板,且用户可配置模板,以调整输出的报告样式。 日报:即是每日舆情简报,是定期报告,可自定义报告周期。系统提供三种报告模板:一是以展示文章内容为主的word样式报告;二是用户可添加人工分析意见的以展示重点文章为主的word样式报告;三是以列表展示文章要素的excel样式报告。 周报/月报/季度报/年报:该类型报告包含统计数据和图表,通过趋势图、分布图、比例图等列表,丰富地展示该阶段舆情的信息和传播情况。 专报:该类型报告包含日报和汇总报告,其中日报是按日提供该专题当日的网络

45、传播情况,重点展示当日舆情热门文章、传播媒体和传播情况;汇总报告是以发展趋势展示该专题的演变过程,并展示重要的传播媒体、观点、对比数据。各种报告可在网页上查看,也可下载到本地;报告可自动生成,也可人与系统组合制作。(六) 统计图表系统以统计图和统计数据相结合形式展示各种分析数据,可查阅各分类模块的统计数据。统计图表主要有以下三种形式: 分布图:以饼图表现不同类型数据的分布情况,如网站来源分布饼图。 趋势图:以日均信息量表现一个阶段的整体发展趋势,主要以柱状图和折线图展示,如专题发展趋势图。 排行:通过数据分析挖掘出重点舆情文章、热点舆情文章、重点传播网站、重点发布人等,如舆情发布TOP10网站

46、榜单。(七) 舆情预警对于用户关心的敏感、负面舆情,在采集入库后,及时进行预警,有桌面弹窗预警、短信/APP预警、邮件预警三种形式。用户可预设统一的预警参数,也可根据内容和传播情况设置不同的预警条件: 指定预警:可为不同的舆情分类和专题中的敏感信息设置不同的预警形式和预警接收人。同时还可设置每日接受预警短信的数量和时间段。 分级预警:针对重大信息,提供分级预警,分为特价、高级、中级和初级四个等级,且各等级的预警条件和接警人可自定义。(八) 舆情推送(舆情上报)舆情工作者可将判断后的重要信息、敏感信息、有害不良或异常信息,第一时间通过系统推送给上级领导,推送方式可选择舆情上报模块推送,也可推送至

47、移动客户端,另外还有邮件和短信两种形式。(九) 收藏夹收藏夹用于各用户对网络信息的收藏,便于日后快速查阅。用户可设置不同名称的收藏夹,用于分门别类地管理收藏信息。应急导控处置平台应急导控处置平台是对重大舆情传播情况的定位、分析和记录,分析出具有重要影响力的网络媒体账号、跟踪重点人的言论、对重要信息进行网络取证、查询网站的ICP/IP地址、舆情传播增量及快照等信息,用于辅助处置的决策。此外还提供舆情上报工作流,用于流转重大舆情的处置意见;提供网评员管理功能,用于记录和考核处置环节网评员的工作开展情况,并对舆情处置进行总结。(一) 账户分析系统内置二十余项组合规则,用于综合分析发言人特征,包括媒体和个人,是否存在炒作行为。根据设置的炒手规则,为每个发言人打分,通过分值高低筛选发言人炒作可能性。并可查阅各炒手发布的符合炒手规则的舆情文章。(二) 重点人监测重点人监测是以“人”为线索,监测重点关注人在互联网上的行为,实时追踪重点人在网上发布的有害言论,挖掘其在现实社会中的个人信息、人际关系及行

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 教育教学

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com