MicrosoftSiteServer3.0白皮书6938.docx

上传人:jix****n11 文档编号:68694555 上传时间:2022-12-29 格式:DOCX 页数:64 大小:58.70KB
返回 下载 相关 举报
MicrosoftSiteServer3.0白皮书6938.docx_第1页
第1页 / 共64页
MicrosoftSiteServer3.0白皮书6938.docx_第2页
第2页 / 共64页
点击查看更多>>
资源描述

《MicrosoftSiteServer3.0白皮书6938.docx》由会员分享,可在线阅读,更多相关《MicrosoftSiteServer3.0白皮书6938.docx(64页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、SiteServerMicrosoft SiteServer 3.0白皮书摘要现在,企业越来越多地使用intranet来作为雇员发布、检索和递送用于决策和高效协同工作所需信息的工具。但是,这些公司的雇员们正面临着一个“信息充斥”的问题,他们可能无法找到或共享他们需要的信息。通过部署Microsoft SiteServer 3.0,企业可以利用intranet来有效地从遍布公司组织每个角落的数据源中例如Web站点、数据库、文件服务器、e-mail等搜集到所需信息并把它们递送到相应地点以促进知识共享和提高企业的劳动生产率。 1998 Microsoft Corporation。All rights

2、 reserved.The information contained in this document represents the current view of Microsoft Corporation on the issues discussed as of the date of publication。Because Microsoft must respond to changing market conditions,it should not be interpreted to be a commitment on the part of Microsoft,and Mi

3、crosoft cannot guarantee the accuracy of any information presented after the date of publication.This White Paper is for informational purposes only。MICROSOFT MAKES NO WARRANTIES,EXPRESS OR IMPLIED,IN THIS DOCUMENT.Microsoft,ActiveX,Active Channel,BackOffice,the BackOffice logo,FrontPage,Visual Inte

4、rDev,Windows,and WindowsNT are either registered trademarks or trademarks of Microsoft Corporation in the United States and/or other countries.Other product or company names mentioned herein may be the trademarks of their respective owners.Microsoft Corporation One Microsoft Way Redmond,WA 98052-639

5、9 USA0X98目录简介1MICROSOFT SITESERVER 3.0介绍2元数据的作用3建立基本的发布原则3在Intranet上查找信息5个人化递送8使用“推”技术来递送信息8使用知识管理器(Knowledge Manager)10进行全面的Web站点分析10使用MICROSOFT 平台技术14与WindowsNT Server 集成14与Internet Information Server集成14与其它Microsoft技术集成14MICROSOFT SITESERVER 3.0 解决方案16欲了解更多信息17简介企业越来越多地使用intranet来作为雇员发布、检索和递送用于决策

6、和高效协同工作所需信息的工具。但是向intranet发表信息并不能保证用户能够查找到他们需要的信息。为了将intranet带来的好处变为显示,站点管理人员需要一个允许他们有效管理整个业务范围内的信息流的解决方案。这个解决方案涉及到有关网站内容和网站用户的信息,包括:1. 将所有类型的内容放到站点上的结构化方法。2. 帮助组织和管理有关内容和用户信息的措施。3. 向用户提供定点传送的有效递送机制。4. 衡量和优化站点结构和使用情况的机制。传统地,企业可能试图通过导入不同的、非集成的服务器应用程序或通过从底层向上搭建他们自己的服务器应用程序来将这些功能加入他们的intranet。但是这两种方法都是

7、昂贵而低效的:第一,它需要管理人员和开发者束缚于独立开发的应用程序和系统中;第二,它会导致不相容的应用程序和不可预计的维护费用。MICROSOFT SITESERVER 3.0介绍Microsoft SiteServer 3.0是Microsoft BackOffice 服务器大家庭的一员。它是传统的intranet开发和维护方法的一个强有力的替代。Microsoft SiteServer 3.0是一个功能强大的intranet 服务器,它针对带Internet Information Server的Microsoft WindowsNT Server操作系统作了优化,其主要功能是方便快捷地发

8、布和查找信息。通过部署Microsoft SiteServer 3.0,企业可以利用intranet来有效地从遍布公司组织每个角落的数据源例如Web站点、数据库、文件服务器、e-mail等搜集到所需信息并把它递送到相关目的地以促进知识共享和提高企业的劳动生产率。SiteServer 3.0 包括一套独特的特性,用于在组织内部协同工作从而优化信息共享: 内容部署(Content Management)特性通过一个支持拖放操作的Web界面为多个内容编写人员对网站内容进行提交、作标记和编辑提供一个结构化的发布过程。之后站点编辑人员可以对内容进行批准、编辑和强化内容的一致性准则。 内容部署(Conte

9、nt Deployment)特性 允许管理人员安全和健壮地在多个分布服务器上部署内容。 检索(Search)特性 允许用户在多个数据库之间和各种数据格式(包括HTTP、文件系统、Exchange文件和数据库)中进行全文检索和特征检索。 Personalization & Membership特性为基于用户档案资料和行为提供定点传送和个人化信息提供了一个使用方便的方法。它还可以以高度定制的用户视图和个人化的Web页面向用户提供检索结果。 Push 技术允许企业为Microsoft Internet Explorer 4.0创建递送频道。基于Microsoft Active Channel Ser

10、ver 的频道代理程序允许intranet开发者和系统管理人员从数据库、文件系统、Search Server和Index Server创建频道。Active Channel Multicaster通过使用多点传送技术来递送频道,从而节省了宝贵的网络带宽资源。 知识管理器(Knowledge Manager) 是一个集中的基于Web的应用程序,它集成了SiteServer的知识管理特性,从而允许用户方便地浏览、检索、共享和订阅相关信息。 Analysis特性 将记录在服务器日志文件里的原始点击数据转换为关于请求、访问和与intranet进行交互的用户的宝贵信息。这使得企业可以衡量一个intran

11、et带来的效果。Analysis组件 同时还可以捕获内容和站点结构信息以发现问题,比如哪些页面载入时间过长,或哪些内容已经过时了。元数据的作用SiteServer为企业intranet提供点对点信息管理的能力不仅取决于一组功能强大的特性和与Microsoft平台技术的高度集成、而且取决于对”元数据”(关于信息的信息)的编目和共享能力。元数据由与intranet站点进行交互作用的不同的、互相影响的要素创建和更新。SiteServer可以捕获元数据并利用它来为intranet提供更强大和更完整的企业解决方案: 编写 “标记” 内容来描述它的特征并定义何时、何地、以及如何将内容部署和递送给用户。 管

12、理人员可以建立一个系统来搜集和存储用户资料档案以及用户对网站的使用情况信息。 用户可以预先定义将哪些内容传送给他们。使用SiteServer,内容编写人员、开发人员、管理人员和用户可以分享和利用元数据。这样,它就为信息的搜集、分析和集成提供了一种一致的方法。它也为协调网站内容和站点使用数据以使网站内容和用户之间达到最好的匹配提供了一种方法。此外,它还是使用户容易地访问到所需内容的最好方法。图1:SiteServer 3.0上的元数据输入和递送。SiteServer允许对数据的完整共享,每个SiteServer特性都和这个元数据模型有紧密的联系。内容属性被存储在数据库编目中,而用户属性则被存储在

13、目录中。本文的剩余部分将详细介绍SiteServer的主要特性以及元数据共享是如何被支持的。建立基本的发布原则为了保证创建内容并将它们放到intranet上的方法的一致性和可管理性,SiteServer 提供了两个主要的发布功能: 内容管理(Content Management)和内容部署(Content Deployment)。内容管理 把将放到 intranet站点上的内容从一个高度分布式的环境中发布,这些内容可能有几十种数据格式,并可能出自数以百计的内容编写人员。在这样的环境下,intranet站点管理人员需要一个以统一的方式展现内容并满足专业发布标准的方法。他们也需要准备内容以使用户可

14、以方便地访问到它们所需要的信息。通过帮助站点管理人员建立如下结构化发布的基本原则,SiteServer可以满足内容展示和发布的标准: 将网站内容与展示内容分开。 一个正式的编辑批准过程,其中包括使用提交模板。 支持分布式和远程的提交、编辑和删除操作。 通过允许内容提供者使用他们选择的字处理器、电子表格或其它桌面应用程序创建内容,为各种特殊的内容提供者提供支持。SiteServer满足使用户通过内容类型和内容标记容易地访问到内容的需要。内容类型定义为在 intranet上有确定部署位置的不同种类和格式的文档,例如销售建议、消费者满意度调查、法律声明和产品证明等。站点编辑器可以基于主题内容、目的、

15、格式、听众以及这些标准的任何组合定义内容类型。SiteServer支持无限多种内容类型并将每种内容类型存储在它自己的目录下。图2:SiteServer 3.0上的内容管理过程。内容标记用于识别内容类型的各个方面,例如作者、标题和提交日期等。例如一个正在将文档发表到 intranet上的内容编写人员将会得到一个提示,让他在他的浏览器上输入文档的各种标记。依照提示,作者就可以作出各种标记以使用户能在稍后访问时通过某些检索条件如作者、标题、主题等访问到所需要的信息。为了保证标记被正确插入,内容编写人员无须熟悉HTML语言,因为SiteServer自动完成了一切工作。自然地,站点管理人员也可以根据内容

16、属性、批准设置、有效期限和访问代码对工作描述作标记。之后内容标记被Microsoft Index Server使用。Microsoft Index Server 是一个WindowsNT Server组件,用于目录索引和在视图页面上显示内容。视图页面是带特定规则脚本的HTML页面,它根据内容类型和内容标记来决定显示哪些内容。内容部署通过内容部署组件,SiteServer允许开发者和网站管理人员安全、可靠和有效地在intranet上预演和部署网站内容。内容部署简化了文件、服务器应用程序包括Microsoft ActiveX Server组件和Java插件、目录、访问控制列表和其它从一个intra

17、net服务器发送到另一个或多个服务器的数据的发布,并使发布的过程自动化。内容部署通过项目进行管理,并且可以根据需要返回以前状态。网站管理人员可以运行基于HTML的管理报表来跟踪部署过程。这样的报表可以简化网站的重建并帮助网站建设者和管理人员避免在不必要的情况下进行完全的重新部署或返回到以前的状态。SiteServer使用 TCP/IP网络协议和 Windows NT验证机制创建服务器的安全连接和数据分布的不同方法,其中包括为在所有类型的网络上可靠地进行内容部署而采用的数据验证和重启动功能。如果要进一步提高安全性,SiteServer还支持用 MD5杂乱数字签名的数据传输方法。内容部署服务器根据

18、在方案中的定义和路径选择表部署和提取内容。虽然你可以使用单个服务器在各个目录中部署网站内容,但在大多数情况下内容部署都比较复杂,往往包括多个服务器,其中每个服务器完成一个不同的功能。不管配置如何,内容部署服务器都可以在预演和部署过程中扮演两个角色:预演、部署内容(预演服务器)和取回内容(端点服务器)。所有的预演服务器都在WindowsNT环境下运行,并且一般都有一个到其它内容部署服务器的网络或Internet连接。端点服务器可以是基于WindowsNT,也可以是基于UNIX的服务器。在Intranet上查找信息在一个复杂的 intranet站点上,网站内容中对用户来说很宝贵的信息往往仅有一部分

19、直接放在 intranet的Web服务器上。用户访问的大量内容来自别的地方如公司文件、数据库、Exchange服务器、新闻专线和Internet。为了使用户得到最好、最完全的信息,应该努力做到用户访问所有这一切内容都好象这些内容就放在intranet服务器上一样。SiteServer为用户提供了一个健全、安全和可设置的方法来从大量信息来源中访问到信息。它提供了支持全文检索、特征检索和单个查询检索的符合工业标准的查找算法,可以在各种数据库和数据格式(包括 HTTP、NTFS、Exchange公共文件夹,Microsoft SQL Server以及其它 ODBC数据库等)中进行检索。这些算法的检索

20、工作由如下四个操作组成:搜集文档、从文档中提取信息、对信息 进行索引和传播这些索引以帮助用户找到他们需要的内容。搜集内容SiteServer Search组件通过三种遍历来搜集内容:Web遍历、文件遍历和Microsoft Exchange遍历。 在Web文档遍历时,Search使用 HTTP来收集一个指定开始页,然后连接这个页面上的链接并随着这个链接遍历到下一个文档,依次类推。Search可以遍历任何Web服务器上的文档。 在遍历文件系统时,比如在WindowsNT Server 或Windows 95操作系统上的共享文件夹里遍历时,Search从某个文件目录开始遍历。通过文件协议,Sear

21、ch在这个目录和它的子目录中收集文档,同时保留文档的安全访问控制列表(Access Control Lists)。 当Search在 Microsoft Exchange服务器上遍历时,它从一个公共Microsoft Exchange文件夹开始。通过Exch协议,Search搜集在文件夹中的所有信息和它们的附件。利用现存或新建的链接,Search在一个事务日志文件里跟踪它收集到的文档。在一个Web遍历中,Search使用它在遍历每个文档时找到的链接;在文件遍历中,它为所有开始目录和它的子目录中的文档创建链接;而在 Microsoft Exchange遍历中,它为所有在公共文件夹中的信息创建链接

22、。在每种遍历中,Search通过将链接加入日志文件来标记一个链接。在Search收集到一个文档时,它把这个文档的链接标记为完成,然后跟随日志文件里的下一个链接链接到另一个文档,收集它,依次类推。Search同时还保存一个遍历历史,也就是所有遍历到的链接的记录。在向日志文件加入一个新的链接前,Search检查遍历历史以保证同样一个链接不会遍历两次。万一遇到电源故障或它事故,Search使用日志文件和遍历历史来从上次停止的地方恢复遍历。在Search第一次执行遍历时,它执行一个全遍历:从一个空目录开始,跟随事务日志文件里的每个链接,并收集每个文档。为了在后来的遍历中节省时间和带宽,Search执行

23、增量遍历,从上次的遍历结果开始,仅仅收集那些从上次遍历以来已经发生变化的文档。提取信息当SiteServer Search搜集一个文档时,它将文档打开并从中提取它将要用来创建索引和目录的信息。这些信息包含全文本内容、链接和文档特有属性如作者的名字或文件大小等。为了适应文档格式的多样性,Search使用过滤器。过滤器是每种符合Microsoft标准 Ifilter接口的文件格式的插件模块。Search包含针对普通格式比如 HTML、Microsoft Office文档和纯文本文件的过滤器。PDF和其他文件格式的过滤器由第三方提供。由于文档可能包含各种语言,所以Search自动检测每个文档中遇到的

24、语言。象其他查找技术一样,Search读入HTML的语言标记。但是研究表明,一些网站管理人员不填充这个HTML标记。因此,Search使用一个有专利权的语言检测程序来决定特定信息的语言类型,这样,即使在HTML语言标记未填的情况下也可以使用这个语言检测程序来判定所使用的语言。之后Search将语言作为可以用于检索的属性存储起来。对如intranet内容里有各种语言的跨国公司等组织而言,这一点非常重要。管理人员可以简单地建立SiteServer Search来遍历整个intranet,而终端用户则可以查找用他们感兴趣的语言编写的网站内容。创建索引在从文档里提取了想要的内容后,SiteServer

25、 Search对内容里的词和它们的位置进行索引。例如,索引机制可能会把单词“offer”索引为Default.htm文档的第423个单词、Products.doc文档中的第638 和第982个单词。这个索引允许对包含特定单词的文档进行快速而有效的查询,例如一个高级检索操作如句法检索(检索“white elephant”意思是查找文档里有单词“white”且其后有单词“elephant”的文档),或模糊检索(查找所有单词“big”和单词“house”之间的间隔小于50的文档)。为了尽量减少网络阻塞,Search支持分布式索引,也就是将索引与原始数据存放在同一个地方。此外,为了防止索引过分膨胀而不

26、能帮助用户找到它们想要的文档,Search忽略“噪声单词”如“a”、“and”、和“the”等。Search为九种语言提供了噪声单词列表。编辑和传播一旦SiteServer Search完成对每个文档的索引,它就将信息编辑到目录中。然后它将内容传播出去,也就是说,将它们拷贝到能被站点用户检索到的主机上。通过“混合”目录的方法,可以对这些检索进行限制以满足安全需要。这样,站点管理人员就可以将 公共文档和安全文档放在同一个目录下,同时保证对公共文档的广泛访问和对安全文档的有限访问。Search支持的两种验证方法使混合目录成为可能:NTLM (针对WindowsNT文件系统和Microsoft Ex

27、change消息)和WWW-Basic (由所有 HTTP服务器使用)。例如,当在WindowsNT文件系统中遍历文档时,Search使用一个管理人员赋予特权的帐户在文档目录中包含WindowsNT访问控制列表。当站点用户检索内容时,他们被限制为只能访问他们有访问权限的文档内容。任何SiteServer从 HTTP和 FAT卷中搜集的文档将对所有站点用户开放。个人化递送SiteServer的个人化和成员资格管理 (P&M) 功能通过使内容与用户相关而提高了intranet站点的效率。个人化功能帮助找到与特定用户匹配的信息,而成员资格管理功能则帮助把这些内容直接递送给相关用户。为了获得 intr

28、anet的个人化页面,P&M提供Rule Builder工具和一套设计期间控件来利用Microsoft FrontPage98 Web站点创建工具或Microsoft VisualInterDev Web开发系统快速开发个人化页面。Rule Builder帮助基于用户属性来创建规则。规则可以在 intranet页面的各个部分定义,也可以在电子邮件消息中定义,这些规则规定显示哪些内容,执行哪些操作和在什么条件下执行等。规则可以通过使用简单名标记、也可以基于用户信息和/或系统变量如日期和时间指定一套复杂条件来生成个人化的内容。规则可以加入规则集,并按优先级进行排列。为安全起见, P&M与Windo

29、wsNT Server系统协同工作以为用户提供验证和访问控制来保护内容和成员目录( Membership Directory)。验证证书可以保存在WindowsNT Server的目录数据库(使用WindowsNT 验证模式)或成员目录下 (使用成员验证模式)。使用“推”技术来递送信息通过“推”模型,SiteServer用三种不同的方法向用户提供内容:直接邮件、频道和个人化Web页面。直接邮件被发送到用户的客户端,而频道和个人化Web页面则被发送到用户的Web浏览器。频道 频道为递送Web页面、任何类型的文档或文件和应用程序提供一种有组织的、结构化的方法。频道提供桌面上的立即可见性、广泛的可访

30、问性和一种将结构化和有组织的信息提供给用户的方法。为了帮助用户访问到他们想要的信息,一个频道可以集中于特定主题。例如,递送各部门更新资料的频道可以包含这个部门上一次会议的会议记录、最新新闻稿件、最新提供的产品的电子表格Web页以及一个有到有关站点URL的页面。在使用频道向用户发送个人化内容时,“推”技术依赖于两种技术:Active Channel Server和Active Channel Multicaster。Active Channel ServerActive Channel Server提供广泛的频道管理和频道递送选项并可以通过在向多个用户递送信息时只发送数据的一份拷贝而帮助管理带宽

31、。Active Channel Server使用频道定义格式(Channel Definition Format,CDF)技术来使向用户桌面发送信息的过程自动进行。关于频道和它的条目的所有信息都存放在一个CDF文件中,Active Channel Server把这个CDF文件作为一个Web页面上的订阅链接提供给用户。一旦一个用户订阅了一个频道,用户的浏览器就读取这个CDF文件,阅读其内容,然后设置频道链接并把内容条目显示在用户的计算机上。如果用户的浏览器购买了这些条目,那么用户就可以离线查看这些条目。否则,用户必需在线才能访问到频道的条目。有关频道的任何变化和更新都会自动地反映给用户。CDF文

32、件使用HTML语法并包含存储着关于频道和频道内容(包括URL和按时发布的信息)条目信息的标记。最后,CDF文件确定用户看哪个频道,内容如何显示以及频道何时递送给用户。对大多数递送方法而言,CDF文件是将频道递送到用户的关键。客户浏览器获得 CDF文件,解释文件标记,然后显示到频道和内容条目的链接。用户不需要为了获得内容条目而链接到 intranet。他们只须简单地点击他们想要的链接,然后他们的浏览器将取回内容条目。注意:用户要订阅并接收到频道,他必须有能够支持 CDF技术的浏览器。因为Active Channel Server将所有频道和内容条目的URL存放在Anchor标记里,所以任何允许H

33、TML的客户浏览器都能读取由Active Channel Server生成的CDF文件。Microsoft Internet Explorer version 4.0 和更新的版本为CDF技术提供完全支持。SiteServer Push技术为将频道和内容条目传送给用户提供如下方法:Managed Push,Personalized Push,Multicast Delivery,和Delivery。在Managed Push 和Personalized Push情况下,用户的浏览器周期性地向Web服务器发出更新请求,并把服务器上的更新信息取回到用户的计算机上。信息在没有用户干预的情况下传送到用

34、户的桌面。当使用Multicast Delivery技术时, Active Channel Server首先生成一个更新后的CDF文件,然后Active Channel Multicaster遍历整个CDF文件并把文件中包含的数据传送给客户计算机。为了收到多点传送文件,客户计算机上必需安装有Internet Explorer Multicast Delivery Agent。(关于Active Channel Multicaster和多点传送的更多信息,请参看本文后面部分)。在使用Mail Delivery技术时,用户收到一个包含到频道和内容条目的链接的电子邮件。为了访问到频道,用户只须简单地

35、点击这些链接就可以了。Active Channel Multicaster通过允许多点传送, Active Channel Multicaster从两个方面节省了网络带宽资源。首先,它把频道和内容条目传送给提出需求的用户而不是所有用户;其次,它自己将内容传送出去,而不是通过一个指向一个Web服务器内容条目的CDF文件。客户浏览器可以缓存内容条目以便离线浏览,从而减少了网络访问流量。Active Channel Multicaster可以发布任何Web内容,包括CDF文件。在发布CDF文件时,它搜集文件中引用的内容并把它们多点传送到用户。这些内容条目可能源于一个基于CDF的频道或一个Web站点。

36、一旦站点管理人员已经决定要多点传送哪些频道,管理人员就将这些频道 纳入一个多点传送项目。如果内容不是由CDF文件定义,那么可以将包含内容的intranet站点纳入多点传送项目。一旦管理人员已经在他们的Active Channel Multicaster主机上配置好他们的多点传送项目,项目就从多点传送宣告开始执行。在这些宣告中,主机指导客户计算机到哪里接受多点传送内容并识别内容的来源。使用知识管理器(Knowledge Manager)知识管理器是一个基于Web的范例应用程序,它展示了SiteServer Search、P&M和Push特性是如何结合起来,从而解决在intranet上的信息递送管

37、理问题的。使用知识管理器,组织内部就有了一个地方,所有的用户都可以进入此地并进行检索、浏览和分享信息。Knowledge Manager由五个方面组成: 检索中心(Search Center):用户可以从以前创建的检索清单或通过管理人员用站点词汇表(Site Vocabulary)定义的一种结构浏览内容来检索所需要的信息。 我的摘要(My Brief): 用户可以创建他们自己的一套知识,称为知识摘要。默认情况下,所有的用户都有一个个人知识摘要,称为我的摘要。 共享摘要(Shared Briefs):用户可以创建或访问公共摘要来获得共享知识。 摘要递送(Brief Delivery):用户可以确

38、定他们是想通过电子邮件还是通过频道来收取摘要。 频道(Channel Area): 用户可以通过频道收取其它信息。频道是用户找到可获得的其它频道的一个地方。知识管理器包含一份易于扩充的站点词汇表范例并建立起了安全准则:1. 用户可以阅读他们自己的私人摘要。2. 检索结果根据用户的权限提供给用户。3. WindowsNT访问控制列表被用来管理、设置和监控知识管理器。知识管理器维护着三个安全分隔区域:站点用户区域、信息区域和管理区域。为了维护站点用户的安全性,知识管理器对登录用户使用WindowsNT质疑/回答验证,而对不登录的用户使用Allow Anonymous。这意味着,所有站点用户,无论是

39、否登录,都可以对知识管理器页面进行直接访问。为了保证安全性,知识管理器根据站点用户的全局独特标识符存储摘要以及摘要的各个部分。为了保证信息安全,知识管理器允许管理人员建立检索目录,这样每个站点用户只能访问那些允许他查看的信息。例如,职员数据可能对人力资源部门是可以访问的,但并不是所有雇员都能访问。为了保证管理上的安全性,知识管理器定义了一个SiteServer知识管理人员组和一个递送管理人员组。SiteServer知识管理人员组的成员可以修改Search、Push和P&M任何方面的配置,包括创建Search目录和修改站点词汇表。递送管理人员组的成员则可以完成所有知识管理人员组的成员可以完成的功

40、能,外加其它管理功能。进行全面的Web站点分析企业需要一些方法来根据站点如何吸引雇员对它的使用和再使用来衡量 intranet是否是成功的。另一个使intranet投资获得最大回报的关键要素是保证站点的一致性、高品质和与政策一致。为了满足这些需要, SiteServer Analysis提供三种类型的Web分析使用情况分析、内容分析和用户分析。 使用情况分析:Analysis将记录在服务器日志文件中的原始点击数目转换为有关请求、访问和与Web站点进行交互的用户的宝贵信息,以获得对网站投资的最大回报。 内容分析:Analysis可以遍历 intranet以捕获内容、内容属性和站点的结构。这使你可

41、以发现问题,比如副本和孤本、无法获得的资源和尺寸过大的内容等。 用户分析:Analysis与其它SiteServer特性、BackOffice服务器(包括Personalization、Search组件和代理服务器)结合,以为使用情况分析和内容分析提供更丰富的数据和扩展分析涉及的范围。使用情况分析:最大化投资收益(ROI) 每次访问者与intranet站点进行交互时,服务器的日志文件就记录一次“点击”。这个点击信息详细描述了如intranet用户来自何处、他们看什么内容、花了多少时间访问某个地方和他们离开前最后看的是什么内容等信息。SiteServer Analysis将这些大量原始日志文件数

42、据变换为详细描述一个企业的intranet站点是否成功的有价值的报表,比如对站点进行重复访问的用户数量等。导入服务器日志文件和其它数据源文件SiteServer Analysis为导入使用情况分析数据提供了两种方法:使用情况导入(Usage Import)和顾客情况导入(Custom Import)。 Usage Import从企业内部的各个intranet服务器上导入登记文件,然后,在将信息存放到一个数据库前(可以从这个数据库生成各种报表),应用推理算法重构实际请求、访问、和与intranet进行交互的用户信息。 Custom Import通过导入用户属性 (记录在 Personalizat

43、ion里的自描述属性)、内容属性 (比如主题、作者和每个实体的类型)和顾客数据文件((比如部门职员文件或工作安排文件)丰富了服务器的日志文件数据。SiteServer是支持来自各种数据源的使用情况数据的第一个产品。SiteServer Analysis并不局限于单纯的点击分析。它还应用复杂的推理算法重构更有意义的站点动作如请求、访问和用户等。例如,当用户请求一个Web页面和三幅图像,日志文件将这个请求记录为次点击 (或更多当计算管理费用时),但是Analysis将这个动作(精确地)解释为一个请求。Analysis将访问定义为一系列用户请求,并认为用户在指定时段 (默认超时时间是 30分钟)内不

44、再发出请求时访问结束。为了识别一个用户,Analysis首先查找cookie,然后查找注册用户,最后查找主机名。Usage Import自动识别25多种日志文件格式,其中包括那些来自Microsoft、Netscape、Lotus Notes (包括各个引用和用户代理日志)和Apache的日志文件。此外,对Internet Information Server 4.0用户而言,Analysis自动安装一个用户识别过滤器来为每个用户生成一个cookie并设置Internet Information Server以将标准日志格式(W3C 扩展格式)扩展到包括引用、用户代理、cookie数据和查询字

45、符串的格式。Usage Import也包含对检索查询串和来自Microsoft和Netscape的代理服务器的日志文件的支持。在导入过程中,Analysis自动检测并存储根据由Search生成的查询串获得的信息。这些信息包含实际查询、目录名和返回的内容条目数。通过辨识雇员正在查找的东西和这些查询的成功与否,你可以用这些信息来提高雇员的生产率。使用代理服务器的日志文件,发现被雇员使用最多的Internet资源变得简单易行。信息产业的专业人员可以评价一个组织是否有效地利用了Internet资源和衡量缓存流行网站所带来的带宽节省。Usage Import提供企业级的服务器管理、从多个服务器和网站上聚

46、集数据的能力以及维护日志文件数据的功能。Usage Import还可以基于多个Web服务器对站点进行分析。对那些分布式的或在多个服务器上复制的站点,分析用户行为时一次分析一个日志文件常常会导致:(1)高估访问数量;(2)不完整的有关访问的资料。在导入期间,多个日志文件可以糅合在一起以统一跨越多个日志文件的访问。导入过程还可以处理无序日志文件而无须任何预处理。SiteServer Analysis 数据库允许以跨越站点的方式共享用户和内容属性。这个存放在Microsoft Access 或 Microsoft SQL Server里的数据库被划分为四个范畴: 组织、用户、访问和请求。这些范畴之间

47、是相互作用的,因为用户属于组织,用户生成访问,而访问产生请求。使用情况数据报表SiteServer Report Writer查询Analysis数据库并生成关于使用情况和站点的报表。利用Report Writer,网站管理人员、内容开发人员和管理人员可以创建他们自己的报表或从46中预定义报表(包括各部门对intranet的使用情况和内容标题等)中进行选择。他们可以使他们的报表建立在大量不同的、包括其它SiteServer组件和外部数据库的数据来源的基础上,并可以以HTML、Microsoft Word或Microsoft Excel的数据格式生成这些报表。这些报表还可以包括关于其它感兴趣地方

48、的请求和访问趋势、导航模式、服务器装载模式的概要信息(或为某个特定客户提供详细信息)。网站管理人员可以通过修改现存的预定义报表创建他们自己的报表或从头开始创建新的报表。200多种报表建造方式为规划数据以回答有关站点的最紧迫的问题提供了非常大的灵活性。在创建一个新报表的开始阶段,可以从一个提供60多个预定义计算式的计算式清单中选择所需要的计算式并把他们拖放到一个新的报表定义中(一个报表定义由一个或多个计算式构成)。用户也可以从一个Web浏览器执行和查看任何预定义报表(包括自己创建的报表)的结果。Analysis也允许intranet管理人员和其它人员用新颖的可视化工具来进行更彻底的使用分析。利用包含在Content Analyzer中的Hyperbolic View,网站管理人员可以用站点使用数据将他们的网站的结构生动地表现出来。通过一个直观的界面,管理人员可以使用Content Analyzer来发现他们站点里的访问量流动,定位到高访问量和低访问

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 技术总结

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com