搜索引擎优化方法数据收集,搜索引擎论文.docx

上传人:安*** 文档编号:73342357 上传时间:2023-02-17 格式:DOCX 页数:14 大小:22.69KB
返回 下载 相关 举报
搜索引擎优化方法数据收集,搜索引擎论文.docx_第1页
第1页 / 共14页
搜索引擎优化方法数据收集,搜索引擎论文.docx_第2页
第2页 / 共14页
点击查看更多>>
资源描述

《搜索引擎优化方法数据收集,搜索引擎论文.docx》由会员分享,可在线阅读,更多相关《搜索引擎优化方法数据收集,搜索引擎论文.docx(14页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、搜索引擎优化方法数据收集,搜索引擎论文本篇论文目录导航:【题目】【第一章】【第二章】【第三章】【4.1 4.2】【4.3 - 4.5】【5.1 - 5.4】 搜索引擎优化方式方法数据收集【5.5】【结论/以下为参考文献】第 5 章 实证研究在选取变量,构建模型,提出假设的基础上,进行本文的实证研究。首先是收集数据,并采用 SPSS16.0 软件对收集的数据进行分析,主要包括描绘叙述性统计分析、因子分析、相关分析,最后运用 SPSS16.0 统计软件软件对数据进行回归分析,对本文提出的假设进行检验。5.1 数据收集。5.1.1 确定搜索本文关键词语。为了搜索到适宜的网站,获取较为有效的数据,首先

2、要确定搜索本文关键词语。该搜索本文关键词语在百度搜索中要有代表性,还能较为全面的反映企业搜索引擎优化的效果。搜索本文关键词语确定的主要根据有下面几方面:1为数据统计的精到准确和方便,该搜索本文关键词语作为标题、长尾本文关键词语、Meta描绘叙述中的核心本文关键词语,是独立的词,不能再分词。假如本文关键词语还能够分词,容易产生异议,由于我们不能确切知道每个网站要优化的重点本文关键词语,仅以该搜索本文关键词语来作为研究的核心本文关键词语。研究用户按该本文关键词语进行搜索时,百度搜索引擎自然排名靠前的网站详细的搜索引擎方式方法是如何的,以及会带来什么优化效果。2该本文关键词语应能反映企业搜索引擎优化

3、的效果。大型品牌企业本身有知名度,网站即便不做太多优化,也能在搜索引擎搜索结果中获得好排名。因而,研究排名靠前的中小企业的搜索引擎优化更有意义。3该本文关键词语在搜索引擎中的搜索量很大,搜索结果页面多。据中国互联网络信息中心CNNIC发布的(2020 年中国网民搜索行为研究报告显示,当前用户搜索引擎使用场景偏休闲和娱乐。当用户在查找或下载电影、音乐、小讲、游戏等娱乐资源时,进行搜索的比例到达 79.7%,利用搜索引擎查找购物信息的用户占 70.9%,仅次之查找下载娱乐资源的使用率。因而,该本文关键词语牵涉的范围主要是娱乐和购物信息,考虑到娱乐的实时性,排名在不同时间会有很大的区别,于是将本文关

4、键词语锁定在购物方面。4百度搜索风云榜中与购物相关的栏目有:生活类、汽车、科技、家电等。华而不实只要生活类中的 旅游 、 团购 、 奢侈品 、 美食 、 化装品 五个榜单,是根据用户在百度搜索输入框中对本文关键词语的检索次数,按搜索量排名获得的搜索指数,构建了相应的榜单。综合以上分析,确定 化装品 为搜索本文关键词语。该本文关键词语牵涉的产品没有严格地域性,搜索用户群广泛。 化装品 没有分词,在百度搜索引擎中搜索量很大,能较为充分的反映用户的搜索行为。按该本文关键词语进行百度搜索,搜索结果出现的企业类型也有很大差异,因而能反映一定的搜索引擎优化效果,那么探究搜索引擎优化方式方法与效果就变得有意

5、义。5.1.2 企业界定。本文主要是关于企业的搜索引擎优化方式方法与效果的实证研究,由于中小企业资金、品牌号召力、市场占有率都不如大企业,搜索引擎优化凭借费用低、高灵敏性的优势对于中小企业来讲是更适宜的。通过搜索引擎优化,使网站在搜索引擎中的排名提高,让搜索引擎给企业带来用户,因而我们研究的重点是中小企业的搜索引擎优化。在界定大中小企业的类别时,主要参考的是国家统计局制定的大中小微型企业的划分办法。根据行业类别,根据从业人员、营业收入、资产总额等指标来断定企业的类型 . 详细划分标准见附录一 , 数据来源于国家统 计局。由于本文主要研究的是中小企业的搜索引擎优化方式方法与优化效果的关系。在选取

6、统计数据时候,查找到企业的从业人员、营业收入、资产总额等指标要按行业类别来断定企业的类型,不能记录大型网站的排名等内容。当前对于企业类型的划分,仅仅仅是按行业类别来进行界定的,还没有详细到按某一品类来划分。因而本文在对企业进行界定时,主要参考的是国家统计局制定的大中小微型企业划分标准。如根据 化装品 这一本文关键词语进行百度搜索,在收集数据时,首先查找相关化装品企业所附属的行业。然后整理归纳该企业的从业人员,营业收入等指标。最后根据这些企业所附属的行业类别和区分指标,来断定化装品企业的企业类型。5.1.3 数据收集经过。确定好搜索本文关键词语后,界定好企业,就要进行数据收集。本文是研究基于百度

7、的搜索引擎优化方式方法研究,所以网站是从百度搜索引擎收集得到的,网站的相关数据是从 Web 服务器和权威的第三方网站收集得来的。收集数据选择的是 360安全阅读器,百度搜索引擎平台、站长工具-站长之家等第三方网站。数据收集经过主要包括:百度搜索,记录网站网址;获取网站相关数据;数据挑选,获得最终实证分析的数据。1百度搜索,记录有效网站地址。以 化装品 为本文关键词语进行百度搜索,选取搜索结果页面的前 60 页,记录搜索结果中获得自然排名的网站对应的相关网址。在这个经过中不记录百度推广网址和百度旗下的网址,如百度贴吧,百度文库,百度糯米等百度产品,最后得到 400 个网址。2获取网站相关数据。搜

8、索引擎优化方式方法和效果相关的数据,主要由站长工具-站长之家中的 SEO 综合查询获得,部分数据通过网速测试网站等补充查询。收集搜索引擎优化的相关数据,有下面几个注意事项:搜索结果显示的是网站的普通页面。对于导入链接、百度收录数、日均 IP访问量三个指标记录的是网站总体数据,长尾本文关键词语、Title 中本文关键词语的个数、Meta 描绘叙述中本文关键词语的个数、内部链接、百度自然排名五个指标记录的是搜索结果百度快照页面的数据。本文关键词语密度记录的是搜索本文关键词语的个数与所在页面总文字数的比值,用百分比表示。页面打开速度,指的是打开网站首页的速度,使用第三方测试网站,输入网站域名地址获得

9、。该工具测试的是作者所使用的阅读器发起连接到搜索企业网站服务器发出响应的响应速度。对于 404 错误页面的数据获取方式方法是,分别打开搜索到的 400 个网站地址所对应的网页,在网址末端随意添加字符如添加 000,再刷新重新打开,直到出现 404 错误页面为止,记录 404 错误页面的类型。假如出现的 404 错误页面是服务器默认的,则记为 0 .假如是客制化的,有错误信息提示或能引导阅读者继续阅读的,则记为 1 .由于数据在不断变化,因而,本研究的数据均在 2021 年 9 月 29 日收集。3数据挑选。对搜集到的 400 组数据进行挑选,删除重要变量缺失的网址,一样网站的不同网页,只保存第

10、一次出现的网页的网址。同时,删除阿里巴巴、58 同城、赶集网、知名化装品品牌、国家食品药品监督管理总局等网站网址,最后得到 115 组数据,对应的网址见附录二。这 115 组数据各项指标基本能反映企业搜索引擎优化的方式方法与效果,具有一定的代表性。5.2 描绘叙述性统计分析。收集整理完数据后,就要对数据进行实证分析。本文研究的是企业搜索引擎优化方式方法中的本文关键词语密度、长尾本文关键词语的个数、Title 中本文关键词语的个数、Meta 描绘叙述中本文关键词语的个数、搜索结果所对应页面的内部链接、网站导入链接、404 错误页面、网站首页打开速度八种方式方法,与搜索引擎优化效果百度收录数、百度

11、自然排名所在的页数、日均 IP 访问量的关系,先对搜索引擎优化的八种方式方法进行描绘叙述性统计分析,主要做的是频数分析,判定原始数据的大致情况,描绘叙述数据的集中趋势和离散趋势。考虑到搜索引擎方式方法中内部链接、外部链接和搜索引擎效果中百度收录数、日均 IP 访问量数据比拟大,为了降低异方差性57,对这四个数据取自然对数,得到搜索引擎优化方式方法的描绘叙述性统计分析。本文关键词语密度的均值为 2.558%,标题和 Meta 标签中含有的长尾本文关键词语约为 5 个,Title 中本文关键词语的个数约为 1 个,Meta 描绘叙述中本文关键词语的个数约为 2 个,搜索结果对应的百度快照页面大约有

12、 187e5.23个内部链接,网站导入链接大约为 59e4.07个,404 错误页面的均值为 0.57,网站首页打开速度均值为 0.3036s.这些数据反映了 115 个网站搜索引擎优化方式方法基本的数值,为接下来的分析做准备。5.3 因子分析。1KMO 和 Bartlett 球形检验。在进行因子分析前,先要判定变量能否合适做因子分析,主要通过 KMO 和Bartlett 球形检验来测量。本研究首先对搜索引擎优化的方式方法,本文关键词语密度、长尾本文关键词语、Title 中本文关键词语的个数、Meta 描绘叙述中本文关键词语的个数、内部链接、导入链接、404错误页面和页面打开速度八个变量进行K

13、MO检验和Bartlett球形检验,来判定这八个变量能否合适做因子分析。搜索引擎优化方式方法的八个变量的 Bartlett 球形检验卡方值为 280.599,相应的显着性概率 P 值为 0.000 0.05,因而可拒绝原假设相关系数矩阵为单位阵,各个变量互相独立。同时,KMO 值为 0.558 0.5,因而搜索引擎优化方式方法的八个变量能够进行因子分析,并进一步完成主成分分析。2主成分分析。进行因子分析最常用的是主成分分析法,主成分分析就是考虑各变量之间的互相关系,利用降维的方式方法将多个变量转化为少数几个互不相关的因子,得到公因子,进而使进一步研究变得简单。本文进行主成分分析的主要目的就是选

14、取公因子,查看初始因子载荷矩阵。假如初始始载荷矩阵不能让变量在公共因子的奉献程度上产生比拟明显的分级,再进行因子旋转,通过旋转因子载荷矩阵查看。提取公因子主要通过特征值及累积方差奉献率来进行。表中第一列有八个因子,一般选择特征值大于 1 的因子作为主因子,前四个因子知足条件,特征值分别为 2.491、1.452、1.196、1.013.且前四个因子累积解释 76.909%的方差,所以总体来看效度较好,能够准确测量各变量的含义。通过 SPSS16.0 对数据进行主成分分析,提取公因子,并得到初始因子载荷矩阵。影响第一个因子的四个主要变量是本文关键词语密度、长尾本文关键词语、Title 中本文关键

15、词语的个数和 Meta 描绘叙述中本文关键词语的个数,它们的主成分因子载荷量分别为 0.565、0.914、0.729 和 0.850,这四个变量主要是关于本文关键词语的描绘叙述。由于标题和 Meta 标签都有一定的长度限制,过长就会被搜索引擎截取掉,所以企业要考虑在这些地方的靠前位置放置自个要重点突出的、符合用户需求的本文关键词语,提高被用户查找到的概率。当用户输入本文关键词语进行搜索时候,搜索引擎快速地查找与用户所输本文关键词语相匹配的网页,并根据相应的排名算法进行先后排名,在搜索结果页面显示相应的结果列表,用户看到自个的搜索本文关键词语,就会点击进去,阅读访问或者达成购买意向。放上长尾本

16、文关键词语的目的是,提高转化率。长尾本文关键词语一般较长,最少是两个本文关键词语的组合,使用该本文关键词语的客户一般有比拟明确的需求,因而营销目的是比拟容易实现的。当然要控制本文关键词语的数量,控制本文关键词语的密度,不可堆砌本文关键词语,优化过度,第一个因子较好地衡量了搜索引擎优化方式方法中的本文关键词语数量这一指标。影响第二个因子的变量是内部链接,这个变量的主成分因子载荷量为 0.850,它也就是对内部链接的描绘叙述。网站的内部链接由网站管理者自个部署,可控性大。内部链接不仅会影响搜索引擎对网站的爬行索引效率,还会影响用户的体验度,因而企业网站一定要做好内部链接优化。部署优秀的内部链接越多

17、,页面被点击的时机就越大,页面阅读量的增加越显而易见,如在网站内添加相关文章和热门文章,定期更新文章内容等的内部链接很容易提高用户的访问体验。网站每一个页面的内部链接数都有一定的限制,内部链接数太多可能会被搜索引擎忽略。基于此,第二个因子较好地衡量了搜索引擎优化方式方法中的内部链接数量这一指标。影响第三个因子的变量是导入链接,这个变量的主成分因子载荷量为 0.696,它也就是对导入链接、反向链接的描绘叙述。导入链接是别的网站为自个的网站投票,会增加自个网站在搜索引擎中的权重,进而提高在搜索引擎中的自然排名。这一指标能够反映调查企业导入链接数量的情况,能够作为搜索引擎优化的一重要方式方法。影响第

18、四个因子的变量是 404 错误页面和页面打开速度,这两个变量的主成分因子载荷量分别为 0.705 和 0.565,它们主要是对页面设计的描绘叙述。404 错误页面是指返回给用户网页无法访问,或域名错误等信息的页面。客制化的 404 错误页面能够引导用户继续访问网站其他内容,而不是关闭网站离开。网站建设者应提高对页面设计的重视,设计客制化的 404 错误页面,提高网页打开速度等,第四个因子能够较好的反映网站页面设计的情况。通过以上分析能够看出,未旋转的公共因子的实际意义已经得到了很好的解释,有较强的现实意义,因而不用再进行因子旋转。本文提取公因子的主要目的是为了检测搜索引擎方式方法的各维度能否有

19、严重的穿插性,但通过主成分分析发现各维度大部分是比拟合理的,只是为统计数据需要在划分变量时存在一定的偏差,这对于衡量搜索引擎优化效果的影响比拟小,能够不予以考虑。因而,在接下来的实证分析经过中,仍然对搜索引擎优化方式方法的八个维度进行研究。5.4 相关分析。为了讨论影响搜索引擎优化效果的优化方式方法,有必要对搜索引擎优化方式方法变量与搜索引擎优化效果变量进行相关分析。相关分析是用来研究两个或多个变量之间能否存在相关关系,并对详细有相关关系的现象讨论其相关方向及相关程度的一种分析方式方法58马国庆,2002。由于变量值的总体分布不明,本文采用spearman 系数对变量进行相关分析计算。1 搜索

20、引擎优化方式方法与百度收录数的相关分析。关于搜索引擎优化方式方法中的本文关键词语密度、长尾本文关键词语、Title 中本文关键词语的个数、Meta 描绘叙述中本文关键词语的个数、内部链接、导入链接、404 错误页面、页面打开速度与百度收录数的相关分析结果。本文关键词语密度、Meta 描绘叙述中本文关键词语的个数与百度收录数在 0.05 的水平上显着正相关,Title 中本文关键词语的个数、内部链接、导入链接、404错误页面与百度收录数在 0.01 的水平显着正相关。因而,本文关键词语密度、Title 中本文关键词语的个数、Meta 描绘叙述中本文关键词语的个数、内部链接、导入链接、404 错误

21、页面与百度收录数有一定相关性。2搜索引擎优化方式方法与百度自然排名的相关分析。关于搜索引擎优化方式方法中的本文关键词语密度、长尾本文关键词语、Title 中本文关键词语的个数、Meta 描绘叙述中本文关键词语的个数、内部链接、导入链接、404 错误页面、页面打开速度与百度自然排名的相关分析结果.内部链接、404 错误页面、页面打开速度与百度自然排名在 0.05 的水平上显着负相关,导入链接与百度自然排名在 0.01 的水平显着负相关。因而,内部链接、导入链接、404 错误页面、页面打开速度与百度自然排名有相关关系,华而不实导入链接和 404 错误页面相关系数的绝对值较大。3搜索引擎优化方式方法

22、与日均 IP 访问量的相关分析。关于搜索引擎优化方式方法中的本文关键词语密度、长尾本文关键词语、Title 中本文关键词语的个数、Meta 描绘叙述中本文关键词语的个数、内部链接、导入链接、404 错误页面、页面打开速度与日均 IP 访问量的相关分析结果。Title 中本文关键词语的个数、内部链接、导入链接与日均 IP访问量在 0.01 的水平显着正相关。因而,Title 中本文关键词语的个数、内部链接、导入链接与日均 IP 访问量有相关关系。相关分析只能简单断定变量之间能否具有相关关系,但无法区分自变量和因变量,同时变量间的相关分析没有排除其他因素对变量关系的影响,它只是提供应我们一个参考。本文固然提出了搜索引擎优化的八个方式方法,但是它们带来的影响很模糊,通过相关分析能够初步断定搜索引擎优化方式方法与效果间有无关系。相关分析是回归分析的基础,假设的验证还需要回归分析来进一步断定。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 毕业论文 > 文化交流

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com