基于SEO的在线论文网站优化实证分析——以“中国科技论文在线”为例
沈复辉田娟陈赓
1CNNIC此前的互联网调查报告显示,搜索引擎在互联网中发挥着越来越重要的作用。日益成为一般用户的网络入口和整个互联网的流量分配器。研究表明,一般网站大约50%-80%的流量来自于搜索引擎。随着大量学术论文在互联网上发表,搜索引擎在提高在线学术论文网站的浏览量和引用率方面也发挥着重要作用。
搜索引擎优化
它是研究各种搜索引擎抓取网页、建立索引、排列搜索结果的规则,并对网页进行优化,以提高网页的检索率和网页在搜索引擎中的排名,从而提高网站最终用户的浏览率的综合性技术。SEO包括以下几个意思:第一,尽量提高搜索引擎对一个网站的整体评价,也就是尽量提高网站的PR值。第二是让搜索引擎在一个网站中包含尽可能多的页面。三是尽可能让网站页面在搜索结果中进入前3。研究表明,前3页和前4-10页的点击率相差约100倍。第四,网站的网页要么覆盖了少量的热门高频搜索词,导致单个搜索词的搜索量很高;或者覆盖尽可能多的低频搜索词,以达到最大的量。第五,尽量让对你网站态度积极或者中立的网页先来,态度消极的网页再来。在关于该网站的前10个结果中,内容显示了最大的多样性。
因为搜索引擎搜索结果的排名一般是由云电脑服务器根据超链接分析排名算法自动生成的,一般来说,用户无法用Google直接控制排名。而用户可以通过优化自己的网页来间接影响以上五个方面。这就是SEO的精髓。只有搜索引擎认为好的网页才能最终带来高流量。有了高流量和一定的质量保证,发表在论文网站上的论文的引用率是可以提高的。
2 2 SEO的一般规则
SEO涉及网站和网页的四个相关因素:网站宏观特征、网页内容、网站外部链接、用户体验。
网站的宏观特征主要包括网页的动态性和网站的独特性。动态网页更新灵活,但不方便搜索引擎检索。在空之间允许的情况下,整个网站应该尽量转换成静态网页。网站的独特性也很重要。大量抄袭网页,会大大降低网站的评价。作者的实验表明,一个搜索引擎在一个网站中收集到大量页面后,会启动相似度检测引擎,将重复的页面从目录数据库中删除。
对于每个网页来说,内在因素主要是关键词密度。通常人们可能会误解,某个关键词在某个网页中的量越大,越容易排名靠前。其实关键词密度一般在4%-7%。太多,搜索引擎会认为这个网页是作弊网页;太少的话,相关性不够。
网站的外部因素主要是链接的数量和重要性。超链接分析是通过分析链接网站的数量来评估链接网站的质量。这确保了更受用户欢迎的内容将在搜索中排名更高。影响PageRank的三个因素是反向链接的数量,反向链接的PageRank和反向链接中的正向链接数量。大量重要网站的外链,对提高网站排名至关重要。而用户体验会在持续的排名过程中占据很大的权重。即使一个链接排名第一,但是由于其相关性差,没有人点击,大多数人点击第二个,这也会导致搜索引擎将第二个提升到第一个。
此外,还有大约一百个其他因素影响排名。比较重要的有:URL、页眉等网页元素中关键词的使用、内部链接和外部链接中关键词的使用、网页大小、网页新奇度、链接新奇度、更新频率、文字主题、网站大小和权威性、网站历史等。影响排名的负面因素主要有:关键词积累、网站内容更新过于频繁、Javascript使用过度、图片集中、过度优化、链接不当、重定向、多个网站间过度互联、Flash、框架、透明文本、HTML错误等。
3实证分析
本文使用的分析工具主要是作者和相关网站开发的ROSTSEO分析工具。
选择“论文”作为搜索词,在排名前九的网站和“中国科技论文在线”上进行数据统计和分析。这10个网站具有一般网络论文网站的特征,具有一定的代表性。我们收集了这10个网站的全球网站排名、网站流量和搜索引擎收录情况,其他相关数据见相关表格。
表1-10网站SEO详情表
从上述排名来看,“中国科技论文在线”在搜索引擎收录的论文网站中排名中等,但流量与第一、二名差距较大。任何在搜索引擎中排名靠前的人都可以获得额外的流量。从这10家网站的日均流量整体来看,排名前三的网站约占79.1%的流量份额,而“中国科技论文在线”约占2.1%。对排名前三的网站的研究表明,排名靠前的关键在于彻底的搜索引擎优化。由于“中国科技论文在线”在以“论文”为搜索词的网页搜索结果排名中没有进入前100,说明如果“中国科技论文在线”能够基于SEO对其网站进行优化,其流量将会有空的大幅提升。
搜索引擎收录的网页数量可以用来衡量一个网站在搜索引擎中的权重和信息产生量。从收录网页看,共收录了“中国科技论文在线”42400个页面。在“中国科技论文在线”中,以“关键词”为全文搜索词,可以获得95523项返回记录,整个网站的网页检索率为