当前位置:首页 >  站长 >  搜索优化 >  正文

百度“蜘蛛爬虫”如何判断网站访问速度的相关因素

 2011-11-08 19:49  来源:   我来投稿 撤稿纠错

  【推荐】海外独服/站群服务器/高防

潘田最近在使用百度统计时发现了一个百度新推出的功能“网站速度诊断”,具体什么时候出来,笔者也不太清,只知道以前是没有,最近才发现的。这功能很有趣,它所诊断的一个网站的访问速度技术标准都是以百度来衡量的。既然如此,那么百度蜘蛛爬虫在访问一个网站的时候,所决定这个网站的速度快与慢的因素也相差得不太远。从这个诊断来看,我至少对百度的一些规则有更进一步的掌握。在做SEO的时候,网站的访问速度也是关键词排名的重要因素,如果百度蜘蛛爬虫访问时间超过了一定的时间限制,那么百度很有可能就判断为无法访问,这是非常不利的。笔者以手下的一个网站诊断为例,来分析一下这个诊断的细节。

首先在网站的底部加入百度的统计代码,然后在进度统计后台进行“代码安装检测”,如果正确,则显示“代码安装正确”。这些都很简单,没什么难度。

 

点击左则的栏目“网站速度诊断”,进行网站的访问速度诊断。

 

下面笔者是以《5S论坛》502seo.com为例进行分析。看下图

 

在诊断的时候,可以选择线路,目前百度也只提供网通与电信的线路诊断,我在这两个都选了。点击分析。分析过程要一定的时间。

下面是502seo.com的诊断结果分数,电信线路得到84分,网通的是53分,这两分数相差很大,说明网站空间不是双线(网通与电信)的机房,如果你的空间商是双线路的,那么这两个分数也相差不大。

 

从上图看到,从电信线路访问时间是1.78秒,网通线路访问则要60.12秒,如果百度蜘蛛爬虫从网通访问我的网站,那么结果是很糟糕的,甚至认为是死网站。如果那位朋友是用网通的线路,可以访问一下,是不是要这么时间。

从以上数据分析,大家在做网站的时候,尽可能的选择双线路或更多线路的空间。这对网站SEO是非常有利的。接下来,分析一下详细的细节点。

从上图的列表中,我们看到RUL这一列,它是网

 

站首页所有的图片,js,css,iframe等URL请求,如果这些URL过多,那么也就意味着你的网站速度越慢。再看看状态,301是转向,转向时间也算到百度的访问时间。200则是能正常访问,如果出现400或是别的,那就是这URL请示是不能访问,这列表可以做为诊断页面的一个技巧。时间线就是URL请求所用的时间,以毫秒为单位。

以下图片是百度给出的诊断建议。

 

百度从三个方面来给出建议:连接网络,下载页面,打开页面。

502seo.com的这次诊断,连接网络总共有6项,共有47次请求,百度建议可节省25次连接,并以列表的形式列出来。这时,就可以分析,那些边接是没必要的,可以清除掉。

 

合拼域名,502seo.com首页中放了好几个统计代码,这都被百度认为是多余的请求,相对于蜘蛛爬虫来说,算不算是多余,没有谁说得清楚。大家对于这一点,尽可能少的调用域名外的请求。对用户和蜘蛛爬虫都是好的。

还有要取消重写向,合并JS,网站分析JS过多,合并CSS,使用CSS sprite。其实这引起可以做进一步的优化。潘田在此不再详细分析,读者可以分析自己的网站。

“下载页面”,”打开页面”的建议也有详细的列表,读者可以看图片上的说明。百度还提供了诊断报告下载,诊断报告有更详细的说明,包括每一图片的下载时间,都做了详细的记录。可以做为参考进行做SEO优化调整。百度蜘蛛爬虫判断网站访问速度的相关因素就是有这些构成,读者可以这样的方法分析下你自己的网站又得了多少分。感谢阅读。

潘田博客原创www.pantian8.com 转载请留说明。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关文章

  • 浅谈百度爬虫的HTTP状态码返回机制

    HTTP状态码我们都很熟悉,SEO工作中我们也需要迎合百度蜘蛛对常见的HTTP返回码来做相关调整,下面我们就来浅谈百度爬虫的HTTP状态码返回机制

  • 爬虫有哪些分类?白话说说SEO好朋友爬虫

    本文大纲:1、爬虫是什么?反爬虫又是什么?2、爬虫有哪些分类?3、爬中流程与搜索引擎工作流程4、http/https协议与状态码5、robots协议爬虫是什么?反爬虫又是什么?这里的爬虫不是我们生活中的爬虫,如蜘蛛。这里的爬虫更多指的是网络爬虫,即我们叫它网页蜘蛛或网络机器人。当然,在SEO里,叫网

    标签:
    百度爬虫
  • 百度爬虫是什么

    百度爬虫是一种网络机器人,它可以根据一定的规则,在各个网站爬行,对访问过的网页、图片、视频等内容进行收集整理,分类建立数据库,呈现在搜索引擎上,让用户通过搜索某些关键字,就可以看到企业网站的网页、图片、视频等。

    标签:
    百度爬虫
  • 百度蜘蛛爬虫的工作原理

    百度是中国目前的第一大搜索引擎,拥有完善的一套爬虫算法,了解百度蜘蛛的爬虫原理,对我们SEO优化工作有着举足轻重的作用。我们可以从下面这张图片来详细了解百度蜘蛛爬取网页的一整套流程和体系

  • 影响百度爬虫对网站抓取量的因素

    影响百度爬虫对网站抓取量的因素有哪些?

    标签:
    爬虫
    百度爬虫

热门排行

信息推荐