« 如何来选择最佳的关键词优化百度-搜索引擎排名规则 »

搜索引擎蜘蛛spider相关知识汇总

  什么是baiduspider?

  baiduspider是百度搜索引擎的一个自动程序。它的作用是访问互联网上的html网页,建立索引数据库,使用户能在百度搜索引擎中搜索到您网站的网页。

  baiduspider对一个网站服务器造成的访问压力如何?

  baiduspider会自动根据服务器的负载能力调节访问密度。在连续访问一段时间后,baiduspider会暂停一会,以防止增大服务器的访问压力。所以在一般情况下,baiduspider对您网站的服务器不会造成过大压力。

  为什么baiduspider不停的抓取我的网站?

  对于您网站上新产生的或者持续更新的页面,baiduspider会持续抓取。此外,您也可以检查网站访问日志中baiduspider的访问是否正常,以防止有人恶意冒充baiduspider来频繁抓取您的网站。如果您发现baiduspider非正常抓取您的网站,请反馈至webmaster@baidu.com,并请尽量给出baiduspider对贵站的访问日志,以便于我们跟踪处理。

  我不想我的网站被baiduspider访问,我该怎么做?

  baiduspider遵守互联网robots协议。您可以利用robots.txt文件完全禁止baiduspider访问您的网站,或者禁止baiduspider访问您网站上的部分文件。注意:禁止baiduspider访问您的网站,将使您的网站上的网页,在百度搜索引擎以及所有百度提供搜索引擎服务的搜索引擎中无法被搜索到。关于robots.txt的写作方法,请参看:

  为什么我的网站已经加了robots.txt,还能在百度搜索出来?

  因为搜索引擎索引数据库的更新需要时间。虽然baiduspider已经停止访问您网站上的网页,但百度搜索引擎数据库中已经建立的网页索引信息,可能需要二至四周才会清除。另外也请检查您的robots配置是否正确。

  百度蜘蛛在robots.txt中的名字是什么?

  “baiduspider”全部为小写字母。

  baiduspider多长时间之后会重新抓取我的网页?

  百度搜索引擎每周更新,网页视重要性有不同的更新率,频率在几天至一月之间,baiduspider会重新访问和更新一个网页。

  知道了什么是百度蜘蛛,那么怎么才能知道蜘蛛是否来过你的站?

  这个可以从你服务器或者虚拟主机的日志中看出来,比如我用的虚拟主机的完整使用日志中有这样的记录:

  220.181.38.198 - - [11/Nov/2007:04:28:29 +0800] "GET / HTTP/1.1" 200 61083 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)"这就说明百度蜘蛛来过我的站了,如果你还想知道有没有其它搜索引擎的蜘蛛来过你的站,你可以在日志文件中搜索“spider”这个词,或者搜索蜘蛛的IP,我的就查到sogou也来过我的站,IIS日志与Apache的日志是一样的,都可以查到。

作者:孙运坤
首发:网站优化BLOG
地址:http://www.0532seo.com.cn

收藏到:百度QQ书签天极天天POCO和讯iFaXianE起摘雅虎我摘Windows Live
  • 相关文章:
 
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

站长简介

青岛网站优化 站长:孙运坤
青岛网站优化专家
山东SEO团队成员
本站主要提供网站优化、搜索引擎营销顾问、关键词排名等服务。 QQ客服:27813705
点击给我发邮件
24小时咨询电话:13789866812
 
XHTML 1.0  RSS  ABOUT US CONTACT US
Power by Z-blog1.8. Copyright 2006 网站优化-SEO优化 All rights reserved.