NEWS

分享创造价值   合作实现共赢

为什么日志显示百度蜘蛛抓取网页成功了,但仍然查询不出来?

许多站长经常查看网站的访问日志,日志上显示某条信息已经被百度蜘蛛抓取了,即返回的状态码是:200.0.0,但这条信息仍然查询不出来?以下分析日志显示百度蜘蛛抓取网页成功了,但仍然查询不出来的原因。
  
百度蜘蛛首先根据超链接爬取你的网站内容的,百度蜘蛛抓取内容后网页带回百度的一个数据库:我们暂且叫这个数据库为抓取数据库。然后,分析这条被百度蜘蛛抓取的内容,如果他认为有价值的内容,会放到另外一个数据库,我们暂且把这个数据库叫:收录数据库。所以,等你的网站到了这个收录数据库后,你的网站内容才会放出来。也就是说分析程序会根据你网站的权重,内容的质量如何,然后判断何时放出你被百度蜘蛛抓取的内容。简单的原理就是:百度蜘蛛抓取网页后,会把页面存入服务器中,但此时并这条信息不一定立刻显示出来,搜索引擎会把这篇文章的内容和自己的数据库进行对比。对比后如果发现这篇内容在数据库中没有这条相同的信息,那么这张条信息才会被放出来,也就是在搜索引擎里直接输入地址就能查询到这条信息。相反,如果发现百度蜘蛛抓取的这条信息在自己数据库中有大量相同的内容,那么即使百度蜘蛛抓取网页成功,这条信息也不会显示出来。
  
通过以上分析可以看出,搜索引擎蜘蛛对于内容的收录是有严格的审核制度的,目的是保证搜索没有垃圾内容的出现,而更好保证了用户的体验和搜索的准确性。所以站长在添加内容是注意了:不要轻易的复制别人的内容,这样的结果即使暂时被百度蜘蛛抓取了内容,但因为重复性太高,过段时间也会被删除的,并且网站的权重也会随之下降。
  
还有一种原因是您的内容并非是抄袭别人站点的内容,而日志也显示百度蜘蛛抓取网页成功了,但仍然查询不出来,这样的情况会发生在新站上。主要的原因是网站的权重不高。这种情况您无需着急,过段时间就会放出来。
相关文章