中企在线网站建设
 
 
首 页 自助建站 成功案例 域名注册 企业邮局 虚拟主机 主机托管 手工建站 代理合作 在线答疑 VoIP电话 400电话 付款方式
 
网站管理登陆
   
用户名:
密    码:
―→注册账户即可免费体验中企在线建站系统功能15天。
网站建设技术
   

google是怎样去抓取页面的

作者:中企在线    时间:2009-6-6 12:33:03
  GOOGLE是这样抓去页面的-Google幽灵现象

  眼下最热、最重要的一个话题就是Google幽灵现象。一般情况下,把一个网站递交到互联网上,在每月固定更新之前,你会发现这个网站出现在索引里。有时,这个网站能够获得很高的排名,但可怕的是,几天或一周以后,这个网站会突然消失。这种幽灵现象困扰着网络新手们,同时也给经验丰富的网络行家出了一道难题。其实,这种现象很容易理解。

  Google有两种网络爬虫,主爬虫和新爬虫。主爬虫主要负责发现新的网页。一个网页在新索引建立之后,马上会被主爬虫发现。如果一个网页建立索引需要经过一个月的时间,这个网页就会失效。

  新索引的建立还需要考虑其他非询问式的决定因素。这些决定因素关系着网页排名的高低。为了充分利用这些网页,而不是浪费时间等着下一次索引算法的更新,Google必须采取一些简单的措施来猜测排名,猜测访客难以利用的新内容是什么。

  尽管Google在作猜测,下列内容都是真实可信的:

  1)幽灵登陆页上的排名不能等同于索引页的排名。

  2)在每月新数据库建立之前,必须将幽灵登陆页从数据库中移走。但是,这只是暂时的移走。

  如果您的索引中有这样登陆页,您的主要目标应该是让该页在Google新页上拥有排名。若您想做到这点,您需要定期、有规律、最好是每天,有一定间隔地更新网站内容。

  为什么您想要在Google的新页上获取排名?因为在新页上有排名的网站更容易被抓取,索引更容易更新。但是在新页上的排名不是真正的排名,新页排名有很强的不稳定性。新页排名转化为真正排名需要经过一段时间。

  案例分析:同样的遭遇

  (1)五天之前,我向互联网上传一个新的小网站,这一次我没有像以往那样把这个网站与我的其他网站建立链接,而是通过添加
l.html将该网址添加到Google中去。我静静等待这个网站被发现。三天以
后,用该网站的主要关键词进行搜索,这个网站能排到搜索结果的前十名,并且记录显示130个访问者访问过该网站。但是,一天之后,这个网站消失了。这一次,他不仅是掉出前十名,而且是掉出整个
Google目录。网站本身一点问题没有,没有作弊,没有隐藏链接,没有内容复制,没有关键词堆砌,就这样默默地网站消失了。

  我仔细考虑该网站的欠缺之处,排名消失的原因也许在于这个网站缺少导入链接,也许因为这个网站有一个弹出窗口。也许,也许,有无数个也许在等着我。

  (2)经常有人向我们咨询这类问题,为了满足不同询问者的需要,我们写了一篇文章,希望有所帮助。

  当Google搜索蜘蛛抓取一个新网页后,这个新网页会有什么反映?

  一个新网页没有被Google主目录收取,直到:

  1.该网页被Google主目录搜索蜘蛛抓取。

  2.该网页在被Google主目录搜索蜘蛛抓取之后,须经过一段更新时间。

  只有以上两条全都满足,新网页被Google主目录确确实实抓取到,新网页上的排名才有可能转化成真正排名。

  Google有两种抓取形式

  1.主抓取

  2.新抓取

  一个新的网页首先被“新抓取”蜘蛛抓取。但也有特例的时候。在Google月更新刚刚完成那一段时间之后,一个网页通常被“主抓取”蜘蛛抓取。每月更新一般在每个月的20号到28号之间,能够持续几天。

  为了区分两种蜘蛛的差异,我们可以先来看一下一组IP地址。

  1.“主抓取”蜘蛛=216.239.46.*

  2.“新抓取”蜘蛛=64.68.82.*

  为了进一步解释明白新网页发生的Google幽灵现象,我们假设该网页首先被“新抓取”蜘蛛抓取。在Google两个月更新之间,“新抓取”蜘蛛来抓取新网页。在主抓取期间,通过链接新网页能够被抓
取。新抓取期间,情况也是一样。
 
  尽管这个网页没有经过此次更新,也没有收录在Google主目录里,但是抓取之后,搜索蜘蛛开始衡量该网页内容和质量,并把该网页收录在搜索结果里。这次衡量是十分不稳定的,易受外界影响,经常发生变化。

  当每月定期更新来临时,这些网页会产生波动。每月定期更新就是Google波动。但是,您需要记住,“主抓取”蜘蛛没有阅读该网页,所以这个网页没有加入主索引中。所以,当每月更新结束后,这个新
网页仍被看作是新网页但是不久以后,“主抓取”蜘蛛将会阅读这个新网页,在下个月更新之后,该页面才能被收录进主索引。这需要经历一段时间。在此之前,Google不显示任何导入链接,这个网页的排名也因此多变、不稳定。
让我们总结一下:

  如果一个新网页首先被一个“新抓取”蜘蛛抓取,然后被“主抓取”蜘蛛抓取,这个网页需要经过两次月更新。换句话说,这个新网页需要经过两个月才能被主索引收录,在被主索引收录之后,才可能获取稳定的排名。

  这期间新网页可能在Google搜索结果页中出现,也可能消失,这种不稳定的情况完全是正常的。

  还有一种情况。如果一个新网页首先被“主抓取”蜘蛛抓取(这通常发生在一月的下旬),那么这个网页只等一个月的时间就可以进入“主索引”。

  网站设计者和拥有者如果不了解Google抓取新网页的过程,他们的工作将难以开展。网页排名可能一路飙升,名列前十名,让人欣喜若狂,也可能陡然狂降,甩出二百名开外,令人垂头丧气。抓住Google抓取新网页的过程规律,网络英雄们将不再迷茫,有的放矢将不会是单纯的梦想。


本文关键词:如何创建网站,如何建网站,怎么创建网站,怎么建网站,怎样创建网站,怎样建网站,中企在线,申请网站,如何制作公司网站,如何建立自己的网站,怎么做公司网站


 客户产品、服务信息查看更多

JY-S872

竹炭净味内墙漆.

JY-Y4413

JY-Y4601

JY-Y4421

JY-3010 300X300

弹性厚质漆(KX7007)

树脂背景效果图

通用底漆

JY-4001

JY-S918

防水漆

JY-Y4401

特效深基漆(KX6000)

JY-D102

JY-Y4409

JY-Y4414

JY-3095 300X300

JY-S896

树脂背景效果图

树脂背景效果图

JY-Y4418

JY-Y4402

JY-3088B 300X300

JY-S902

新版1

洁莉雅(KX178)

12

家万利内墙漆

JY-S868

JY-Y4806

JY-D117
 客户产品、服务信息查看更多
友情链接: 免费QQ在线客服代码 上海汇亚信息科技有限公司 SEO一点通 商助网 免费QQ客服代码 怎么建网站 企业邮局 注册域名 购买域名
客户服务 QQ临时会话经常无法正常接收或发送信息。请尽量将客服添加为您的QQ好友。谢谢! QQ临时会话经常无法正常接收或发送信息。请尽量将客服添加为您的QQ好友。谢谢! QQ临时会话经常无法正常接收或发送信息。请尽量将客服添加为您的QQ好友。谢谢! QQ临时会话经常无法正常接收或发送信息。请尽量将客服添加为您的QQ好友。谢谢! 技术支持 QQ临时会话经常无法正常接收或发送信息。请尽量将客服添加为您的QQ好友。谢谢! QQ临时会话经常无法正常接收或发送信息。请尽量将客服添加为您的QQ好友。谢谢! 其他事务 QQ临时会话经常无法正常接收或发送信息。请尽量将客服添加为您的QQ好友。谢谢!
公司地址:上海市徐汇区襄阳南路500号巴黎时韵1309   邮编:200031  公司简介  建站知识
电话:021-33719901   传真:021-33854627   客服邮箱:120@61690.com   值班手机:13917529009
上海万天网络技术有限公司版权所有© 2000-2009   沪ICP备09002376号   营业执照复印件   中国频道金牌合作伙伴授权书
               

如何创建网站

如何建网站

怎么创建网站

怎么建网站

怎样建网站