Google和其他搜索引擎的不同一点,是Google将它认为欠重要的网页置于“补充材料”中。这些处于替补位置的网页,只有在主要网页不能提供搜索结果的情况下,才会被Google调动。
粗略估计,Google有高达1500亿张网页的收录,但是不等于说,这些网页都是信息源头。他们中有相当的重复。这样,自然Google就很精明地将他认为的原始信息和翻版的区分出来,而将原始信息重点提供给搜索者。反映在现实网络中,许多电子商务网站,网页数量庞大,但是被收录的网页往往只是其中一部分,而很多被Google作为补充材料遭冻结。
有两个情况容易造成许多网页被冻结。第一,新网站的出现,Google无法立刻确定网页信息的可靠性和特有。第二,旧网站突然增加许多新网页。对第一种现象,解决的办法是建立链接,让外界来承认自己。第二种现象的产生,是突然给Google一个压力,也使Google一下子不好消化。
这个背后的主要原因是Google的佩奇等级(PageRank)在起作用。对于旧网站增加新的内容,无可避免地将原有的PR稀释,使许多页的重要性随之下降,而被Google低估。作者最近对一个网站增加许多内容,就导致了原先不在“替补”里面的网页被放入了“替补”。
避免进入“替补”,一个重要的原则,是尽量减少网站的层次。Google对第一层的网页绝大部分收录;对第二层的一部分收录;对第三层的则是“歧视性”地收录,也就是不容易被收录。第二点,就是注意将有价值的链接尽快连到新的网页上。第三点,就是增添新网页的时候,要尽可能地起草文本而不是重复其他网页或者抄袭别的网站的。CuteSEO资讯列表