月光博客

青青子衿, 悠悠我心, 但为君故, 沉吟至今

« 搜狗五笔输入法发布GoDaddy恢复访问正常 »

百度收录网站的特点分析

  两年前,我曾经写过一篇文章《Google和百度收录网站页面的比较》(发布于2006年4月17日《计算机世界》),分析当时情况下百度和Google搜索引擎对于网站的收录比较,两年过去了,这两个搜索引擎的算法都发生了巨大的变化,那时的比较收录规则已经完全不适用于当前了,现在,我就根据今天搜索引擎当前的发展情况,再次比较和分析一下百度和Google这两大搜索引擎在收录网站方面的异同。

  首页规则

  搜索引擎的索引更新速度是衡量搜索质量的一个重要的参数,对于大型网站(比如门户新闻网站)以及其他更新量大的网站,百度和Google的索引速度都很快,基本上都能做到当天更新。

  但是对于更新量小的网站,例如博客,两者就有较大区别,Google对于高权重并提交Sitemaps和Ping的网站,索引速度可以达到分钟级别,有时刚刚写完一篇文章,几分钟后,就能在Google中搜索到解决,但是对于百度来说,索引速度较慢,通常仅仅更新了博客网站的首页,搜索文章标题,排在前面的是博客首页或者目录页,而不是文章页。

  总的来说,百度对于网站首页的关注以及权重给的似乎特别高,而Google对于最终的文章内容页面的关注多于百度。

  半个月规则

  百度对于更新量较小的博客,收录页面有一个奇怪的时间规则限制:半个月规则,根据我对于月光博客文章收录速度的观察,通常情况下,半个月之内发布的文章,使用百度搜索文章标题,排在前面的基本上都是门户网站转载或聚合我的文章,我写的原始文章不见踪影。而使用Google搜索,我的原文基本上都是第一位。

  而大约半个月之后,我的文章的原始内容才在百度上出现,这时候搜索文章的标题,我的原文才会成为百度搜索结果的第一位。

  权重计算规则

  Google计算权重的方式主要参考页面的反向链接,如果别人转载我的文章并添加了原文链接,那么Google通常会给予原始文章较高的权值,而百度似乎对于自己的网站(百度知道、百度空间、百度百科等)给予较高的权值,并且对于更新频繁的大型门户网站更为青睐,而对于反向链接似乎没有给予太多的权重。

  新站规则

  一个新注册的网站,经过一些宣传之后,通常Google就会对其进行收录,但赋予的权值并不太高。

  百度对于新站不会立刻收录,并且相当长的时间内都不会收录,当新网站在搜索引擎有了一个不错的表现,并且有了较多的反向链接,会出现一个阀值,百度判断其网站内容不属于明显复制其他网站内容之后,会开始收录这个新站点内容,这时候网站才会出现来自百度的流量。

  总的来说,在网站收录速度上来看,Google现在比百度要快,不过由于百度的用户更多一些,所以网站搜索来源大多还是来自百度的多一些。不过对于技术博客来说,来源Google的访问量应该和百度旗鼓相当了。



原创文章如转载,请注明:转载自月光博客 [ http://www.williamlong.info/ ]

本文链接地址:http://www.williamlong.info/archives/1479.html
  • 文章排行:
  • 16.John
  • 搜索这篇博客,Baidu的第一项就是原始文章,但是在google的首页都没有看到。
    不过对比首页的搜索结果,明显google的结果相关性更高; Baidu就只有第一项是原始文章,其他的都是一些在我看来毫不相关的结果...
  • 2008-8-29 22:08:03
  • 19.7334n
  • http://www.7334n.cn/
  • 谢谢月光的分享,下面是我个人的一点看法

    1、spider系统对重要的网站,重要的索引页在资源的分配上是有所倾斜的,调度算法总要优先考虑好的站点。

    2、如果check一个博客的索引页的时候,总是很难发现新的url,那么调度算法后续降低对该站点check的频度也是有必要的,所以blog自身更新较少,搜索引擎对该站点的更新周期自然会变长。

    3、再一个就是时效性,blog搜索对时效性的要求,毕竟不比news,而且blog搜索,社区搜索现在是否值得搜索引擎公司花大力气去投入还是个问题。

    4、zhidao,kongjian,baike在baidu的结果中rank要比较高,这个也非常容易理解,呵呵。其实zhidao和baike的质量应该也是比较高的。

    5、所有搜索引擎对新站的态度都是非常谨慎的,刚出现的一个站点凭什么得到se的青睐呢?当然,有时候新站可能是由于另外一个站点更改了域名,比如凤凰网从phoenixtv更改为ifeng,对se来说,也算是一个新站,不过现在的搜索引擎在更新方面应该都能解决域名更新的问题。
  • 2008-8-29 22:09:13
  • 27.Wang
  • http://cn.programmingnote.com
  • 我刚开的英文Blog经常是写完十多分钟就被Google收录了。

    另外,纠正一个错别字:
    当新网站在搜索引擎有了一个不错的表现,并且有了较多的反向链接,会出现一个阀值


    应该是阈(yu,四声)而不是阀(fa),貌似很多人注意不到这一点
  • 2008-8-30 2:22:04
  • 30.鬼火
  • http://www.birdpig.com
  • 百度的搜索要做的差不少了。
    google搜录博客超快,并且不要忘记google的博客搜索引擎,现在也很多人在用的,只要ping了,两三分钟后就能看得到。
  • 2008-8-30 8:31:09
  • 32.Ro
  • 我刚刚用百度、谷歌、雅虎搜索“百度收录网站的特点分析”第一名都是你的博客文章链接;
    看来你说百度要半个月收录并不准确;
    但用搜狐搜狗倒是没有搜索到结果。
  • 2008-8-30 8:41:21
  • 33.toms
  • http://fsgame.org
  • 确实是 yu值,两个字的写法太相似了,但是我觉得阀值更形象。

    baidu的搜索结果相关性太低了,一堆垃圾。还是google的要好些。

    小站的收录情况2家基本持平
  • 2008-8-30 8:44:13
  • 46.chxwei
  • 总结的很好.
    搜索“百度收录网站的特点分析”,百度和Google均在第一。
    怀疑百度给你人工设置了
  • 2008-8-30 18:49:15
  • 51.microhl
  • 不知啥原因,我的GOOGLE从奥运开墓以来就搜不到无响应了,是不是又是奥运的缘故被封杀了啊?
  • 2008-8-30 22:41:44
  • 53.microhl
  • 就看不惯动不动就搞封杀×××的那一套臭伎俩,有本事你100度超过人家啊!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
  • 2008-8-30 22:45:31
  • 54.microhl
  • 很难相信在现在也是全球高速信息化的一个地球村的时代了,还有的GUOJIA企业动不动就搞封杀,这简直就是野蛮的愚民政策,不自信的表现!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!1
  • 2008-8-30 22:49:12
  • 58.bluesliu
  • “百度收录网站的特点分析”,我也分别用百度和google搜索了这个词,结果和上面仁兄的不一样啊,果然是google在第一位,百度搜出三页但全部都是转载。个人认为这里面有技术因素,也有文化因素——国人对版权、原创的尊重还是不够,这恐怕也是国内的现实情况使然,权且认为“存在即合理”吧。
  • 2008-8-31 6:25:47
  • 59.bluesliu
  • http://www.pkphoto.cn
  • ◇ 32.Ro

    我刚刚用百度、谷歌、雅虎搜索“百度收录网站的特点分析”第一名都是你的博客文章链接;
    看来你说百度要半个月收录并不准确;
    但用搜狐搜狗倒是没有搜索到结果。
    46.chxwei

    总结的很好.
    搜索“百度收录网站的特点分析”,百度和Google均在第一。
    怀疑百度给你人工设置了

    上面这两位朋友,个人考虑可能是没有理解收录原文源站的含义。搜出来的文章地址是http://www.williamlong.info/archives/1479.html才能算是收录了原文源站。



  • 2008-8-31 6:38:37
  • 63.风到月来
  • http://www.lovezengyi.cn
  • 百度对新网站的收录也是比较快的!站内都是一些转载文章或则更新频率貌似“垃圾”站,通常会在半个月左右被K,然后看运气是否会被收录了,现在我体会百度对垃圾站的控制还是比较强。
    而Google K站的机会就很少!

    不过百度对自己站百度知道什么的都靠前,很郁闷!
  • 2008-8-31 12:06:56
  • 80.gerdy
  • 哎.我反正是发现一个问题,来这里的大多是谷歌的fans..
    再说了,你们说的大多是自己的个人博客的收录情况.但是搜索的可不仅仅是博客..像搜索这种东西,好用或者说推广做的好,当然就用的人多..我还记得,以前搜狗出过一个匿名的搜索结果的对比,貌似google也不是最优的..不过,后来,搜狗优化的不行了,就撤掉这个了..

    再说了,百度的用户多,自然有他的道理,至少百度推广做的不错...

    一般的说,用google的人都会觉得自己高人一等,就如用火狐的一般,我承认,google和火狐都很好用,但是,中国电脑初级用户还是很多..这些人中,上网就只是找想要的资料,一般的资料在搜索上是可以找到的,就算有GFW,当然你是闲的没事干,硬要找些××什么的,来证明google更自由.
    什么?你要找英文资料?都这么高水平,还不用ziyou门?wujie什么的..精英嘛.当然得常备了..
    PS:关于1989的那些内容其实在GFW下还是能搜的,只是没那么容易搜而已.

    说的正题:百度知道及其他附属品是百度的一大优势,这个可以有效的让搜索量变成流量,而且,百度知道也是非常有用的东西,一般的答案都可以在那里找到,当然,精英们可以无视..

    还有,林大了,自然什么鸟都有,竞争在哪都有的..为了几块钱杀人的都有,还有什么奇怪的...

    废话了这么多,其实我也感觉奇怪,也很担心,ZF对舆论用堵而不是疏导的政策:特别是地方ZF为了经济而用的那些政策...网络上越来越严重的反DANG情绪

    看了好几篇文章,就随便打了这么多字,如果看的很乱,请无视..
  • 2008-9-1 15:46:21
  • 85.pumadong
  • http://www.5xyz.cn
  • 如果内容中,一个标题被重复出现,比如,德语学习第一集是一篇,德语学习第二集也是一篇文章,如果是小站,往往被百度认为是关键字重叠作弊而给K掉。 我的就是。。
  • 2008-9-3 14:29:29
  • 96.狂人中国
  • http://www.krenchina.cn
  • 部分内容跟我的新站基本一致
    我的博客在向Google提交不到一周就被收录了,百度却没有动作大概一个月左右,百度突然收录了21个页面
    百度确实比较关注自己的产品,我的百度空间转载的文章收录速度非常快,有的还排到了首页甚至有时候超过了原文作者的博客排名
  • 2008-9-14 16:13:52
  • 100.汇视航拍公司航拍服务
  • http://www.hangpaiwang.com
  • 作者写的很有道理,根据我的网站,我也是这样的感觉。

    汇视摄影航拍公司提供航拍服务(企业厂房航拍、房产楼盘航拍、
    经济开发区航拍、风景区、大型户外活动等项目航拍服务)
    公司网址:http://www.hangpaiwang.com 更多图片请登陆查看,谢谢!!!
  • 2008-9-20 6:53:22
  • 132.流泪的鱼
  • http://www.lsptc.com
  • 月光博客写的非常合理,让我学习了不少!我也是第一次看你的博客。

    百度确实很差劲,我的新网站在google搜录了近200个页面了,而baidu为什么就只有3个页面呢?真是搞不懂,不知道有没有哪个高手帮我指点一下呀!
  • 2008-10-20 8:56:40

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

订阅博客

  • 订阅我的博客:订阅我的博客
  • 通过Google订阅本站
  • 通过鲜果订阅本站
  • 通过电子邮件订阅本站

站内搜索

热文排行

最新评论及回复

最近发表

本站采用创作共用版权协议, 要求署名、非商业用途和保持一致. 转载本站内容必须也遵循“署名-非商业用途-保持一致”的创作共用协议.

This site is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 2.5 License.