百度不仅收录了这么多页而且首页快照的时间竟然是当天,真是受宠若惊。
可是仔细一观察却发现不对劲。
google竟然连首页都没有收录,却收录了内页。
google和百度都错误的收录了.com里有,但.cn里却根本不存在的页面,百度的快照时间更是4月5月的都有。如:
google: www.epioo.cn/digg_tupian.shtml
baidu:
baidu:
baidu:
从上可以看出,这两大搜索引擎都有“想当然”的思维方式,认为同一服务器“仅域名后缀不同”,且模板和大量页面相似的两网站是同一网站。会把快照统一移植过去,而不管页面是否存在。其中百度表现最为明显。
