当前位置:首页 >  站长 >  搜索优化 >  正文

搜索引擎会不会抓取带#号(哈希值)的URL

 2013-06-14 01:10  来源:嗖录网  我来投稿

  月薪5千到5万 这些项目才是你的未来

 

  在我的网站各个地址中,难免出现一些带#的URL,一般是通过点击某个链接,跳转到网页的某个位置,实现信息内容的快速定位。本站使用的文章内目录就是这样做的。但是,这种带#的URL搜索引擎会被收录吗?

  1、什么是哈希值?

  在阮一峰的博客中有一篇文章可以很好的解释哈希值,#值不是http请求,而是一个浏览器动作。通过#,可以快速定位到网页中的某个具体位置。例如http://www.souluseo.com/post/122.html#comment-121,就会快速定位到id="comment-121"或这个位置。

  2、搜索引擎会不会抓取带#号(哈希值)的URL

  答案是一般不会。搜索引擎抓取页面首先要遵循http协议,可是#不是协议内的内容。而实际上也是这样,我们没有见过搜索引擎的搜索结果中,哪一条记录可以快速定位到网页内的某个位置的。因此,希望通过在网站内外添加带#的锚链接来让搜索引擎第一次访问时快速定位是不现实的。当然,搜索引擎蜘蛛为了模拟真实用户,在进入网站之后,会通过一些技术实现模拟鼠标点击的效果,这个时候,页面的锚链接还是起作用,但任何链接在搜索结果中时,都不会带#。

  3、URL 中的 #! 有什么作用?

  这是一个违反2中的特例,谷歌会抓取带有#!的URL。Google规定,如果你希望Ajax生成的内容被浏览引擎读取,那么URL中可以使用"#!"(这种URL在一般页面一般不会产生定位效果),Google会自动将其后面的内容转成查询字符串_escaped_fragment_的值。例如/#!/username等效于/?_escaped_fragment_=/username,而带?的URL是会被抓取的,所以#!的URL会被谷歌收录。

  4、搜索引擎会不会抓取带#号(哈希值)的URL给我们的启示

  一、不要试图用robots.txt屏蔽#的网址。我之前翻过一个错误,即在嗖录网的robots.txt中加入了disallow:/*#*规则,以试图屏蔽这些带#的URL被抓取。但实际上,这个做法是错误的,首先#在robots.txt是注释符号,它后面的内容会被注释掉,所以这条规则变成了disallow:/*,即阻止收录本站所有页面,幸好我在今早发现,并马上进行了修改。其次,搜索引擎不会抓取带#的URL,因此没有必要加一条这样的规则。

  二、可以利用#和ajax结合来隐藏不想被抓取的内容。在我们的一些网页中,可能有些内容是我们不想直接告诉搜索引擎的,或者一些隐私不希望被抓取,因此我们可以采用#来控制这些信息的显示。例如我们增加一个按钮,当URL中带#show-info-123时,显示123的个人信息,而不带时不显示。而对于搜索引擎来说,会自动忽略带#的URL,因此123的个人信息不会被抓取。

  文章来自:嗖录网;原文地址:http://www.souluseo.com/search-engine-dont-catch-hash-url/ 欢迎大家来嗖录网交流SEO经验与技术。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

责任编辑:小敬   /   作者:frustigor

相关文章

  • 百度SEO:最新搜索引擎排名因素有哪些?

    搜索引擎排名规则,一直以来都是一个争论的焦点,随着百度算法的不断调整,实际上它是一个动态因素,自从熊掌号上线以来,可谓搜索排序大洗牌,毫无疑问内容是基石,它几乎更古不变,而链接的作用,名义上在不断降低,实际上还需要一分二的看。

  • 关于关键词优化干货分享

    优化关键词排名有哪些非常重要的因素呢?今天,小小课堂SEO自学网带来的是《关键词优化干货分享》。希望本次的SEO秘籍对大家有所帮助。TF-IDF,简单来讲就是页面的关键词密度或频率达到一定,同时尽量寻找一些优化难度小的关键词(在商业价值较低的情况下,搜索引擎查询关键词后出现的相关结果数少,通常为较容

  • 网站关键词如何分析?

    关键词分析在SEO工作中是一个很重要的部分,通过对关键词进行分析,我们可以了解用户的需求,了解用户的搜索习惯,同时可以知道哪些词可以做,哪些不能做。关键词分析一般分为关键词用户需求分析、关键词竞争度分析、关键词趋势分析和关键词转换率分析。

  • 新站上线后如何进行推广

    当新站上线后,一方面要维护好站内的优化,包括站内内容的产出以及内链的调整,另一方面要进行站外的推广,毕竟新站刚上线,除了自己和搜索引擎知道,几乎没有没有其他人知道,更别说我们网站的受众了。

  • SEO经验分享:10个月达到百度权重4

    10个月权重4在很多人看来可能比较慢,但是对于一个SEO博客而言,在不乱做虚假指数词的前提下,百度PC和移动端在站长均达到权4也实属不易了。

  • 新网站SEO: 如何理性的看待收录问题!

    对于一个新网站建立,最让SEO人员头痛的问题,无外乎是收录问题,针对不同网站的类型与站点质量,实际上,它并没有一个标准答案。那么,新网站SEO,如何理性的看待收录问题?

榜单

热门排行

信息推荐

扫一扫关注最新创业资讯