当前位置:首页 >  站长 >  搜索优化 >  正文

HITS——基于页面属性的链接算法

 2013-06-25 13:05  来源: 上海SEO博客   我来投稿   Rude的个人主页 撤稿纠错

  短视频,自媒体,达人种草一站服务

看过这篇文章后,你或许可以明白以下两件事儿:

1、一个单页面网站,为啥页面上都是出链,被指向的链接也很少,但是却有很好的排名;

2、网站页面上是不是没有出链(指向外部的)才是最好的?

看完上述,有兴趣没?好吧,不管你有木有兴趣,哥要继续了。

在一些电视剧上,或许大家会经常看到这样的场景,男猪脚A为了了解或者认识某个人,某件事儿,往往会去当地的旅馆饭店向店小二打听、或者直接找到当地的地头蛇去了解情况。

无它,只是因为他们就像是一个当地各种事情各种人的活向导、活地图,他们可能对这些事情的始末了解的不够详尽,但是必然知道和这件事儿有牵连的人或者物。

所谓调查事情的始末,一张关系+事件网而已。

这种事情放到搜索引擎算法上,理所应当的同样成立,只不过角色道具全部发生了转换:男猪脚A变成了广大的搜索引擎用户,关系与事件网变成了链接组成的各种关系,而店小二与地头蛇变成了我们今天看到的各种让人倍感疑惑的站点。

将这些联系起来的,就是HITS算法。

先来看看百度百科的解释。

HITS算法:一个网页重要性的分析的算法,根据一个网页的入度(指向此网页的超链接)和出度(从此网页指向别的网页)来衡量网页的重要性。其最直观的意义是如果一个网页的重要性很高,则他所指向的网页的重要性也高。一个重要的网页被另一个网页所指,则表明指向它的网页重要性也会高。指向别的网页定义为Hub值,被指向定义为Authority值。

网页中的链接

 

如果你木有看懂,木得关系,哥来继续给你说一下。 对于任何一个页面来说,其本身必然有两种属性:目录属性(还有人喜欢叫做枢纽)+权威属性。

目录属性即他本身会有出链,也会更像一个导航,告诉读者想看到关于某件事儿更详细的信息可以点链接出去查看;权威属性即每个页面都是基于某个主题所阐述的,这个页面也必然会有基于该主题的权威值,大小而已。

页面属性

 

了解了这个,开始继续看下它是怎么运用到搜索引擎算法中去的。

在前面介绍搜索引擎原理的文章(www.seosos.cn/seo-tips/search-engine-principle.html)中,我们介绍过搜索引擎是怎么处理页面并返回结果的,HITS算法正是在此基础之上开展起来的。下面来看详细的步骤。

1、查找根集合

将查询q提交给基于关键字查询的检索系统,从返回结果页面的集合中取前n个网页(如n=200),作为根集合(root set),记为S,则S满足:

1.1、S中的网页数量较少;

1.2、S中的网页是与查询q相关的网页;

1.3、S中的网页包含较多的权威(Authority)网页。

2、拓展相关页面

有了一些牛逼的权威页面,开始拓展相关页面。

其维度也只有两种:指向权威页面的和权威页面指向的。

要明白为什么这么拓展页面,需要先理解一句话: 一个权威页被多个目录页指向,说明这个权威页很权威;一个目录页指向了多个权威页,说明这个目录页很目录。

先解释一下:哥不是纯心跟您玩绕口令,自己先理解一下。

3、计算页面的权威值和目录值

有了一个相关的子集,也理解了上述的意思,开始计算各个页面的目录值和权威值。 计算公式很简单: 先来给个初始子集的集合P={p1,p2,p3…pn},然后根据这些页面之间的链接关系建立起一个矩阵:

链接矩阵

 

如果页面1有链接指向页面2,则a12的值即为1,反之,则为0。

a页面的权威值即为指向它的所有目录页面的目录值之和;

a页面的目录值则为它指向的所有权威页面的权威值之和。

4、返回结果

按照页面的目录值和权威值返回结果。

好了,聪明的同志应该也可以看到,这个算法是基于某一主题的,可以很好的反应出了人际关系中的一些特点,也能很好的反应出了互联网关系的一些特点。

它也会有一些比较恶心的不足之处,比如耗时(在返回结果之后再计算,会增加用户等待的时间),会发生主题漂移(不考虑内容,只考虑链接会造成本来在说A事情,可能结果变成了有一部分在说B事情)等等。

当然,从中我们可以看到一个事实,那就是其实搜索引擎的算法并木有传说中的那么神秘,很多也是基于人际关系为原型计算出来的(前面的PR算法(www.seosos.cn/search-engine/pr.html)也一样),因为毕竟,搜索引擎算法工程师也是人,相比较来说,他们的优势在于怎么通过一系列的算法将这一原理变成机器可以读懂的现实。

本文首发于【SEO科学之美】

转载请注明链接地址:

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

作者: Rude    /    文章:15篇

相关文章

  • 猴子数据短链接批量生成,实现长链接转短链接

    长链接怎么转换成短链接?通常利用微信公众号接口实现长链接转短链接,但是最近接到微信公众号关于长链接转短链接的接口域名上限调整的通知,调整如下:“长链接转短链接的接口”

    标签:
    链接
    API
  • SEO中常见的五种链接

    死链是每个站长在优化网站中都会遇到的问题,网站中存在大量的死链对搜索引擎来说是不友好的,把蜘蛛绕进一个死胡同,会影响网站的质量度。从用户的角度来讲,打开链接是个不存在的错误页面(返回状态码为404的页面),基本上都会关掉。

    标签:
    链接
    seo优化
  • 良好的链接与坏的链接对网站排名的影响

    任何了解SEO的人都知道反向链接–一个站点链接回另一个站点–对于您的搜索排名很重要。你拥有的反向链接越多越好–一般而言。但是有很好的链接,并且有你不想要的坏链接。百度认为某些反向链接对您网站的健康状况毫无价值甚至有毒。

    标签:
    网站排名
    链接
  • “算法即芯片”大势所趋,依图们开启黄金十年

    5月9日,AI独角兽依图科技发布了一款云端深度学习推理定制化SoC芯片——依图questcore™。据悉这款芯片由依图和ThinkForce联合研发,基于依图的世界级算法,目的是服务于计算机视觉领域的分析任务,在同等功耗下,能提供市面现有同类主流产品2到5倍的视觉分析性能。

    标签:
    算法
    智能芯片
  • 拿下联合利华和冈本,观远数据要让算法“说话”

    当很多企业还在纠结是否数字化、下多大力气数字化时,已经有先行者将看似纸上谈兵的理论落地,开始建造属于自己的数据大脑。

    标签:
    算法
  • 谷歌SEO推广团队,这样管理更高效

    如今不论是外贸企业还是专业的海外推广公司都会组建自己的GoogleSEO推广团队,可以更有效的做好网站SEO,但是要发挥谷歌SEO推广团队的最大效能,我们并不能随意的让团队成员听之任之,随波逐流,我们需要有一套标准化的管理制度,来管理谷歌SEO推广团队。

    标签:
    google优化排名
  • 原创内容一定是优质内容吗

    优质内容,也叫“有效内容产出”,有效内容一定是用户有所需求,也就是说你所生产的内容一定是用户搜索过并可以产生有效流量的,所谓的题文相符,也就是说内容主体和标题形成强相关性。

    标签:
    内容创业
  • 白皮书解读搜索引擎的工作原理建库

    百度蜘蛛抓取建库是个极其复杂的系统工程,光是抓取系统就分为链接存储系统、链接选取系统、DNS解析服务系统、抓取调度系统、网页分析系统、链接提取系统、链接分析系统、网页存储系统。

    标签:
    seo优化
  • 从0到权3网站流量的增长方案要怎么做

    执行、实施阶段性任务、计划需要保持一个平常心,还有现在养站没那么简单了,大有一种无论是优质老域名还是新域名待遇都是一样的节奏,且考察期也相对漫长了一些,但只要花心思了,用心了搜索引擎是能看得到的。

  • SEO如何优化好网站?SEO有哪些优化网站的方法?

    现在,越来越多的个人和企业开始重视互联网创业,想要经营好自己的线上生意,获得更多的用户和订单,就需要学会系统化的获取流量的方法。但是,很多的新手站长抱怨,他们花了很多的时间去做网站,内容也全部自己整理或写作,版面也很漂亮,可为什么就优化不上去,也没有排名呢?

  • HTTP401错误与HTTP403错误的详细区别

    401(未经授权)的最新RFC标准是RFC7235:401(未经授权)状态码表示该请求尚未应用,因为它缺少针对目标资源的有效身份验证凭据...用户代理可以使用新的或替换的Authorization标头字段重复该请求。

    标签:
    错误页面
  • 这6个方法教你做好SEO优化建站

    网站对于企业的重要性不言而喻,若是没有网站,企业的互联网宣传、客户沟通、引流拉新可能都成问题。不过,只有网站是不够的,你还需要做好seo优化建站,让网站有个好的排名。那么公司建站该如何做好SEO呢

  • SEO软文写作技巧分享

    什么是SEO?了解过的人,应该都会知道:SEO是搜索引擎优化的简称,在早期,SEO一般都只是指对网站内容按照一定的标准规范进行优化,以此获得搜索引擎的排名。然而现在随着SEO的概念越来越大,慢慢的,不仅仅只是网站,只是跟做搜索引擎关键词排名,都称之为SEO。

    标签:
    seo优化技术
  • 谷歌搜索建议网页图表信息使用图片少用HTML

    谷歌搜索负责人约翰·穆勒还提示,在使用图片传达图表信息时,要注意图像大小,避免图像过大影响网站加载速度,而且尽量能不用图表显示展示就不用,因为图表在Google图片搜索排名中的表现不是特别好,一般很少有用户使用GoogleImages查找特定的图表,所以站长尽量少用图表来进行图片优化排名!

    标签:
    谷歌搜索
  • 效果翻倍:中企动力外贸SEO正式上线

    但是对于外贸网站来说,想要有询盘就要有流量,想要有流量要么花钱做竞价要么就是专心做网站SEO。在外贸圈来说,网站必须需要符合Google排名规律,才有可能在外贸数字营销时代大展身手。

热门排行

信息推荐

扫一扫关注最新创业资讯