当前位置:首页 >  站长 >  搜索优化 >  正文

垂直搜索对信息更新的三个要求

 2007-05-11 18:40  来源: 搜索引擎研究院   我来投稿 撤稿纠错

  一键部署OpenClaw

垂直搜索对信息的更新有着特别的要求,根据这些特点可以从以下几点考虑:

1.信息源的稳定性(不能让信息源网站感觉到spider的压力)

2.抓取的成本问题

3.对用户体验改善程度。

根据以上几点制定一种比较好的策略,要做到恰到好处。

策略上可以评估网站/网页更新的系数、网站/网页的重要系数、用户点击系数(或曝光系数)、网站稳定系数……,根据这些系数来确定对这些网站/网页更新的频率。再由于新信息和更新了的信息list页面前面或者首页,所以对网页进行很好的分级可以以低成本很好的解决更新问题,系数比较低的网页一月update一次,稍微高点的一周update一次、中等的几天到一天一次、高的几小时到几分钟一次。类似搜索引擎的大库、周库、日库,小时库……

基于视觉网页块分析技术,模拟IE浏览器的显示方式,对网页进行解析。

根据人类视觉原理,把网页解析处理的结果,进行分块,再根据需要,对这些块进行处理,如:采集定向、介绍抽取和一些必要的内容的抽取正文抽取……

结构化信息抽取技术,将网页中的非结构化数据按照一定的需求抽取成结构化数据。

有两种方式,简单的就是模板方式,另外就是对网页不依赖web结构化信息抽取方式,这两种方式可以互取长处,以最简单最有效的办法满足需求。垂直搜索引擎和通用搜索引擎最大的区别就是对网页信息结构化抽取后再结构化数据进行深度的处理,提供专业的搜索服务。所以web结构化信息抽取的技术水平是决定垂直搜索引擎质量的重要技术指标。其实web结构化信息抽取在百度、google早已经广泛应用了,如:MP3、图片搜索、google的本地搜索就是从网页库抽取出企业信息,添加到其地图搜索中的,google通过这种技术正在颠覆做内容的方式。同样的技术应用还在qihoo、sogou购物、shopping等各种应用中体现。

简单的语法分析,简单的语法分析在搜索引擎中非常重要,可以通过简单的语法分析来改善数据的质量,低成本的获得某类信息,改善排序,寻找需要的内容……

信息处理技术,信息处理包括的范围比较广

主要包括去重、聚类、分析……,这根据需要相关的技术就非常多。

数据挖掘,找出您的信息的关联性对于垂直搜索来说非常重要,有效,可以在这些相关性上为用户提供更细致的服务。

分词技术,面向搜索的分词技术,建立和您的行业相关的词库。

注意这是面向搜索的分词,不是面向识别和准确的分词。就这个工作安排十几个人不停的维护也不会嫌多。

索引技术,索引技术对于垂直搜索非常关键,一个网页库级的搜索引擎必须要支持分布索引、分层建库、分布检索、灵活的更新、灵活的权值调整、灵活的索引和灵活的升级扩展、高可靠性稳定性冗余性。还需要支持各种技术的扩展,如偏移量计算等。

其它技术,略。

垂直搜索引擎的技术评估应从以下几点来判断

1. 全面性

2. 更新性

3. 准确性

4. 功能性

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关文章

  • SEO延伸:新兴的垂直搜索优化

    搜索已经远远超出了传统结果页面。搜索引擎领域SEO要素周期表的新增内容是对搜索领域内新兴行业的关注。语音,图像,本地和视频搜索产品为用户提供了以他们喜欢的方式查找信息的选项。

  • A5好站推荐:Yi2素材搜索 精准的垂直搜索网站

    网站名称:Yi2素材搜索网站地址:http://www.yi2.net上线时间:2004-11网站介绍Yi2素材搜索,针对全网素材图片推出搜索服务,在此前拥有多年搜集、整理素材图片的运营经验之后,网站于上个月决定转型做素材搜索,并进行了全面的改版,目前快照量仍很小,却是素材搜索行业的新星。网站特色与

  • 中国搜索悄然上线:垂直搜索演变成导购网站

    目前开发的有地方、国际、体育、房产、汽车、购物等。比方说进入购物频道,然后就可以看到一个类似淘宝客的导购网站,选择产品后,付款的时候会跳转到1号店、京东商城等电商网站,但笔者唯独没有发现跳转到淘宝网的。估计是中国搜索没有和淘宝网合作,当然这是笔者猜测的。

    标签:
    垂直搜索
  • 从“法斗士”看垂直搜索引擎

    从法斗士看垂直搜索引擎遇到法律问题,很多人的第一反应都是找律师。在现有的搜索引擎中搜一下,律师信息确实不少,也有很多网站在做律师黄页。乍看上去信息似乎很充足,但如果你真的曾经试图通过网络寻找律师或法律服务,那么你就会知道这些信息大多徒有虚表。这是法

    标签:
    垂直搜索
  • 360搜索瞄准垂直搜索 走细分市场成生存之道

    360从2012年推出搜索之后,一度以打破百度垄断的旗号,让很多用户揭竿而起,在极短的时间里其市场占有率竟然达到了近20%,这让百度感到了一丝压力,但是百度以搜索为核心的企业,虽然和谷歌相比,技术能力相对较差,但是和国内的搜索企业相比,百度的优势就变得非常明

    标签:
    垂直搜索

热门排行

信息推荐