当前位置:首页 >  站长 >  搜索优化 >  正文

详解垂直搜索引擎

 2008-05-13 15:25  来源: www.czz5.com   我来投稿 撤稿纠错

  一键部署OpenClaw

垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。

垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,好比网页搜索是以网页为最小单位,基于视觉的网页块分析是以网页块为最小单位,而垂直搜索是以结构化数据为最小单位。然后将这些数据存储到数据库,进行进一步的加工处理,如:去重、分类等,最后分词、索引再以搜索的方式满足用户的需求。

整个过程中,数据由非结构化数据抽取成结构化数据,经过深度加工处理后以非结构化的方式和结构化的方式返回给用户。垂直搜索引擎的应用方向很多,比如企业库搜索、供求信息搜索引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索……几乎各行各业各类信息都可以进一步细化成各类的垂直搜索引擎。

举个例子来说明会更容易理解,比如购物搜索引擎,整体流程大致如下:抓取网页后,对网页商品信息进行抽取,抽取出商品名称、价格、简介……甚至可以进一步将笔记本简介细分成“品牌、型号、CPU、内存、硬盘、显示屏、……”然后对信息进行清洗、去重、分类、分析比较、数据挖掘,最后通过分词索引提供用户搜索、通过分析挖掘提供市场行情报告。 垂直搜索引擎大体上需要以下技术

1.Spider

2.网页结构化信息抽取技术或元数据采集技术

3.分词、索引

4.其他信息处理技术

垂直搜索引擎的技术评估应从以下几点来判断

1.全面性 2.更新性 3.准确性 4.功能性 垂直搜索的进入门槛很低,但是竞争的门槛很高。没有专注的精神和精湛的技术是不行的。

行业门户网站具备行业优势但他们又是没有技术优势的,绝对不要想像着招几个人就可以搞定垂直搜索的全部技术,作为一个需要持续改进可运营的产品而不是一个项目来说对技术的把握控制程度又是垂直搜索成功的重要因素之一。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关文章

  • SEO延伸:新兴的垂直搜索优化

    搜索已经远远超出了传统结果页面。搜索引擎领域SEO要素周期表的新增内容是对搜索领域内新兴行业的关注。语音,图像,本地和视频搜索产品为用户提供了以他们喜欢的方式查找信息的选项。

  • A5好站推荐:Yi2素材搜索 精准的垂直搜索网站

    网站名称:Yi2素材搜索网站地址:http://www.yi2.net上线时间:2004-11网站介绍Yi2素材搜索,针对全网素材图片推出搜索服务,在此前拥有多年搜集、整理素材图片的运营经验之后,网站于上个月决定转型做素材搜索,并进行了全面的改版,目前快照量仍很小,却是素材搜索行业的新星。网站特色与

  • 中国搜索悄然上线:垂直搜索演变成导购网站

    目前开发的有地方、国际、体育、房产、汽车、购物等。比方说进入购物频道,然后就可以看到一个类似淘宝客的导购网站,选择产品后,付款的时候会跳转到1号店、京东商城等电商网站,但笔者唯独没有发现跳转到淘宝网的。估计是中国搜索没有和淘宝网合作,当然这是笔者猜测的。

    标签:
    垂直搜索
  • 从“法斗士”看垂直搜索引擎

    从法斗士看垂直搜索引擎遇到法律问题,很多人的第一反应都是找律师。在现有的搜索引擎中搜一下,律师信息确实不少,也有很多网站在做律师黄页。乍看上去信息似乎很充足,但如果你真的曾经试图通过网络寻找律师或法律服务,那么你就会知道这些信息大多徒有虚表。这是法

    标签:
    垂直搜索
  • 360搜索瞄准垂直搜索 走细分市场成生存之道

    360从2012年推出搜索之后,一度以打破百度垄断的旗号,让很多用户揭竿而起,在极短的时间里其市场占有率竟然达到了近20%,这让百度感到了一丝压力,但是百度以搜索为核心的企业,虽然和谷歌相比,技术能力相对较差,但是和国内的搜索企业相比,百度的优势就变得非常明

    标签:
    垂直搜索

热门排行

信息推荐