一个新站建立之后两周的经历

来源:DevMSN 时间:2008-06-30 13:11 字体:[ ] 收藏 我要投稿

  首先介绍下正在做的这个叫XiKc的新闻网站,网址是http://www.xikc.com。网址没有任何意义,只是一年前偶然申请的一个域名,原因只是因为它比较短,只有四个字母。

  网站也是试验性质的,主要想试试两个想法,一是如何让网站能够自动的快速更新大量内容,因为Google对于网站的更新速度很敏感,更新快的网站能够获得更好的排名。另一个想法是我一直想做一个跟地域相关的新闻网站,因为不同的地点发生的事情,对于不同地点的人有不同的影响。打个比方,你住的小区如果新开了一家小超市,这件事对这个小区的人来说可能非常重要,而对于其他任何人来讲,这个小新闻都是毫无意义的,所以新闻的搜索,应该对于不同地点发生的新闻,对于不同的用户给予不同的权重。

  现在只有第一个想法实现了。我从网上收集了大约一万左右的RSS源,包括新闻,博客等等。然后写了个rss的解释器(网站中所有的程序都是用php写的),定时自动读取这些rss的内容,如果有更新,将更新保存在数据库当中。用这个方法,会发现文章的更新确实非常快,两周的时间,大约已经从这一万个rss之内读取了二十五万左右的新闻内容,当然显示的时候不但给出原文连接,还表明出处,我想这应该没有什么版权的问题了,毕竟你给出rss就是方便大家转载。这段程序调整是在这两周中断断续续的进行的。

  写代码的时候,遇到的最值得思考的一个问题是,相关新闻如何确定。当然,如果每篇文章都有tag那么只要按照tag来搜索,能得到比较好的结果,问题是大多数的文章都没有。我也想过将全文比对相似性的想法,google和百度也许可以这么做,不过对于一个微型的个人网站,显然这复杂的计算是不现实的,我把Dreamhost弄挂了,估计也算不明白,呵呵。所以只好用标题的相似程度。而中文的标题不是单词,无法想英文那样,先将标题分为单词,在过滤掉介词,量词之类的无用单词。而且如果随意选择标题中字段,进行比对,精确度也确实不高(不过现在只好用这个方法。)

  还有就是热门话题的排序。新闻排序其实还是比较简单的,因为你可以加大时间的权重,总让最新的新闻排在最前,现在我用的也是这个方法。可热门话题或热门Tag就应该需要复杂一些的算法。我写了个程序,跑一次要十多分钟,想想以后这个还是手工来吧,毕竟这个不需要每天大量的更新。

  再有一个有点特色的功能就是获取原文,主要的思路就是读取原文连接,然后根据description中的内容进行比对。现在的成功率大约80%,当然这是对于有description的文章,有些文章的description中直接写着“请点击阅读原文”,呵呵。

  现在来说说宣传吧。百度还没能搜索到,这个原因大家也应该清楚,百度有他的大约一个月的考察期,考察期没过,一页都没有的。google现在能搜到大约不到一千个连接。在搜索中敲 site:xikc.com 的结果。下面详述一下宣传的方法。

  

 

  1.刚建站的两天,在各大搜索引擎提交了网址,这是标准程序。

  2.之后在几个自助的友情链接网站上面加了个连接,觉得用处不大,所以就删了。

  3.因为是新闻站,所以会有很多好玩的内容,于是每天去digg提交几个页面,只要提交了google肯定会爬到。

  4.在google.com/webmaster上面提交sitemap,从以前的经验来看,这个是很重要的,尤其对于刚建的网站来说。

  5.在网站加了个Rewrite,将php?abc=sfdf&asf=233这种形式的网址,统统变成.html的。我们不能要求google支持我们,只能努力去支持google。

  友情链接现在还没有做,哪位看了这篇文章对XiKc.com感兴趣的都可以联系我 xikc.com#gmail.com。聊聊想法,经验,做友情链接什么都好,广告就算了,我没钱请人做SEO。

作者 DevMSN 的个人空间 本文仅代表作者观点,与站长网立场无关.
编辑热线:0516-85995555 Email:0051@vip.163.com 20秒注册会员 结交站长朋友 分享你的精彩
站长评论(0) 查看所有评论
评论加载中…
相关新闻

热门新闻

推荐新闻