第一个可以工作的搜索引擎

总算是搭起来一个可以工作的搜索引擎了,这是基于nutch的搜索引擎,搭在hadoop上,利用到了solr和hbase。 这些工具意味着这个搜索引擎可以无限制的横向扩展,可以通过添加机器到集群来容纳海量的数据。

目前这个搜索引擎只是收录了我的博客上的内容,通过技术博客搜索菜单,可以进入。搜索的结果对关键字进行了高亮处理,达到了想要的效果。

记录一下这个高亮(highlight)效果的实现:
在solr中天然带有高亮的参数,下面是一个使用的实例:

curl “http://localhost:8983/solr/collection1/select?q=perl&hl.fl=title,content&wt=php&indent=true&hl=true&fl=url,title”

其中的hl=true , 即为打开highlight ,
hl.fl 指定要高亮的域。
另外有


hl.simple.pre=<em>

hl.simple.post=</em>


可以指定高亮的标签。
这个使用起来甚是方便。



本文地址: http://www.bagualu.net/wordpress/archives/4379 转载请注明




“第一个可以工作的搜索引擎”的一个回复

发表评论

电子邮件地址不会被公开。 必填项已用*标注