分布式hbase集群搭建(序)

单机上的nutch,hbase,solr基本搭建完毕。可以去爬取一个网站,存到hbase,然后通过solr索引,并可通过solr来查询。 不过现在的查询页面还是solr自带的那个admin页面。如果要开发一个好看一点的页面估计要写一些java代码,用到tomcat或者weblogic。

接下来,需要做的是将这个hbase配置到多台机器上,利用多台机器来爬取数据,并将数据添加到hbase,同时用另外几台机器索引hbase中的数据。
于是变成几台机器写hbase,另外一台或者多台机器读取hbase的结构。

要达到这样的配置,官方文档在这里。 其中需要HDFS(Hadoop FileSystem 分布式文件系统)的支持。HDFS安装好以后,需要zookeeper来同步集群中的机器配置。当然还需要在每台机器上安装hbase。



本文地址: http://www.bagualu.net/wordpress/archives/4182 转载请注明




发表评论

电子邮件地址不会被公开。 必填项已用*标注