简单搜索引擎的开发

一直有个小想法,就是开发出一个很方便的搜索引擎,可以自定义,自己设计,完全自己组装,依照自己的搜索习惯,减少搜索语句的设计。听听就觉得有意思。

于是到网上找了教程进行学习。先把教程放这儿

dySE:一个 Java 搜索引擎的实现,第 1 部分

dySE:一个 Java 搜索引擎的实现,第 2 部分

dySE:一个 Java 搜索引擎的实现,第 3 部分

教程讲解的很详细。也是有源码下载的。

我也仿照他的代码,学习,并且自己敲了一个,代码中注释超多,其实也相当于学习笔记,大家可以参考,交流,我的项目上传到我的Github上了。大家可以下载,交流。

这个搜索引擎还很小,问题也有不少,比如网页编码不同造成的乱码现象,抓取网页时,无效url的筛选,网页的分词,网页排名,界面外观,等各类情况,只能目前只能算个用java写的小爬虫,但是接下来的阶段,会将他进行简要的完善,然后分阶段的将他的每个模块重新打磨,提高质量,我也会在之后,将每次重新打磨的模块的方法介绍。望以能成为一个有用的工具。

对了,还没有给他起名字,要不就叫他,Forest吧。哈哈哈