适合PHP的搜索引擎你值得拥有(让搜索飞起来吧!)

前言

当网站数据库数据越来越大,达到百万甚至更高的时候,普通的关键字、多条件等搜索已经开始有些力不从心,这时候就非常需要一种方法能够让搜索的速度飞起来,因此就有了下面这些搜索引擎的诞生!

PhpDig

PhpDig是一个采用PHP开发的Web爬虫和搜索引擎,在国外非常流行的垂直搜索引擎产品,通过对动态和静态页面进行索引建立一个词汇表。当查询时,PHPDig将按一定的排序规则显示包含关键字的搜索结果页面。适用于专业化强、层次深的个性化搜索引擎。

官网:http://www.phpdig.net/

Sphider

Sphider是一个轻量级,采用PHP开发的web spider和搜索引擎,使用mysql来存储数据。可以利用它来为自己的网站添加搜索功能。Sphider非常小,易于安装和修改,已经有数千网站在使用它。特别提醒Sphider支持IIS。

官网:http://www.sphider.eu/

Sphinx

enter image description here

Sphinx是一个基于SQL的全文检索引擎,可以结合MySQL、PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索。

官网:http://sphinxsearch.com/

中文站:http://www.sphinxsearch.org/

案例分享:http://www.9958.pw/post/coreseek_sphinx

OpenWebSpider

OpenWebSpider是一个PHP开源多线程WebSpider(crawler:爬虫,robot:机器人)和包含许多有趣功能的搜索引擎。目前OpenWebSpider还提供MP3和PDF文件支持,以及增强编码支持等功能。

官网:http://www.openwebspider.org/

RiSearch PHP

RiSearch PHP是一个高效,功能强大的搜索引擎,特别适用于中小型网站。RiSearch PHP非常快,它能够在不到1秒钟内搜索5000-10000个页面。它能帮用户网站做索引并建立一个数据库来存储网站上所有页面的关键词以便快速搜索。RiSearch PHP目的是用于小网站(网页数量在5000-10000页)

官网:http://risearch.org/

ASPSeek

ASPSeek是一个C++编写的免费开源互联网搜索引擎,并使用了STL库。它主要包括一个检索机器人,一个搜索守护程序,和一个搜索前端(CGI或者是Apache模块)。搜索结果可以限定在给定的时间或站点,站点空间,并按照相关性或者时间进行排序。

官网:http://www.aspseek.org/

PS

实际应用中,采用Sphinx 和 Open Web Spider 作为二次开发的比较多一些