阿帕奇Nutch的是建立在頂部的的Apache Lucene的,一個強大的Java搜索引擎。Nutch的開發人員修改了Lucene的代碼庫,轉換數據無關的代碼庫的Lucene成專門用於搜索網絡上的數據專門項目。這種技術可以用於搜索自己的Web頁面作為一個內置的搜索服務器,或爬行網頁尋找數據解析和刮除到數據庫。Nutch的可以在一台機器上運行,但效果更好的的Hadoop 集群。各種插件可用於擴大其使用範圍 什麼是此版本中的新: ...

PHPCrawl

PHPCrawl 0.83

可以以書面的搜索爬蟲(蜘蛛),地雷網頁的各種信息進行使用。PHPCrawl收購它被配置來獲取信息,並通過它進行進一步處理,以更強大的應用 特點: 在過濾器URL和內容類型的數據定義的方式來處理cookie 定義的方式來處理的robots.txt文件在限制它的活動以各種方式在多處理模式 什麼在此版本中是新的: 在修正錯誤:現在,正確編碼在鏈接被部分進行了urlencoded和部分沒有得到重建/。從PHPCrawlerRobotsTxtParser.class.php...

pyelasticsearch

pyelasticsearch 1.4 更新

ElasticSearch是一個非常強大的,先進的分佈式REST風格的搜索引擎的網頁。 pyelasticsearch 提供非間斷API包裝的使用和與搜索引擎的核心從內部Python代碼進行交互。pyelasticsearch基本上是一個抽象層,與搜索引擎的接口,而無需對Java代碼添加到您的應用程序 是什麼在此版本中是新的: ...

jui_filter_rules

jui_filter_rules 1.0.7 更新

jui_filter_rules是基本建成與JavaScript的搜索功能。插件支持構建嵌套搜索和過濾基,其中自定義查詢可以建立和應用上的數據集。不同的過濾器類型和限制支持,以及,通過文字,數字或日期/時間數據很容易喝。該jui_filter_rules插件可以使用jQuery UI和引導都可以使用,也可以很容易地翻譯成其他語言 什麼是此版本的新: < P> ...

ack

ack 2.15_02 更新

ACK是用Perl編寫一個完全成熟的文本搜索引擎,但擠滿了功能,使其非常適合於搜索代碼庫。的工作方式類似於* NIX的grep的工具。 本發行版是新的: ACK現在忽略JavaScript和CSS源地圖。現在ACK船舶與bash和zsh的定制外殼完成腳本。 什麼是新的在2.15_01版本: ACK現在忽略JavaScript和CSS源地圖現在ACK船舶與bash和zsh的定制外殼完成腳本。 在什麼版本2.13_06都是新: 更修復的Windows測試 ...

Searchkick

Searchkick 1.0.3 更新

Searchkick 可幫助您實現一個更好的搜索系統,為您的Ruby應用程序。圖書館工作的 ElasticSearch 引擎之上並運行所有針對用戶搜索查詢,得到的結果,並將其提交給用戶。這是一個智能系統,從所有以前的查詢學習和提高搜索結果具有廣泛的從輸入的建議,自動完成,面搜索範圍的功能,和自然語言處理。越多的用戶利用網站上的搜索領域,更好的搜索結果變得 什麼是此版本的新: < p> 增加了1.4 ElasticSearch支持新增不可搜索選項新增選擇:true選項補充身體選項 ...