阿帕奇Nutch的是建立在頂部的的Apache Lucene的,一個強大的Java搜索引擎。Nutch的開發人員修改了Lucene的代碼庫,轉換數據無關的代碼庫的Lucene成專門用於搜索網絡上的數據專門項目。這種技術可以用於搜索自己的Web頁面作為一個內置的搜索服務器,或爬行網頁尋找數據解析和刮除到數據庫。Nutch的可以在一台機器上運行,但效果更好的的Hadoop 集群。各種插件可用於擴大其使用範圍 什麼是此版本中的新: ...

Apache Blur

Apache Blur 0.2.3

阿帕奇模糊被設計為大的基於文本的搜索查詢,針對高容量目標數據。模糊的設計採用的Hadoop 工作,並能實現類似谷歌的索引和查詢速度。與模糊使用的其他Apache的技術是 Lucene的 節儉和動物園管理員 特點: 在亞秒級的響應時間在數據庫般的查詢功能在處理數百個並發查詢在調節以適應你的數據的大小在倖存的多節點故障W / O型的數據丟失 什麼在此版本中是新的: 在支持GIS數據類型在創建的索引快照。在增加存儲的字段類型。在添加有啟動腳本等安全模式退出的能力。在創建請求和響應日誌文件。 ...

Apache Solr

Apache Solr 5.3.1 / 4.10.4 / 3.6.2 更新

Apache Solr is one of the most wide-spread open search technologies around. Built on top of the very successful and appreciated Lucene engine, Solr can be used to search various types of data in various types of environments and platforms. With full-text...